單線程與異步
Javascript是單線程運行、支持異步機制的語言。進入正題之前,我們有必要先理解這種運行方式。
以「起床上班」的過程為例,假設有以下幾個步驟:
- 起床(10min)
- 洗刷(10min)
- 換衣(5min)
- 叫車(10min)
- 上班(15min)
最簡單粗暴的執行方式就是按順序逐步執行,這樣從起床到上班共需50分鐘,效率較低。如果能在「洗刷」之前先「叫車」,就可以節省10分鐘的等車時間。
這樣一來「叫車」就成了異步操作。但為何只有「叫車」可以異步呢?因為車不需要自己開過來,所以自己處于空閑狀態,可以先干點別的。
把上面的過程寫成代碼:
function 起床() { console.info('起床'); }
function 洗刷() { console.info('洗刷'); }
function 換衣() { console.info('換衣'); }
function 上班() { console.info('上班'); }
function 叫車(cb) {
console.info('叫車');
setTimeout(function() {
cb('車來了');
}, 1000);
}
起床();
叫車(function() {
上班();
});
洗刷();
換衣();
因為「上班」要在「叫車」之后才能執行,所以要作為「叫車」的回調函數。然而,「叫車」需要10分鐘,「洗刷」也需要10分鐘,「洗刷」執行完后剛好車就到了,此時會不會先執行「上班」而不是「換衣」呢?Javascript是單線程的語言,它會先把當前的同步代碼執行完再去執行異步的回調。而異步的回調則是另一片同步代碼,在這片代碼執行完之前,其他的異步回調也不會被執行。所以「上班」不會先于「換衣」執行。
接下來考慮一種情況:手機沒電了,想叫車得先充電。很明顯,充電的過程也可以異步執行。整個過程應該是:
寫成代碼則是:
function 充電(cb) {
console.info('充電');
setTimeout(function() {
cb(0.1); // 0.1表示充了10%
}, 1000);
}
起床();
充電(function() {
叫車(function() {
上班();
});
});
洗刷();
換衣()
充電、叫車、上班是異步串行(按順序執行)的,所以要把后者作為前者的回調函數。可見,串行的異步操作越多,回調函數的嵌套就會越深,最終形成了回調金字塔(也叫回調地獄):
充電(function() {
叫車(function() {
其他事情1(function() {
其他事情2(function() {
其他事情3(function() {
上班();
});
});
});
});
});
這樣的代碼極難閱讀,也極難維護。此外,還有更復雜的問題:
- 除了異步串行,還有異步并行,甚至是串行、并行互相穿插。
- 異步代碼的異常無法通過try...catch捕獲,異常處理相當不方便。
可喜的是,隨著異步編程的發展,上面提及的這些問題越來越好解決了,下面就給大家介紹四種解決方案。
Async庫
Async是一個異步操作的工具庫,包含流程控制的功能。
「async.series」即為執行異步串行任務的方法。例如:
// 充電 -> 叫車
async.series([
function(next) {
充電(function(battery) {
next(null, battery);
});
},
function(next) {
叫車(function(msg) {
next(null, msg);
});
}
], function(err, results) {
if (err) {
console.error(err);
} else {
console.dir(results); // [0.1, '車來了']
上班();
}
});
「async.series」的第一個參數是要執行的步驟(數組),每一個步驟都是一個函數。這個函數有一個參數「next」,異步操作完成后必須調用「next」:
- 如果異步操作順利完成,則調用「next」時的第一個參數為null,第二個參數為執行結果;
- 如果出現異常,則調用「next」時的第一個參數為異常信息。
「async.series」的第二個參數則是這些步驟全部執行完成后的回調函數。其中:
- 第一個參數是異常信息,不為null時表示發生異常;
- 第二個參數是由執行結果匯總而成的數組,順序與步驟的順序相對應。
「async.waterfall」是另一個用得更多的異步串行方法,它與「async.series」的區別是:把上一步的結果傳給下一步,而不是匯總到最后的回調函數。例如:
// 充電 -> 叫車
async.waterfall([
function(next) {
充電(function(battery) {
next(null, battery);
});
},
// battery為上一步的next所傳的參數
function(battery, next) {
if (battery >= 0.1) {
叫車(function(msg) {
next(null, msg);
});
} else {
next(new Error('電量不足'));
}
}
], function(err, result) {
if (err) {
console.error(err);
} else {
console.log(result); // '車來了'
上班();
}
});
而執行異步并行任務的方法則是「async.parallel」,用法與「async.series」類似,這里就不再詳細說明了。
那串行、并行相互穿插又是怎樣的呢?
// 從起床到上班的整個過程
async.series([
function(next) {
起床();
next();
},
function(next) {
async.parallel([
function(next) {
async.waterfall([
function(next) {
充電(function(battery) {
next(null, battery);
});
},
function(battery, next) {
if (battery >= 0.1) {
叫車(function(msg) {
next(null, msg);
});
} else {
next(new Error('電量不足'));
}
}
], next);
},
function(next) {
洗刷();
換衣();
next();
}
], next);
}
], function(err, results) {
if (err) {
console.error(err);
} else {
上班();
}
});
可見,如果串行和并行互相多穿插幾次,還是會出現一定程度的回調金字塔現象。
Asycn庫的優點是符合Node.js的異步編程模式(回調函數的第一個參數是異常信息,Node.js原生的異步接口都這樣)。然而它的缺點也正是如此,回調函數中有一個異常信息參數,還占據了第一位,實在是太不方便了。
Promise
Promise是ES6標準的一部分,它提供了一種新的異步編程模式。但是ES6定稿比較晚,且舊的瀏覽器無法支持新的標準,因而有一些第三方的實現(比如Bluebird,不僅實現了Promise的標準,還進行了擴展)。順帶一提,Node.js 4.0+已經原生支持Promise。
那Promise究竟是什么玩意呢?Promise代表異步操作的最終結果,跟Promise交互的主要方式是通過它的「then」或者「catch」方法注冊回調函數去接收最終結果或者是不能完成的原因(異常)。
使用Promise首先要把異步操作Promise化:
function 充電Promisify() {
return new Promise(function(resolve) {
充電(function(battery) {
resolve(battery);
});
// 也可以簡寫為 充電(resolve)
});
}
function 叫車Promisify(battery) {
return new Promise(function(resolve, reject) {
if (battery >= 0.1) {
叫車(function(msg) {
resolve(msg);
});
// 也可以簡寫為 叫車(resolve)
} else {
reject(new Error('電量不足'));
}
});
}
具體來說,就是創建一個Promise對象,創建時需要傳入一個函數,這個函數有兩個參數「resolve」和「reject」。操作成功時調用「resolve」,出現異常時調用「reject」。而想要獲得異步操作的結果,正如前面所提到的,需要調用Promise對象的「then」方法:
叫車Promisify(0.1).then(function(result) {
console.log(result); // '車來了'
}, function(err) {
console.error(err);
});
叫車Promisify(0).then(function(result) {
console.log(result);
}, function(err) {
console.error(err.message); // '電量不足'
});
「then」方法有兩個參數:
- 第一個參數是操作成功(resolved)時的回調;
- 第二個參數是操作拒絕(rejected)時的回調。
要注意的是,創建Promise對象時傳入的函數只會執行一次,即使多次調用了「then」方法,該函數也不會重復執行。這樣一來,一個Promise實際上還緩存了異步操作的結果。
下面看一下基于Promise的異步串行是怎樣的:
// 充電 -> 叫車
充電Promisify().then(function(battery) {
return 叫車Promisify(battery);
}).then(function(result) {
console.log(result); // '車來了'
上班();
}).catch(function(err) {
console.error(err);
});
如果「then」的回調函數返回的是一個Promise對象,那么下一個「then」的回調函數就會在這個Promise對象完成之后再執行。所以多個步驟只需要通過「then」鏈式調用即可。此外,這段代碼的「then」只有一個參數,而異常則由「catch」方法統一處理。
接下來看一下異步并行,需要用到「Promise.all」這個方法:
// 充電、洗刷并行
Promise.all([
充電Promisify(),
new Promise(function(resolve) {
洗刷();
resolve();
})
]).then(function(results) {
console.dir(results); // [0.1, undefined]
}, function(err) {
console.error(err);
});
最后是串行和并行穿插:
// 從起床到上班的過程
new Promise(function(resolve) {
起床();
resolve();
}).then(function() {
return Promise.all([
充電Promisify().then(function(battery) {
return 叫車Promisify(battery);
}),
new Promise(function(resolve) {
洗刷();
換衣();
resolve();
})
]);
}).then(function(results) {
console.dir(results); // ['車來了', undefined]
上班();
}).catch(function(err) {
console.error(err);
});
可見,基于Promise的異步代碼比Async庫的要簡潔得多,通過「then」的鏈式調用可以很好地控制執行順序。但是由于現有的大部分異步接口都不是基于Promise寫的,所以要進行二次封裝。
順帶一提,其實jQuery的「$.ajax」方法返回的就是一個不完全的Promise(沒有實現Promise的所有接口):
$.ajax('a.txt').then(function(resultA) {
console.log(resultA);
return $.ajax('b.txt');
}).then(function(resultB) {
console.log(resultB);
});
Generator Function
Generator Function,中文譯名為生成器函數,是ES6中的新特性。這種函數通過「function *」進行聲明,函數內部可以通過「yield」關鍵字暫停函數執行。
這是一個生成器函數的例子:
function* genFn() {
console.log('begin');
var value = yield 'a';
console.log(value); // 'B'
return 'end';
}
var gen = genFn();
console.log(typeof gen); // 'object'
var g1 = gen.next();
g1.value; // 'a'
g1.done; // false
var g2 = gen.next('B');
g2.value; // 'end'
g2.done; // true
如果是普通的函數,執行「genFn()」后就會返回「end」,但生成器函數并不是這樣。執行「genFn()」后,實際上是創建了一個生成器函數對象,此時函數內的代碼不會執行。而調用這個對象(gen)的「next」方法時,函數開始執行,直到「yield」暫停。「next」方法的返回值是一個對象,它有兩個屬性:
- value:yield關鍵字后面的值(如果為表達式,則為表達式的計算結果);
- done:函數是否執行完畢。
第二次調用「gen.next」時,傳入了一個參數值「B」。「next」方法的參數值即為當前暫停函數的「yield」的返回值,所以函數內部value的值為「B」。然后函數繼續執行,返回「end」。所以「g2.value」為的值「end」,此時函數執行完畢,「g2.done」的值為「true」。
那到底這玩意對異步編程有何助益呢?且看這段代碼:
function* 叫車Gen(battery) {
try {
var result = yield 叫車Promisify(battery);
console.log(result); // '車來了'
} catch (e) {
console.error(e);
}
}
var gen = 叫車Gen(0.1), promise = gen.next().value;
promise.then(function(result) {
gen.next(result);
}, function(err) {
gen.throw(err);
});
其執行過程大概是:執行異步操作后就暫停了「叫車Gen」的執行,異步操作完成后通過「gen.next」把「result」回傳到「叫車Gen」中;如果出現異常,就通過「gen.throw」拋出以便在「叫車Gen」里面捕獲。
但是這樣繞來繞去又有什么好處呢?仔細觀察可以發現,「叫車Gen」內部雖然執行的是異步操作,但完全就是同步的寫法(沒有回調函數,異常捕獲也是用常規的「try...catch」)。進一步思考,如果能把后面的細節封裝起來,那就真的可以用同步的方式寫異步的代碼了。而后面的細節部分也是有規律可循的,封裝起來并不是難事(只是有點繞):
function asyncByGen(genFn) {
var gen = genFn();
function nextStep(g) {
if (g.done) { return; }
if (g.value instanceof Promise) {
g.value.then(function(result) {
nextStep(gen.next(result));
}, function(err) {
gen.throw(err);
});
} else {
nextStep(gen.next(g.value));
}
}
nextStep(gen.next());
}
借助這個函數,異步編程可以前所未有地簡單:
// 異步串行:充電 -> 叫車
asyncByGen(function *() {
try {
var battery = yield 充電Promisify();
console.log(
yield 叫車Promisify(battery)
); // '車來了'
} catch (e) {
console.error(e);
}
});
// 異步并行:充電、洗刷并行
asyncByGen(function *() {
try {
console.dir(
yield Promise.all([
充電Promisify(),
new Promise(function(resolve) {
洗刷();
resolve()
})
])
); // [0.1, undefined]
} catch (e) {
console.error(e);
}
});
// 串行、并行互相穿插:從起床到上班的過程
asyncByGen(function*() {
try {
起床();
console.dir(
yield Promise.all([
充電Promisify().then(function(battery) {
return 叫車Promisify(battery);
}),
new Promise(function(resolve) {
洗刷();
換衣();
resolve();
})
])
); // [0.1, undefined]
上班();
} catch (e) {
console.error(e);
}
});
生成器函數是一種比較新的特性,雖然Node.js 4.0+已經原生支持,但在舊版本瀏覽器上肯定無法運行。因此如果要在瀏覽器端使用還得通過編譯器(如Babel)編譯成ES5的代碼,這也是這種解決方案的最大缺點。
講到這里,順便介紹一下「co」庫。這個庫的功能類似于「asyncByGen」,但它封裝得更好,功能也更多,是用生成器函數寫異步代碼必不可少的利器。
async/await
如果你還是看不懂生成器函數的執行過程,那也沒關系,因為它已經“過時”了!ES7提供了「async」、「await」兩個關鍵字,可以達到跟「asyncByGen」一樣的效果。
首先給大家介紹一個這兩個關鍵字的用法。「async」是用來聲明異步函數的,這種函數的返回值總是Promise對象(即使函數內部返回的不是Promise對象,也會返回一個結果為undefined的Promise對象)。
async function asyncFnA() {
return Promise.resolve('A');
}
asyncFnA().then(function(result) {
console.log(result); // 'A'
});
async function asyncFnB() {
}
asyncFnB().then(function(result) {
console.log(result); // undefined
});
「await」只能用在由「async」聲明的異步函數的內部,它會等待其后的Promise對象確定狀態后再執行后續的語句:
(async function() {
var battery = await 充電Promisify();
console.log(battery); // 0.1
})();
順帶提一下,「await」后面不一定非要跟著Promise對象,也可以是一個普通的值,這樣相當于是執行同步代碼。
下面用「async/await」重寫上面的例子:
// 異步串行:充電 -> 洗刷
(async function() {
try {
var battery = await 充電Promisify();
return await 叫車Promisify(battery);
} catch (e) {
console.error(e);
}
})().then(function(msg) {
console.log(msg); // 車來了
});
// 異步并行:充電、洗刷并行
(async function() {
try {
return await Promise.all([
充電Promisify(),
(async function() {
洗刷();
})()
]);
} catch (e) {
console.error(e);
}
})().then((results) => {
console.dir(results); // [0.1, undefined]
});
// 串行、并行互相穿插:從起床到上班的過程
(async function() {
try {
起床();
console.dir(
await Promise.all([
充電Promisify().then(function(battery) {
return 叫車Promisify(battery);
}),
(async function() {
洗刷();
換衣();
})()
])
); // [0.1, undefined]
上班();
} catch (e) {
console.error(e);
}
})();
可見,與生成器函數相比,「async/await」又使異步編程變得更為簡單了。Node.js 7.6+以及大部分主流瀏覽器的最新版本都已經支持這兩個關鍵字了,但還是那句話:如果要在瀏覽器端使用,編譯器(如Babel)是少不了的。
后記
本文的第一版寫于2015年年底,現在(2017年中)重讀一遍,覺得有不少可以改進的地方,而且技術也在不斷發展,于是又修改了一遍。改動包括:
- 把示例代碼由原來的「AJAX讀取文件」改成文章開頭所述的「從起床到上班的過程」。雖然用到了中文函數名,但都是可以運行的。
- 新增「async/await」一節。