原文地址在我的博客,轉載請注明出處,謝謝!
node 模塊是node 完成強大功能的實現者。node 的核心模塊包括events、fs、buffer、stream、cluster、http、net、一些操作OS和工具模塊、全局對象等。本文將在node核心特性理解的基礎上進一步深入探討node核心模塊的具體細節。本文主要探討的模塊有:全局對象global及其重要屬性、多進程cluster、events重要類EventEmitter、流Stream、文件系統fs、網絡http,還會介紹node框架express相關。
概述
本文先來介紹全局對象global及其重要屬性、多進程cluster模塊。
正文
node全局對象global
與瀏覽器對應的window一樣,在node中global是全局對象,在全局作用域定義的任何變量都會保存為global的屬性,稱為全局變量。下面是global一些重要的屬性:
-
模塊:
module
、require
、exports
這三個全局變量組成了node 的模塊定義和引入,是 commonJS 的實現。node將每個文件視為一個模塊,在執行到每個模塊之前都會定義好上述三個變量,因此可以直接使用。來看它們之間的協作:
// module1.js exports.fun = function(a,b) { return a + b; } //綁定在exports的屬性可以被其他模塊引入使用 //module2.js var module1 = require('./module1') module1.fun(3,2) //5
相關機制:
- module 表示對這個模塊的引用,因此
module
實際上不是全局的,而是每個模塊本地的。module除了exports 還有其他關于模塊的屬性,例如module.children
- exports 其實是
module.exports
的簡寫,表示這個模塊的輸出。有一點需要注意,對exports直接賦值exports = {...}
并不會被輸出,因為exports事先已經被定義了,再次這樣賦值會被覆蓋,需要帶上module:module.exports = {...}
- require 表示引入某個模塊,填寫模塊路徑即可,在node_modules里面的模塊填寫名字即可,js文件可以不用寫擴展名。
另外,由于V8引擎對ES6的不斷支持,node 中也可以直接使用ES6的一些特性、例如promise、class等,ES6的模塊也被node 實驗性的引入并且是穩定的。詳情見nodejs中文網。可以在node.green查看支持的特性
- module 表示對這個模塊的引用,因此
-
異步操作 setTimeout、setInterval、setImmediate、process.nextTick
setTimeout和setInterval跟瀏覽器端一樣,不同的是,node實現了setImmediate(目前瀏覽器端只有 IE實現了該方法)。它表示在 Node.js 事件循環的當前回合結束時要調用的函數,用來把一些需要長時間運行的操作放在一個回調函數里,在node主線程完成后面的其他語句后,就立刻執行這個回調函數,參數是一個函數和用作這個函數的參數,作用跟
setTimeout(fn,0)
差不多,都是相當于立即在事件隊列末尾插入一個事件,但也有差別。-
process.nextTick(fn,...args)
表示在當前調用棧結束后,在下一個事件執行前調用回調函數。node 提供這個API是為了把復雜耗時的任務放到最后去處理,以便優先執行簡單的任務。來看它們之間的比較:setTimeout(() => console.log("setTimeout0"),0) setImmediate(() => console.log("setImmediate")) process.nextTick(() => console.log("nextTick")) //輸出nextTick setTimeout0 setImmediate 或者 nextTick setImmediate setTimeout0
無論
process.nextTick
寫在什么地方,它總是第一個輸出。無論setTimeout和setImmediate誰先誰后,都可能出現兩種結果,其中setTimeout(fn,0)先于setImmediate多一點。這是因為它們三個產生的事件推入到了不同的watcher
(觀察者)中—— setTimeout推入到了定時器觀察者,setImmediate是check觀察者,而process.nextTick()是idle觀察者 ,而node主線程在事件循環時調用watcher 的順序一般是 idle觀察者 > check觀察者,idle觀察者 > 定時器觀察者,check 和定時器不分先后,但定時器先于check的概率大一點。
-
node進程: process
process 是node對進程的表示,提供了操作進程的接口,可以用process來提供進程有關信息,控制進程 。
process提供的接口包括
描述進程的一些狀態(事件):exit、beforeExit、uncaughtException、Signal
進程退出返回的狀態碼:Uncaught Fatal Exception、Signal Exits、Unused等
進程的相關信息:stdout、stderr、config、stdin、exitCode、pid(進程編號)等
操作進程的方法:abort、chdir、cwd、kill(發送信號給進程)、exit、nextTick、getgid、setgid、uptime等
-
其他: console、
__filename
、__dirname
這些都是全局變量,可以在任何地方引用
node 子進程:child_process模塊
一個進程只能利用一個CPU時間分片,為了高效利用多核CPU,node 提供了可以創建子進程(注意不是子線程)的child_process
模塊,來幫助主進程高效利用多核CPU完成其他復雜的任務。之所以提供創建子進程而不是子線程的接口,是因為這讓我們的程序狀態單一,不用在意狀態同步、死鎖、上下文切換開銷等等多線程編程中的頭疼問題。這樣以來一個進程只有一個線程。雖然單線程也會帶來一些問題,如錯誤會引起整個應用退出等,但這都有了很好的解決方案。
創建子進程
node有三種創建子進程的接口:
- exec / execFile: 這兩者都會創建子進程來執行,執行的結果會存儲在Buffer中。不同的是前者創建一個shell進程來執行命令,后者直接創建一個進程用來執行可執行文件,因此前者適合用來執行shell命令然后獲取輸出,后者效率較高。這兩者因為輸出的結果存儲在Buffer中,因此只適合輸出輕量的數據。
- spawn:適合用于進程輸入、輸出數據量比較大的情況,因為它支持以 stream 的形式輸入輸出,可以用于任何命令。spawn的參數option有一個stdio配置項,用來配置子進程與父進程之間的IO通道,還有一個detached來配置子進程是否獨立運行,可以創建常駐后臺進程。總之,給予了子進程更多的靈活性。
-
fork:fork 其實是spawn的特例,它會創建一個V8實例,只能用來運行node.js程序,并且與上面兩種方法不同的是,fork會在父子進程間建立 IPC 通道,父子進程之間可以互相收發消息——通過監聽
message
事件和調用send
方法,就可以在父子進程間進行通信了。
父子進程通信
首先,這三種API都返回ChildProcess
實例,因此都可以通過訪問stdout
屬性來得到輸出,exec/execFile 接口還可以在參數里綁定回調函數拿到子進程的stdout 。
const { exec, execFile, spawn, fork } = require("child_process")
// exec/execFile 接口既可以在參數里綁定回調函數拿到輸出流,也可以利用返回的ChildProcess實例
const exec_process = exec("node child_process.js", {}, (err, stdout, stderr) => {
if (err) {
console.log(err)
} else if(stdout) {
console.log(stdout)
} else {
console.log(stderr)
}
})
exec_process.stdout.on('data',(data) => console.log(`${data}`))
// spawn 接口沒有回調函數,只能利用返回的ChildProcess實例綁定監聽數據函數拿到子進程的輸出
const spawn_process = spawn('node',['child_process'], {})
spawn_process.stdout.on('data', (data) => console.log(`${data}`))
//fork 也可以利用返回的ChildProcess實例,注意配置項silent要設為true
const fork_process = fork('child_process.js', [], {'silent': true})
fork_process.stdout.on('data' ,(data) => console.log(`${data}`))
其次, fork返回的ChildProcess
實例有一個額外的內置的通信通道IPC,它允許消息在父進程和子進程之間來回傳遞。
// child_process.js
process.on('message', (data) => {
console.log(`message from Parent: ${data}`);
})
setTimeout(() => {
process.send('send from child');
}, 2000)
// parent.js
const { fork } = require("child_process")
const p = fork(
'child_process.js', // 需要執行的腳本路徑
[], // 傳遞的參數
{}
)
p.on('message', data => { //監聽子進程消息
console.log(`message from child: ${data}`)
})
p.send('send from parent') //發送消息給子進程
集群:Cluster 模塊
cluster
模塊是對child_process
模塊的進一步封裝,專用于解決單進程NodeJS Web服務器無法充分利用多核CPU的問題。使用該模塊可以簡化多進程服務器程序的開發,讓每個核上運行一個工作進程,并統一通過主進程監聽端口和分發請求。 ——七天學會node.js
const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;
console.log(numCPUs)
if (cluster.isMaster) {
console.log(`主進程 ${process.pid} 正在運行`);
// 衍生工作進程。
for (let i = 0; i < numCPUs; i++) {
cluster.fork(); // 調用了 child_process.fork()方法創建工作進程
}
cluster.on('exit', (worker, code, signal) => {
console.log(`工作進程 ${worker.process.pid} 已退出`);
});
} else {
// 工作進程可以共享任何 TCP 連接。
// 在本例子中,共享的是一個 HTTP 服務器。
http.createServer((req, res) => {
res.writeHead(200);
res.end('你好世界\n');
}).listen(8000);
console.log(`工作進程 ${process.pid} 已啟動`);
}
console.log("WOW")
// 輸出(Mac OS)
4
主進程 55570 正在運行
WOW
4
工作進程 55571 已啟動
WOW
4
工作進程 55572 已啟動
WOW
4
工作進程 55573 已啟動
WOW
4
工作進程 55574 已啟動
WOW
//可以看到 fork 是異步創建的,調用時請求創建進程并立即返回,系統創建好進程后會加入到事件隊列,執行到事件就調用回調函數,這個回調函數包括執行一遍這個文件
cluster.fork()
實際調用了child_process.fork()
,因此建立了IPC通道與父進程通信。它會創建一個進程并返回cluster.worker
實例。創建的每個進程之間都是獨立的,一個進程的開啟和關閉不影響其他進程。只要有存活的進程,服務器就可以繼續處理連接。
主進程負責監聽端口,接收新連接后會自動將連接循環(默認)分發給cluster.fork()
創建的工作進程來幫忙處理,因此可以使用cluster模塊來實現簡單的負載均衡。
注意:
-
cluster.fork()
返回cluster.worker
實例可能會引起困惑,困惑的原因把主進程和工作進程做了master和worker的區分,這里不用這么區分,既然主進程也是進程,那么也可以看作worker,調用cluster.fork().send(message)
就可以向子進程發送信息,同樣監聽信息也是cluster.fork().on('message', (data) => {...})
。 - worker 和 process 都是相對的,如果當前執行進程是主進程就代表主進程,是工作進程就代表工作進程。
- cluster代表整個集群,也就是主進程和工作進程,隨著當前執行進程的變化,cluster的屬性也在變化。在cluster上面綁定的事件對每個進程都起作用。cluster有一些API 是只對于主進程或只對于工作進程的,例如只能在主進程而不能在工作進程中調用的:fork、cluster.workers等,只能在工作進程不能在主進程調用的:cluster.worker等。
- 跟上面child_process模塊不一樣的是,
cluster.fork()
只有增加進程環境變量的參數(一般是不帶的),沒有要執行文件路徑的參數,因此像上面代碼那樣主進程做的事和工作進程做的事寫在同一文件(if-else語句里)是合理的。