線程安全(thread safety)是指在多線程環境下,不同的線程在同一時刻能夠安全訪問臨界區的能力,它可以讓代碼沒有副作用地實現想要的功能。
可重入(reentrancy)是指一個函數如果在執行過程中被中斷,當中斷完成后又可以安全地進入上次中斷點重新執行的能力。它有兩種語義:
- 在多線程環境下,一個線程因時間片使用完了(或者其他原因),另一個線程開始運行,接著該線程又安全地重新開始運行。在這種語境下,可重入等同于線程安全。
- 在單線程的信號處理環境下,一個函數在運行過程中,此時異步來了個信號,控制流便轉向了信號處理函數,當信號處理函數完成后該函數又可以安全地重新運行。在這種語境下,可重入又被稱為異步信號安全(async-signal safety)。
當提到可重入的時候,我們一般指的是后者。
可重入
為了使函數達到可重入,需要遵循一定的規則,如下
- 不要包含靜態數據,不要使用全局數據。
int global_var{10};
int NotReentrant()
{
global_var = 20;
// 在這里來了個信號
return global_var;
}
如上所示,如果給 global_var 賦值之后來了個信號,在信號處理函數中又對 global_var 賦了不同的值,那么從信號處理函數返回到 NotReentrant 中,global_var 的值就不再是我們期望的值,因此該函數是不可重入的。
這個例子比較直觀,信號也可能在一些不太直觀的地方中發送過來。例如,在一個 32 位的機器上操作 64 位的數據,這個操作可能就要被分為兩個 32 位的操作,而在這兩個操作之間,信號就有可能被發送過來;對于 global_var = f() + g();
,f() 和 g() 發生的先后順序是不確定的,而且信號也可能在兩個函數之間被發送過來。
- 不要使用 new(malloc)或 delete(free)。
不同實現中的 new 是不同的,可以是線程安全的也可以是線程不安全的,但無論如何都是不可重入的。
先假設它是線程不安全的。new 通常為它在堆上分配的存儲區維護一個鏈表,而當信號來的時候,線程可能正在修改此鏈表,而信號處理函數中也可能調用了 new,也要修改鏈表,這就造成了沖突。因此線程不安全的 new 是不可重入的。
再假設它是線程安全的。這時候就要在修改鏈表的地方加上鎖,如果在加上鎖之后但還沒有修改完鏈表的時候來了個信號,在信號處理函數中也調用了 new,也要加上鎖,如果該鎖不是遞歸的,那么該線程將會永久地等待該鎖的釋放,無法將控制流返回到之前的函數中。因此線程安全的 new 也是不可重入的。
在本文的測試環境中(Ubuntu-16.04-64bit GCC-5.4.0),new(malloc)和 delete(malloc)都是線程安全的。
- 不要使用不可重入的函數。
特別需要注意的是標準 I/0 函數,標準 I/O 庫中的很多實現都以不可重入方式使用了全局數據。若標準 I/O 指向的是終端,則它是行緩沖的,否則是全緩沖的。例如對于 printf,并不是調用它就會立即將全局緩沖數據沖洗(flush),而是當遇到了換行符(行緩沖)或者是緩沖區滿了(全緩沖)才會將數據傳送。由于使用了全局數據,因此 printf 是不可重入的,不能將它用在可重入的函數中。
在本文的測試環境下,有些函數是不可重入的,例如 strerror 和 readdir,但是系統提供了可重入的版本 strerror_r 和 readdir_r(后綴 r 表示 reentrant),這些可重入版本不再使用靜態數據,而是需要調用者提供由自己管理的存儲空間。
信號處理函數也需要是可重入的,當控制流在信號處理函數 A 中時,也可能會有另外的信號發送過來,如果此時的信號屏蔽字沒有將該信號屏蔽掉,那么就會轉到相應的信號處理函數 B 中,如果信號處理函數 A 和 B 都修改了同一個全局變量,那么結果將會是意料之外的。
對于以上的規則,errno 是一個例外,每個線程都會有自己的 errno,Single UNIX Specification 中要求的可重入函數(詳見 APUE 第三版 10.6)也可能會出錯,從而修改了 errno,但是依然認為這些函數是可重入的,所以如果在信號處理函數中調用了這些函數,需要在該信號處理函數開始的位置保存 errno,在函數的末尾再把保存的值重新賦給 errno。
可重入與線程安全的區別
我們經常將可重入與線程安全視為相同的,但是它們之間還是有細微的差別。在多線程環境下,可重入即為線程安全;但是更常使用的語境是單線程的信號處理,因為滿足了上述可重入的三個規則的函數,大多同時也是線程安全的,所以通常并不對其進行區分,但是也會有特殊的情況。
是可重入卻是線程不安全
int global_var{20};
void Swap(int* lhs, int* rhs)
{
int save{global_var};
global_var = *lhs;
*lhs = *rhs;
// 假如信號在此時傳來
*rhs = global_var;
global_var = save;
}
這種做法就類似與上文對 errno 的處理,先將 global_var 保存起來,在末尾的地方再還回去。如果信號在 Swap 中途傳來,也不用擔心控制流重新回來的時候 global_var 會發生改變,因此是可重入的;但是由于沒有對臨界區鎖起來,這個函數就是線程不安全的。
是線程安全卻是不可重入
上文中的線程安全的 new 就是一個例子。
參考
[1] Reentrancy(computing)
[2] Thread safety
[3] why are malloc and printf said as non-reentrant