可重入與線程安全

線程安全(thread safety)是指在多線程環(huán)境下,不同的線程在同一時(shí)刻能夠安全訪問臨界區(qū)的能力,它可以讓代碼沒有副作用地實(shí)現(xiàn)想要的功能。
可重入(reentrancy)是指一個(gè)函數(shù)如果在執(zhí)行過程中被中斷,當(dāng)中斷完成后又可以安全地進(jìn)入上次中斷點(diǎn)重新執(zhí)行的能力。它有兩種語義:

  • 在多線程環(huán)境下,一個(gè)線程因時(shí)間片使用完了(或者其他原因),另一個(gè)線程開始運(yùn)行,接著該線程又安全地重新開始運(yùn)行。在這種語境下,可重入等同于線程安全。
  • 在單線程的信號(hào)處理環(huán)境下,一個(gè)函數(shù)在運(yùn)行過程中,此時(shí)異步來了個(gè)信號(hào),控制流便轉(zhuǎn)向了信號(hào)處理函數(shù),當(dāng)信號(hào)處理函數(shù)完成后該函數(shù)又可以安全地重新運(yùn)行。在這種語境下,可重入又被稱為異步信號(hào)安全(async-signal safety)。

當(dāng)提到可重入的時(shí)候,我們一般指的是后者。


可重入

為了使函數(shù)達(dá)到可重入,需要遵循一定的規(guī)則,如下

  1. 不要包含靜態(tài)數(shù)據(jù),不要使用全局?jǐn)?shù)據(jù)。
int global_var{10};

int NotReentrant()
{
  global_var = 20;
  // 在這里來了個(gè)信號(hào)
  return global_var;
}

如上所示,如果給 global_var 賦值之后來了個(gè)信號(hào),在信號(hào)處理函數(shù)中又對 global_var 賦了不同的值,那么從信號(hào)處理函數(shù)返回到 NotReentrant 中,global_var 的值就不再是我們期望的值,因此該函數(shù)是不可重入的。
這個(gè)例子比較直觀,信號(hào)也可能在一些不太直觀的地方中發(fā)送過來。例如,在一個(gè) 32 位的機(jī)器上操作 64 位的數(shù)據(jù),這個(gè)操作可能就要被分為兩個(gè) 32 位的操作,而在這兩個(gè)操作之間,信號(hào)就有可能被發(fā)送過來;對于 global_var = f() + g();,f()g() 發(fā)生的先后順序是不確定的,而且信號(hào)也可能在兩個(gè)函數(shù)之間被發(fā)送過來。

  1. 不要使用 newmalloc)或 deletefree)。

不同實(shí)現(xiàn)中的 new 是不同的,可以是線程安全的也可以是線程不安全的,但無論如何都是不可重入的。
先假設(shè)它是線程不安全的。new 通常為它在堆上分配的存儲(chǔ)區(qū)維護(hù)一個(gè)鏈表,而當(dāng)信號(hào)來的時(shí)候,線程可能正在修改此鏈表,而信號(hào)處理函數(shù)中也可能調(diào)用了 new,也要修改鏈表,這就造成了沖突。因此線程不安全的 new 是不可重入的。
再假設(shè)它是線程安全的。這時(shí)候就要在修改鏈表的地方加上鎖,如果在加上鎖之后但還沒有修改完鏈表的時(shí)候來了個(gè)信號(hào),在信號(hào)處理函數(shù)中也調(diào)用了 new,也要加上鎖,如果該鎖不是遞歸的,那么該線程將會(huì)永久地等待該鎖的釋放,無法將控制流返回到之前的函數(shù)中。因此線程安全的 new 也是不可重入的。
在本文的測試環(huán)境中(Ubuntu-16.04-64bit GCC-5.4.0),newmalloc)和 deletemalloc)都是線程安全的。

  1. 不要使用不可重入的函數(shù)。

特別需要注意的是標(biāo)準(zhǔn) I/0 函數(shù),標(biāo)準(zhǔn) I/O 庫中的很多實(shí)現(xiàn)都以不可重入方式使用了全局?jǐn)?shù)據(jù)。若標(biāo)準(zhǔn) I/O 指向的是終端,則它是行緩沖的,否則是全緩沖的。例如對于 printf,并不是調(diào)用它就會(huì)立即將全局緩沖數(shù)據(jù)沖洗(flush),而是當(dāng)遇到了換行符(行緩沖)或者是緩沖區(qū)滿了(全緩沖)才會(huì)將數(shù)據(jù)傳送。由于使用了全局?jǐn)?shù)據(jù),因此 printf 是不可重入的,不能將它用在可重入的函數(shù)中。

在本文的測試環(huán)境下,有些函數(shù)是不可重入的,例如 strerrorreaddir,但是系統(tǒng)提供了可重入的版本 strerror_rreaddir_r(后綴 r 表示 reentrant),這些可重入版本不再使用靜態(tài)數(shù)據(jù),而是需要調(diào)用者提供由自己管理的存儲(chǔ)空間。
信號(hào)處理函數(shù)也需要是可重入的,當(dāng)控制流在信號(hào)處理函數(shù) A 中時(shí),也可能會(huì)有另外的信號(hào)發(fā)送過來,如果此時(shí)的信號(hào)屏蔽字沒有將該信號(hào)屏蔽掉,那么就會(huì)轉(zhuǎn)到相應(yīng)的信號(hào)處理函數(shù) B 中,如果信號(hào)處理函數(shù) A 和 B 都修改了同一個(gè)全局變量,那么結(jié)果將會(huì)是意料之外的。
對于以上的規(guī)則,errno 是一個(gè)例外,每個(gè)線程都會(huì)有自己的 errno,Single UNIX Specification 中要求的可重入函數(shù)(詳見 APUE 第三版 10.6)也可能會(huì)出錯(cuò),從而修改了 errno,但是依然認(rèn)為這些函數(shù)是可重入的,所以如果在信號(hào)處理函數(shù)中調(diào)用了這些函數(shù),需要在該信號(hào)處理函數(shù)開始的位置保存 errno,在函數(shù)的末尾再把保存的值重新賦給 errno。


可重入與線程安全的區(qū)別

我們經(jīng)常將可重入與線程安全視為相同的,但是它們之間還是有細(xì)微的差別。在多線程環(huán)境下,可重入即為線程安全;但是更常使用的語境是單線程的信號(hào)處理,因?yàn)闈M足了上述可重入的三個(gè)規(guī)則的函數(shù),大多同時(shí)也是線程安全的,所以通常并不對其進(jìn)行區(qū)分,但是也會(huì)有特殊的情況。

是可重入?yún)s是線程不安全

int global_var{20};

void Swap(int* lhs, int* rhs)
{
  int save{global_var};

  global_var = *lhs;
  *lhs = *rhs;
  // 假如信號(hào)在此時(shí)傳來
  *rhs = global_var;

  global_var = save;
}

這種做法就類似與上文對 errno 的處理,先將 global_var 保存起來,在末尾的地方再還回去。如果信號(hào)在 Swap 中途傳來,也不用擔(dān)心控制流重新回來的時(shí)候 global_var 會(huì)發(fā)生改變,因此是可重入的;但是由于沒有對臨界區(qū)鎖起來,這個(gè)函數(shù)就是線程不安全的。

是線程安全卻是不可重入

上文中的線程安全的 new 就是一個(gè)例子。


參考

[1] Reentrancy(computing)
[2] Thread safety
[3] why are malloc and printf said as non-reentrant

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容