DCLP單例與亂序執(zhí)行測(cè)試

DCLP單例實(shí)現(xiàn)的典型代碼如下:

static A *getInstance()
  {
      if(local_instance == nullptr){
          pthread_mutex_lock(&mutex);
          if (local_instance == nullptr)
          {
              local_instance = new A();
          }
          pthread_mutex_unlock(&mutex);
      }
      return local_instance;
  }

網(wǎng)上有一種說(shuō)法,local_instance = new A()這句話是有風(fēng)險(xiǎn)的。因?yàn)橛锌赡苤噶畎聪旅娴捻樞驁?zhí)行:

  1. 為A申請(qǐng)內(nèi)存
  2. 內(nèi)存首地址賦給local_instance
  3. 在內(nèi)存中構(gòu)造A

所以在一個(gè)多線程應(yīng)用中,有可能A線程剛執(zhí)行完2,還沒(méi)來(lái)得及執(zhí)行3,另外一個(gè)線程取到了非空但未構(gòu)造的local_instance。
之前一直對(duì)這個(gè)說(shuō)法有懷疑,覺(jué)得鉆牛角尖了。今天在一臺(tái)Arm64機(jī)器上做了測(cè)試,代碼如下:

#include <thread>
#include <gtest/gtest.h>

class A;
A* local_instance = nullptr;
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;

class A
{
private: 
  A(void)
  {
    v = 12345678;
  }

public:
  int v;

  static A *getInstance()
  {
    if(local_instance == nullptr)
    {
      pthread_mutex_lock(&mutex);
      if (local_instance == nullptr)
      {
        local_instance = new A();
      }
      pthread_mutex_unlock(&mutex);
    }
    return local_instance;
  }
};


TEST(test_memory_order, TEST001)
{
  std::thread t1([]()
  {
    assert(A::getInstance()->v == 12345678);
  });

  std::thread t2([]()
  {
    assert(A::getInstance()->v == 12345678);
  });
  

  t1.join();
  t2.join();

  delete ::local_instance;
  ::local_instance = nullptr;
}

int main(int argc, char* argv[])
{
  testing::InitGoogleTest(&argc, argv);

  return RUN_ALL_TESTS();
}

編譯:g++ a.cpp -lpthread -lgtest -O2
運(yùn)行:./a.out --gtest_repeat=100000
果然會(huì)報(bào)錯(cuò):


圖片.png

雖然問(wèn)題可以復(fù)現(xiàn),但我個(gè)人并不認(rèn)同網(wǎng)上的說(shuō)法,“構(gòu)造A”和“首地址賦給local_instance"發(fā)生了重排。在A::A()沒(méi)有內(nèi)聯(lián)的情況下,一條是bl指令,一條是store指令。如果強(qiáng)制A::A()不可內(nèi)聯(lián):

A(void)__attribute__((noinline))

線程函數(shù)體匯編代碼如下(開(kāi)O2編譯,getInstance被內(nèi)聯(lián)展開(kāi)了)


圖片.png

那么,按網(wǎng)上的說(shuō)法,是下面這兩條指令發(fā)生了重排:

9184     991c: 94000065  bl  9ab0 <_ZN1AC1Ev>                                                                                                                                            
9185     9920: f9001e74  str x20, [x19, #56]

不論是編譯器還是CPU,都不應(yīng)該重排bl和store。因?yàn)椴还茉趺粗嘏?,都?yīng)保證單線程執(zhí)行結(jié)果不變。例如,萬(wàn)一bl的目標(biāo)函數(shù)拋出了異常,本來(lái)store指令是執(zhí)行不到的,現(xiàn)在把store提到前面,不就違背了單線程執(zhí)行結(jié)果不變的底線嗎?
既然bl和store不能重排,上面的assert又為什么會(huì)失敗呢?
我認(rèn)為原因是,v = 12345678是一條store指令,給local_instance賦值也是一條store指令。在arm64上,因?yàn)閟tore buffer、invalidate queue的原因,發(fā)生了store store的memory reordering,導(dǎo)致在另外一個(gè)CPU看來(lái),給local_instance賦值比給v賦值先發(fā)生了。
為了驗(yàn)證這個(gè)說(shuō)法,修改A::A()如下:

A(void)__attribute__((noinline))
{
    v = 12345678;
   __asm__ __volatile__("dmb ishst" : : : "memory");    //即linux kernel中的__smp_wmb
}

如果按網(wǎng)上的說(shuō)法,bl和store發(fā)生了重排,那么不管A::A()是怎么定義的,都會(huì)發(fā)生先給local_instance賦值后給v賦值的情況。然而,這樣修改后,測(cè)試100W次,都沒(méi)有assert發(fā)生。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 重新系統(tǒng)學(xué)習(xí)下C++;但是還是少了好多知識(shí)點(diǎn);socket;unix;stl;boost等; C++ 教程 | 菜...
    kakukeme閱讀 20,456評(píng)論 0 50
  • 編譯安裝 配置編譯工具編譯Google Test 需要cmake2.6 版本以及上。yum list | grep...
    wayyyy閱讀 2,054評(píng)論 0 0
  • 定義:保證一個(gè)類僅有一個(gè)實(shí)例,并提供一個(gè)訪問(wèn)它的全局訪問(wèn)點(diǎn)。單例模式的最終目的是為了要實(shí)現(xiàn)對(duì)唯一實(shí)例 的受控訪問(wèn)。...
    進(jìn)擊的Lancelot閱讀 324評(píng)論 0 0
  • 使用GTEST編寫C++測(cè)試用例進(jìn)階教程 [TOC] 更多的斷言 這章覆蓋了一些使用頻率較少但是仍然很重要的斷言 ...
    愿以光散黑閱讀 15,920評(píng)論 0 3
  • 單例模式(SingletonPattern)一般被認(rèn)為是最簡(jiǎn)單、最易理解的設(shè)計(jì)模式,也因?yàn)樗暮?jiǎn)潔易懂,是項(xiàng)目中最...
    成熱了閱讀 4,545評(píng)論 4 34

友情鏈接更多精彩內(nèi)容