【轉(zhuǎn)自】http://blog.csdn.net/zqz_zqz/article/details/70233767
之前做過一個(gè)測(cè)試,詳情見這篇文章《多線程 +1操作的幾種實(shí)現(xiàn)方式,及效率對(duì)比》,當(dāng)時(shí)對(duì)這個(gè)測(cè)試結(jié)果很疑惑,反復(fù)執(zhí)行過多次,發(fā)現(xiàn)結(jié)果是一樣的:
1. 單線程下synchronized效率最高(當(dāng)時(shí)感覺它的效率應(yīng)該是最差才對(duì));
2. AtomicInteger效率最不穩(wěn)定,不同并發(fā)情況下表現(xiàn)不一樣:短時(shí)間低并發(fā)下,效率比synchronized高,有時(shí)甚至比LongAdder還高出一點(diǎn),但是高并發(fā)下,性能還不如synchronized,不同情況下性能表現(xiàn)很不穩(wěn)定;
3. LongAdder性能穩(wěn)定,在各種并發(fā)情況下表現(xiàn)都不錯(cuò),整體表現(xiàn)最好,短時(shí)間的低并發(fā)下比AtomicInteger性能差一點(diǎn),長時(shí)間高并發(fā)下性能最高(可以讓AtomicInteger下臺(tái)了);
這篇文章我們就去揭秘,為什么會(huì)是這個(gè)測(cè)試結(jié)果!
如果想要透徹的理解Java鎖的來龍去脈,需要先了解以下基礎(chǔ)知識(shí)。
鎖從宏觀上分類,分為悲觀鎖與樂觀鎖。
樂觀鎖是一種樂觀思想,即認(rèn)為讀多寫少,遇到并發(fā)寫的可能性低,每次去拿數(shù)據(jù)的時(shí)候都認(rèn)為別人不會(huì)修改,所以不會(huì)上鎖,但是在更新的時(shí)候會(huì)判斷一下在此期間別人有沒有去更新這個(gè)數(shù)據(jù),采取在寫時(shí)先讀出當(dāng)前版本號(hào),然后加鎖操作(比較跟上一次的版本號(hào),如果一樣則更新),如果失敗則要重復(fù)讀-比較-寫的操作。
java中的樂觀鎖基本都是通過CAS操作實(shí)現(xiàn)的,CAS是一種更新的原子操作,比較當(dāng)前值跟傳入值是否一樣,一樣則更新,否則失敗。
悲觀鎖是就是悲觀思想,即認(rèn)為寫多,遇到并發(fā)寫的可能性高,每次去拿數(shù)據(jù)的時(shí)候都認(rèn)為別人會(huì)修改,所以每次在讀寫數(shù)據(jù)的時(shí)候都會(huì)上鎖,這樣別人想讀寫這個(gè)數(shù)據(jù)就會(huì)block直到拿到鎖。java中的悲觀鎖就是Synchronized,AQS框架下的鎖則是先嘗試cas樂觀鎖去獲取鎖,獲取不到,才會(huì)轉(zhuǎn)換為悲觀鎖,如RetreenLock。
基礎(chǔ)知識(shí)之二:java線程阻塞的代價(jià)
java的線程是映射到操作系統(tǒng)原生線程之上的,如果要阻塞或喚醒一個(gè)線程就需要操作系統(tǒng)介入,需要在戶態(tài)與核心態(tài)之間切換,這種切換會(huì)消耗大量的系統(tǒng)資源,因?yàn)橛脩魬B(tài)與內(nèi)核態(tài)都有各自專用的內(nèi)存空間,專用的寄存器等,用戶態(tài)切換至內(nèi)核態(tài)需要傳遞給許多變量、參數(shù)給內(nèi)核,內(nèi)核也需要保護(hù)好用戶態(tài)在切換時(shí)的一些寄存器值、變量等,以便內(nèi)核態(tài)調(diào)用結(jié)束后切換回用戶態(tài)繼續(xù)工作。
如果線程狀態(tài)切換是一個(gè)高頻操作時(shí),這將會(huì)消耗很多CPU處理時(shí)間;
如果對(duì)于那些需要同步的簡(jiǎn)單的代碼塊,獲取鎖掛起操作消耗的時(shí)間比用戶代碼執(zhí)行的時(shí)間還要長,這種同步策略顯然非常糟糕的。
synchronized會(huì)導(dǎo)致爭(zhēng)用不到鎖的線程進(jìn)入阻塞狀態(tài),所以說它是java語言中一個(gè)重量級(jí)的同步操縱,被稱為重量級(jí)鎖,為了緩解上述性能問題,JVM從1.5開始,引入了輕量鎖與偏向鎖,默認(rèn)啟用了自旋鎖,他們都屬于樂觀鎖。
明確java線程切換的代價(jià),是理解java中各種鎖的優(yōu)缺點(diǎn)的基礎(chǔ)之一。
在介紹java鎖之前,先說下什么是markword,markword是java對(duì)象數(shù)據(jù)結(jié)構(gòu)中的一部分,要詳細(xì)了解java對(duì)象的結(jié)構(gòu)可以點(diǎn)擊這里,這里只做markword的詳細(xì)介紹,因?yàn)閷?duì)象的markword和java各種類型的鎖密切相關(guān);
markword數(shù)據(jù)的長度在32位和64位的虛擬機(jī)(未開啟壓縮指針)中分別為32bit和64bit,它的最后2bit是鎖狀態(tài)標(biāo)志位,用來標(biāo)記當(dāng)前對(duì)象的狀態(tài),對(duì)象的所處的狀態(tài),決定了markword存儲(chǔ)的內(nèi)容,如下表所示:
狀態(tài)標(biāo)志位存儲(chǔ)內(nèi)容
未鎖定01對(duì)象哈希碼、對(duì)象分代年齡
輕量級(jí)鎖定00指向鎖記錄的指針
膨脹(重量級(jí)鎖定)10執(zhí)行重量級(jí)鎖定的指針
GC標(biāo)記11空(不需要記錄信息)
可偏向01偏向線程ID、偏向時(shí)間戳、對(duì)象分代年齡
32位虛擬機(jī)在不同狀態(tài)下markword結(jié)構(gòu)如下圖所示:
了解了markword結(jié)構(gòu),有助于后面了解java鎖的加鎖解鎖過程;
前面提到了java的4種鎖,他們分別是重量級(jí)鎖、自旋鎖、輕量級(jí)鎖和偏向鎖,
不同的鎖有不同特點(diǎn),每種鎖只有在其特定的場(chǎng)景下,才會(huì)有出色的表現(xiàn),java中沒有哪種鎖能夠在所有情況下都能有出色的效率,引入這么多鎖的原因就是為了應(yīng)對(duì)不同的情況;
前面講到了重量級(jí)鎖是悲觀鎖的一種,自旋鎖、輕量級(jí)鎖與偏向鎖屬于樂觀鎖,所以現(xiàn)在你就能夠大致理解了他們的適用范圍,但是具體如何使用這幾種鎖呢,就要看后面的具體分析他們的特性;
自旋鎖原理非常簡(jiǎn)單,如果持有鎖的線程能在很短時(shí)間內(nèi)釋放鎖資源,那么那些等待競(jìng)爭(zhēng)鎖的線程就不需要做內(nèi)核態(tài)和用戶態(tài)之間的切換進(jìn)入阻塞掛起狀態(tài),它們只需要等一等(自旋),等持有鎖的線程釋放鎖后即可立即獲取鎖,這樣就避免用戶線程和內(nèi)核的切換的消耗。
但是線程自旋是需要消耗cup的,說白了就是讓cup在做無用功,線程不能一直占用cup自旋做無用功,所以需要設(shè)定一個(gè)自旋等待的最大時(shí)間。
如果持有鎖的線程執(zhí)行的時(shí)間超過自旋等待的最大時(shí)間扔沒有釋放鎖,就會(huì)導(dǎo)致其它爭(zhēng)用鎖的線程在最大等待時(shí)間內(nèi)還是獲取不到鎖,這時(shí)爭(zhēng)用線程會(huì)停止自旋進(jìn)入阻塞狀態(tài)。
自旋鎖盡可能的減少線程的阻塞,這對(duì)于鎖的競(jìng)爭(zhēng)不激烈,且占用鎖時(shí)間非常短的代碼塊來說性能能大幅度的提升,因?yàn)樽孕南臅?huì)小于線程阻塞掛起操作的消耗!
但是如果鎖的競(jìng)爭(zhēng)激烈,或者持有鎖的線程需要長時(shí)間占用鎖執(zhí)行同步塊,這時(shí)候就不適合使用自旋鎖了,因?yàn)樽孕i在獲取鎖前一直都是占用cpu做無用功,占著XX不XX,線程自旋的消耗大于線程阻塞掛起操作的消耗,其它需要cup的線程又不能獲取到cpu,造成cpu的浪費(fèi)。
自旋鎖的目的是為了占著CPU的資源不釋放,等到獲取到鎖立即進(jìn)行處理。但是如何去選擇自旋的執(zhí)行時(shí)間呢?如果自旋執(zhí)行時(shí)間太長,會(huì)有大量的線程處于自旋狀態(tài)占用CPU資源,進(jìn)而會(huì)影響整體系統(tǒng)的性能。因此自旋的周期選的額外重要!
JVM對(duì)于自旋周期的選擇,jdk1.5這個(gè)限度是一定的寫死的,在1.6引入了適應(yīng)性自旋鎖,適應(yīng)性自旋鎖意味著自旋的時(shí)間不在是固定的了,而是由前一次在同一個(gè)鎖上的自旋時(shí)間以及鎖的擁有者的狀態(tài)來決定,基本認(rèn)為一個(gè)線程上下文切換的時(shí)間是最佳的一個(gè)時(shí)間,同時(shí)JVM還針對(duì)當(dāng)前CPU的負(fù)荷情況做了較多的優(yōu)化
如果平均負(fù)載小于CPUs則一直自旋
如果有超過(CPUs/2)個(gè)線程正在自旋,則后來線程直接阻塞
如果正在自旋的線程發(fā)現(xiàn)Owner發(fā)生了變化則延遲自旋時(shí)間(自旋計(jì)數(shù))或進(jìn)入阻塞
如果CPU處于節(jié)電模式則停止自旋
自旋時(shí)間的最壞情況是CPU的存儲(chǔ)延遲(CPU A存儲(chǔ)了一個(gè)數(shù)據(jù),到CPU B得知這個(gè)數(shù)據(jù)直接的時(shí)間差)
自旋時(shí)會(huì)適當(dāng)放棄線程優(yōu)先級(jí)之間的差異
JDK1.6中-XX:+UseSpinning開啟;
JDK1.7后,去掉此參數(shù),由jvm控制;
在JDK1.5之前都是使用synchronized關(guān)鍵字保證同步的,Synchronized的作用相信大家都已經(jīng)非常熟悉了;
它可以把任意一個(gè)非NULL的對(duì)象當(dāng)作鎖。
作用于方法時(shí),鎖住的是對(duì)象的實(shí)例(this);
當(dāng)作用于靜態(tài)方法時(shí),鎖住的是Class實(shí)例,又因?yàn)镃lass的相關(guān)數(shù)據(jù)存儲(chǔ)在永久帶PermGen(jdk1.8則是metaspace),永久帶是全局共享的,因此靜態(tài)方法鎖相當(dāng)于類的一個(gè)全局鎖,會(huì)鎖所有調(diào)用該方法的線程;
synchronized作用于一個(gè)對(duì)象實(shí)例時(shí),鎖住的是所有以該對(duì)象為鎖的代碼塊。
實(shí)現(xiàn)如下圖所示;
它有多個(gè)隊(duì)列,當(dāng)多個(gè)線程一起訪問某個(gè)對(duì)象監(jiān)視器的時(shí)候,對(duì)象監(jiān)視器會(huì)將這些線程存儲(chǔ)在不同的容器中。
Contention List:競(jìng)爭(zhēng)隊(duì)列,所有請(qǐng)求鎖的線程首先被放在這個(gè)競(jìng)爭(zhēng)隊(duì)列中;
Entry List:Contention List中那些有資格成為候選資源的線程被移動(dòng)到Entry List中;
Wait Set:哪些調(diào)用wait方法被阻塞的線程被放置在這里;
OnDeck:任意時(shí)刻,最多只有一個(gè)線程正在競(jìng)爭(zhēng)鎖資源,該線程被成為OnDeck;
Owner:當(dāng)前已經(jīng)獲取到所資源的線程被稱為Owner;
!Owner:當(dāng)前釋放鎖的線程。
JVM每次從隊(duì)列的尾部取出一個(gè)數(shù)據(jù)用于鎖競(jìng)爭(zhēng)候選者(OnDeck),但是并發(fā)情況下,ContentionList會(huì)被大量的并發(fā)線程進(jìn)行CAS訪問,為了降低對(duì)尾部元素的競(jìng)爭(zhēng),JVM會(huì)將一部分線程移動(dòng)到EntryList中作為候選競(jìng)爭(zhēng)線程。Owner線程會(huì)在unlock時(shí),將ContentionList中的部分線程遷移到EntryList中,并指定EntryList中的某個(gè)線程為OnDeck線程(一般是最先進(jìn)去的那個(gè)線程)。Owner線程并不直接把鎖傳遞給OnDeck線程,而是把鎖競(jìng)爭(zhēng)的權(quán)利交給OnDeck,OnDeck需要重新競(jìng)爭(zhēng)鎖。這樣雖然犧牲了一些公平性,但是能極大的提升系統(tǒng)的吞吐量,在JVM中,也把這種選擇行為稱之為“競(jìng)爭(zhēng)切換”。
OnDeck線程獲取到鎖資源后會(huì)變?yōu)镺wner線程,而沒有得到鎖資源的仍然停留在EntryList中。如果Owner線程被wait方法阻塞,則轉(zhuǎn)移到WaitSet隊(duì)列中,直到某個(gè)時(shí)刻通過notify或者notifyAll喚醒,會(huì)重新進(jìn)去EntryList中。
處于ContentionList、EntryList、WaitSet中的線程都處于阻塞狀態(tài),該阻塞是由操作系統(tǒng)來完成的(Linux內(nèi)核下采用pthread_mutex_lock內(nèi)核函數(shù)實(shí)現(xiàn)的)。
Synchronized是非公平鎖。Synchronized在線程進(jìn)入ContentionList時(shí),等待的線程會(huì)先嘗試自旋獲取鎖,如果獲取不到就進(jìn)入ContentionList,這明顯對(duì)于已經(jīng)進(jìn)入隊(duì)列的線程是不公平的,還有一個(gè)不公平的事情就是自旋獲取鎖的線程還可能直接搶占OnDeck線程的鎖資源。
Java偏向鎖(Biased Locking)是Java6引入的一項(xiàng)多線程優(yōu)化。
偏向鎖,顧名思義,它會(huì)偏向于第一個(gè)訪問鎖的線程,如果在運(yùn)行過程中,同步鎖只有一個(gè)線程訪問,不存在多線程爭(zhēng)用的情況,則線程是不需要觸發(fā)同步的,這種情況下,就會(huì)給線程加一個(gè)偏向鎖。
如果在運(yùn)行過程中,遇到了其他線程搶占鎖,則持有偏向鎖的線程會(huì)被掛起,JVM會(huì)消除它身上的偏向鎖,將鎖恢復(fù)到標(biāo)準(zhǔn)的輕量級(jí)鎖。
它通過消除資源無競(jìng)爭(zhēng)情況下的同步原語,進(jìn)一步提高了程序的運(yùn)行性能。
訪問Mark Word中偏向鎖的標(biāo)識(shí)是否設(shè)置成1,鎖標(biāo)志位是否為01,確認(rèn)為可偏向狀態(tài)。
如果為可偏向狀態(tài),則測(cè)試線程ID是否指向當(dāng)前線程,如果是,進(jìn)入步驟5,否則進(jìn)入步驟3。
如果線程ID并未指向當(dāng)前線程,則通過CAS操作競(jìng)爭(zhēng)鎖。如果競(jìng)爭(zhēng)成功,則將Mark Word中線程ID設(shè)置為當(dāng)前線程ID,然后執(zhí)行5;如果競(jìng)爭(zhēng)失敗,執(zhí)行4。
如果CAS獲取偏向鎖失敗,則表示有競(jìng)爭(zhēng)。當(dāng)?shù)竭_(dá)全局安全點(diǎn)(safepoint)時(shí)獲得偏向鎖的線程被掛起,偏向鎖升級(jí)為輕量級(jí)鎖,然后被阻塞在安全點(diǎn)的線程繼續(xù)往下執(zhí)行同步代碼。(撤銷偏向鎖的時(shí)候會(huì)導(dǎo)致stop the word)
執(zhí)行同步代碼。
注意:第四步中到達(dá)安全點(diǎn)safepoint會(huì)導(dǎo)致stop the word,時(shí)間很短。
偏向鎖的撤銷在上述第四步驟中有提到。偏向鎖只有遇到其他線程嘗試競(jìng)爭(zhēng)偏向鎖時(shí),持有偏向鎖的線程才會(huì)釋放鎖,線程不會(huì)主動(dòng)去釋放偏向鎖。偏向鎖的撤銷,需要等待全局安全點(diǎn)(在這個(gè)時(shí)間點(diǎn)上沒有字節(jié)碼正在執(zhí)行),它會(huì)首先暫停擁有偏向鎖的線程,判斷鎖對(duì)象是否處于被鎖定狀態(tài),撤銷偏向鎖后恢復(fù)到未鎖定(標(biāo)志位為“01”)或輕量級(jí)鎖(標(biāo)志位為“00”)的狀態(tài)。
始終只有一個(gè)線程在執(zhí)行同步塊,在它沒有執(zhí)行完釋放鎖之前,沒有其它線程去執(zhí)行同步塊,在鎖無競(jìng)爭(zhēng)的情況下使用,一旦有了競(jìng)爭(zhēng)就升級(jí)為輕量級(jí)鎖,升級(jí)為輕量級(jí)鎖的時(shí)候需要撤銷偏向鎖,撤銷偏向鎖的時(shí)候會(huì)導(dǎo)致stop the word操作;
在有鎖的競(jìng)爭(zhēng)時(shí),偏向鎖會(huì)多做很多額外操作,尤其是撤銷偏向所的時(shí)候會(huì)導(dǎo)致進(jìn)入安全點(diǎn),安全點(diǎn)會(huì)導(dǎo)致stw,導(dǎo)致性能下降,這種情況下應(yīng)當(dāng)禁用;
要查看安全點(diǎn)停頓,可以打開安全點(diǎn)日志,通過設(shè)置JVM參數(shù) -XX:+PrintGCApplicationStoppedTime 會(huì)打出系統(tǒng)停止的時(shí)間,添加-XX:+PrintSafepointStatistics -XX:PrintSafepointStatisticsCount=1 這兩個(gè)參數(shù)會(huì)打印出詳細(xì)信息,可以查看到使用偏向鎖導(dǎo)致的停頓,時(shí)間非常短暫,但是爭(zhēng)用嚴(yán)重的情況下,停頓次數(shù)也會(huì)非常多;
注意:安全點(diǎn)日志不能一直打開:
1. 安全點(diǎn)日志默認(rèn)輸出到stdout,一是stdout日志的整潔性,二是stdout所重定向的文件如果不在/dev/shm,可能被鎖。
2. 對(duì)于一些很短的停頓,比如取消偏向鎖,打印的消耗比停頓本身還大。
3. 安全點(diǎn)日志是在安全點(diǎn)內(nèi)打印的,本身加大了安全點(diǎn)的停頓時(shí)間。
所以安全日志應(yīng)該只在問題排查時(shí)打開。
如果在生產(chǎn)系統(tǒng)上要打開,再再增加下面四個(gè)參數(shù):
-XX:+UnlockDiagnosticVMOptions -XX: -DisplayVMOutput -XX:+LogVMOutput -XX:LogFile=/dev/shm/vm.log
打開Diagnostic(只是開放了更多的flag可選,不會(huì)主動(dòng)激活某個(gè)flag),關(guān)掉輸出VM日志到stdout,輸出到獨(dú)立文件,/dev/shm目錄(內(nèi)存文件系統(tǒng))。
此日志分三部分:
第一部分是時(shí)間戳,VM Operation的類型
第二部分是線程概況,被中括號(hào)括起來
total: 安全點(diǎn)里的總線程數(shù)
initially_running: 安全點(diǎn)時(shí)開始時(shí)正在運(yùn)行狀態(tài)的線程數(shù)
wait_to_block: 在VM Operation開始前需要等待其暫停的線程數(shù)
第三部分是到達(dá)安全點(diǎn)時(shí)的各個(gè)階段以及執(zhí)行操作所花的時(shí)間,其中最重要的是vmop
spin: 等待線程響應(yīng)safepoint號(hào)召的時(shí)間;
block: 暫停所有線程所用的時(shí)間;
sync: 等于 spin+block,這是從開始到進(jìn)入安全點(diǎn)所耗的時(shí)間,可用于判斷進(jìn)入安全點(diǎn)耗時(shí);
cleanup: 清理所用時(shí)間;
vmop: 真正執(zhí)行VM Operation的時(shí)間。
可見,那些很多但又很短的安全點(diǎn),全都是RevokeBias, 高并發(fā)的應(yīng)用會(huì)禁用掉偏向鎖。
開啟偏向鎖:-XX:+UseBiasedLocking -XX:BiasedLockingStartupDelay=0
關(guān)閉偏向鎖:-XX:-UseBiasedLocking
輕量級(jí)鎖是由偏向所升級(jí)來的,偏向鎖運(yùn)行在一個(gè)線程進(jìn)入同步塊的情況下,當(dāng)?shù)诙€(gè)線程加入鎖爭(zhēng)用的時(shí)候,偏向鎖就會(huì)升級(jí)為輕量級(jí)鎖;
輕量級(jí)鎖的加鎖過程:
在代碼進(jìn)入同步塊的時(shí)候,如果同步對(duì)象鎖狀態(tài)為無鎖狀態(tài)(鎖標(biāo)志位為“01”狀態(tài),是否為偏向鎖為“0”),虛擬機(jī)首先將在當(dāng)前線程的棧幀中建立一個(gè)名為鎖記錄(Lock Record)的空間,用于存儲(chǔ)鎖對(duì)象目前的Mark Word的拷貝,官方稱之為 Displaced Mark Word。這時(shí)候線程堆棧與對(duì)象頭的狀態(tài)如圖:
所示。
拷貝對(duì)象頭中的Mark Word復(fù)制到鎖記錄中;
拷貝成功后,虛擬機(jī)將使用CAS操作嘗試將對(duì)象的Mark Word更新為指向Lock Record的指針,并將Lock record里的owner指針指向object mark word。如果更新成功,則執(zhí)行步驟4,否則執(zhí)行步驟5。
如果這個(gè)更新動(dòng)作成功了,那么這個(gè)線程就擁有了該對(duì)象的鎖,并且對(duì)象Mark Word的鎖標(biāo)志位設(shè)置為“00”,即表示此對(duì)象處于輕量級(jí)鎖定狀態(tài),這時(shí)候線程堆棧與對(duì)象頭的狀態(tài)如圖所示。
如果這個(gè)更新操作失敗了,虛擬機(jī)首先會(huì)檢查對(duì)象的Mark Word是否指向當(dāng)前線程的棧幀,如果是就說明當(dāng)前線程已經(jīng)擁有了這個(gè)對(duì)象的鎖,那就可以直接進(jìn)入同步塊繼續(xù)執(zhí)行。否則說明多個(gè)線程競(jìng)爭(zhēng)鎖,輕量級(jí)鎖就要膨脹為重量級(jí)鎖,鎖標(biāo)志的狀態(tài)值變?yōu)椤?0”,Mark Word中存儲(chǔ)的就是指向重量級(jí)鎖(互斥量)的指針,后面等待鎖的線程也要進(jìn)入阻塞狀態(tài)。 而當(dāng)前線程便嘗試使用自旋來獲取鎖,自旋就是為了不讓線程阻塞,而采用循環(huán)去獲取鎖的過程。
釋放鎖線程視角:由輕量鎖切換到重量鎖,是發(fā)生在輕量鎖釋放鎖的期間,之前在獲取鎖的時(shí)候它拷貝了鎖對(duì)象頭的markword,在釋放鎖的時(shí)候如果它發(fā)現(xiàn)在它持有鎖的期間有其他線程來嘗試獲取鎖了,并且該線程對(duì)markword做了修改,兩者比對(duì)發(fā)現(xiàn)不一致,則切換到重量鎖。
因?yàn)橹亓考?jí)鎖被修改了,所有display mark word和原來的markword不一樣了。
怎么補(bǔ)救,就是進(jìn)入mutex前,compare一下obj的markword狀態(tài)。確認(rèn)該markword是否被其他線程持有。
此時(shí)如果線程已經(jīng)釋放了markword,那么通過CAS后就可以直接進(jìn)入線程,無需進(jìn)入mutex,就這個(gè)作用。
嘗試獲取鎖線程視角:如果線程嘗試獲取鎖的時(shí)候,輕量鎖正被其他線程占有,那么它就會(huì)修改markword,修改重量級(jí)鎖,表示該進(jìn)入重量鎖了。
還有一個(gè)注意點(diǎn):等待輕量鎖的線程不會(huì)阻塞,它會(huì)一直自旋等待鎖,并如上所說修改markword。
這就是自旋鎖,嘗試獲取鎖的線程,在沒有獲得鎖的時(shí)候,不被掛起,而轉(zhuǎn)而去執(zhí)行一個(gè)空循環(huán),即自旋。在若干個(gè)自旋后,如果還沒有獲得鎖,則才被掛起,獲得鎖,則執(zhí)行代碼。
上面幾種鎖都是JVM自己內(nèi)部實(shí)現(xiàn),當(dāng)我們執(zhí)行synchronized同步塊的時(shí)候jvm會(huì)根據(jù)啟用的鎖和當(dāng)前線程的爭(zhēng)用情況,決定如何執(zhí)行同步操作;
在所有的鎖都啟用的情況下線程進(jìn)入臨界區(qū)時(shí)會(huì)先去獲取偏向鎖,如果已經(jīng)存在偏向鎖了,則會(huì)嘗試獲取輕量級(jí)鎖,如果以上兩種都失敗,則啟用自旋鎖,如果自旋也沒有獲取到鎖,則使用重量級(jí)鎖,沒有獲取到鎖的線程阻塞掛起,直到持有鎖的線程執(zhí)行完同步塊喚醒他們;
偏向鎖是在無鎖爭(zhēng)用的情況下使用的,也就是同步開在當(dāng)前線程沒有執(zhí)行完之前,沒有其它線程會(huì)執(zhí)行該同步快,一旦有了第二個(gè)線程的爭(zhēng)用,偏向鎖就會(huì)升級(jí)為輕量級(jí)鎖,一點(diǎn)有兩個(gè)以上線程爭(zhēng)用,就會(huì)升級(jí)為重量級(jí)鎖;
如果線程爭(zhēng)用激烈,那么應(yīng)該禁用偏向鎖。
以上介紹的鎖不是我們代碼中能夠控制的,但是借鑒上面的思想,我們可以優(yōu)化我們自己線程的加鎖操作;
不需要同步執(zhí)行的代碼,能不放在同步快里面執(zhí)行就不要放在同步快內(nèi),可以讓鎖盡快釋放;
它的思想是將物理上的一個(gè)鎖,拆成邏輯上的多個(gè)鎖,增加并行度,從而降低鎖競(jìng)爭(zhēng)。它的思想也是用空間來換時(shí)間;
java中很多數(shù)據(jù)結(jié)構(gòu)都是采用這種方法提高并發(fā)操作的效率:
java中的ConcurrentHashMap在jdk1.8之前的版本,使用一個(gè)Segment 數(shù)組
Segment< K,V >[] segments
1
1
Segment繼承自ReenTrantLock,所以每個(gè)Segment就是個(gè)可重入鎖,每個(gè)Segment 有一個(gè)HashEntry< K,V >數(shù)組用來存放數(shù)據(jù),put操作時(shí),先確定往哪個(gè)Segment放數(shù)據(jù),只需要鎖定這個(gè)Segment,執(zhí)行put,其它的Segment不會(huì)被鎖定;所以數(shù)組中有多少個(gè)Segment就允許同一時(shí)刻多少個(gè)線程存放數(shù)據(jù),這樣增加了并發(fā)能力。
LongAdder 實(shí)現(xiàn)思路也類似ConcurrentHashMap,LongAdder有一個(gè)根據(jù)當(dāng)前并發(fā)狀況動(dòng)態(tài)改變的Cell數(shù)組,Cell對(duì)象里面有一個(gè)long類型的value用來存儲(chǔ)值;
開始沒有并發(fā)爭(zhēng)用的時(shí)候或者是cells數(shù)組正在初始化的時(shí)候,會(huì)使用cas來將值累加到成員變量的base上,在并發(fā)爭(zhēng)用的情況下,LongAdder會(huì)初始化cells數(shù)組,在Cell數(shù)組中選定一個(gè)Cell加鎖,數(shù)組有多少個(gè)cell,就允許同時(shí)有多少線程進(jìn)行修改,最后將數(shù)組中每個(gè)Cell中的value相加,在加上base的值,就是最終的值;cell數(shù)組還能根據(jù)當(dāng)前線程爭(zhēng)用情況進(jìn)行擴(kuò)容,初始長度為2,每次擴(kuò)容會(huì)增長一倍,直到擴(kuò)容到大于等于cpu數(shù)量就不再擴(kuò)容;
LinkedBlockingQueue也體現(xiàn)了這樣的思想,在隊(duì)列頭入隊(duì),在隊(duì)列尾出隊(duì),入隊(duì)和出隊(duì)使用不同的鎖,相對(duì)于LinkedBlockingArray只有一個(gè)鎖效率要高;
拆鎖的粒度不能無限拆,最多可以將一個(gè)鎖拆為當(dāng)前cup數(shù)量個(gè)鎖即可;
大部分情況下我們是要讓鎖的粒度最小化,鎖的粗化則是要增大鎖的粒度;
在以下場(chǎng)景下需要粗話鎖的粒度:
假如有一個(gè)循環(huán),循環(huán)內(nèi)的操作需要加鎖,我們應(yīng)該把鎖放到循環(huán)外面,否則每次進(jìn)出循環(huán),都進(jìn)出一次臨界區(qū),效率是非常差的;
ReentrantReadWriteLock 是一個(gè)讀寫鎖,讀操作加讀鎖,可以并發(fā)讀,寫操作使用寫鎖,只能單線程寫;
除了我們?cè)俅a中使用的同步鎖和jvm自己內(nèi)置的同步鎖外,還有一種隱藏的鎖就是緩存行,它也被稱為性能殺手。
在多核cup的處理器中,每個(gè)cup都有自己獨(dú)占的一級(jí)緩存、二級(jí)緩存,甚至還有一個(gè)共享的三級(jí)緩存,為了提高性能,cpu讀取數(shù)據(jù)是以緩存行為最小單元讀取的;32位的cpu緩存行為32字節(jié),64位cup的緩存行為64字節(jié),這就導(dǎo)致了一些問題。
例如,多個(gè)不需要同步的變量進(jìn)入同一個(gè)緩存行被加載到某個(gè)cup-1私有的緩存中,相當(dāng)于是對(duì)主內(nèi)存變量的一個(gè)拷貝,也相當(dāng)于變相的將在同一個(gè)緩存行中的變量加了一把鎖,這個(gè)緩存行中任何一個(gè)變量發(fā)生了變化,當(dāng)cup-2需要讀取這個(gè)緩存行時(shí),就需要先將cup-1中被改變了的整個(gè)緩存行更新回主存(即使其它變量沒有更改),然后cup-2才能夠讀取,而cup-2可能需要更改這個(gè)緩存行的變量與cpu-1已經(jīng)更改的緩存行中的變量是不一樣的,所以這相當(dāng)于給幾個(gè)毫不相關(guān)的變量加了一把同步鎖;
為了防止偽共享,不同jdk版本實(shí)現(xiàn)方式是不一樣的:
1. 在jdk1.7之前會(huì) 將需要獨(dú)占緩存行的變量前后添加一組long類型的變量;
2. 在jdk1.7因?yàn)閖vm會(huì)將這些沒有用到的變量優(yōu)化掉,所以采用繼承一個(gè)聲明了好多l(xiāng)ong變量的類的方式來實(shí)現(xiàn);
3. 在jdk1.8中通過添加sun.misc.Contended注解來解決這個(gè)問題,若要使該注解有效必須在jvm中添加以下參數(shù):
-XX:-RestrictContended
sun.misc.Contended注解會(huì)在變量前面添加128字節(jié)的padding將當(dāng)前變量與其他變量進(jìn)行隔離;
關(guān)于什么是緩存行,jdk是如何避免緩存行的,網(wǎng)上有非常多的解釋,在這里就不再深入講解了;
其它方式等待著大家一起補(bǔ)充