JVM系列(三):GC算法 垃圾收集器

這篇文件將給大家介紹GC都有哪幾種算法,以及JVM都有那些垃圾回收器,它們的工作原理。

概述

垃圾收集 Garbage Collection 通常被稱為“GC”,它誕生于1960年 MIT 的 Lisp 語言,經(jīng)過半個多世紀(jì),目前已經(jīng)十分成熟了。 jvm 中,程序計數(shù)器、虛擬機(jī)棧、本地方法棧都是隨線程而生隨線程而滅,棧幀隨著方法的進(jìn)入和退出做入棧和出棧操作,實現(xiàn)了自動的內(nèi)存清理,因此,我們的內(nèi)存垃圾回收主要集中于 java 堆和方法區(qū)中,在程序運行期間,這部分內(nèi)存的分配和使用都是動態(tài)的。

對象存活判斷

判斷對象是否存活一般有兩種方式:

引用計數(shù):每個對象有一個引用計數(shù)屬性,新增一個引用時計數(shù)加1,引用釋放時計數(shù)減1,計數(shù)為0時可以回收。此方法簡單,無法解決對象相互循環(huán)引用的問題。
可達(dá)性分析(Reachability Analysis):從GC Roots開始向下搜索,搜索所走過的路徑稱為引用鏈。當(dāng)一個對象到GC Roots沒有任何引用鏈相連時,則證明此對象是不可用的,不可達(dá)對象。

在Java語言中,GC Roots包括:

  • 虛擬機(jī)棧中引用的對象。
  • 方法區(qū)中類靜態(tài)屬性實體引用的對象。
  • 方法區(qū)中常量引用的對象。
  • 本地方法棧中JNI引用的對象。

垃圾收集算法

標(biāo)記-清除算法

“標(biāo)記-清除”(Mark-Sweep)算法,如它的名字一樣,算法分為“標(biāo)記”和“清除”兩個階段:首先標(biāo)記出所有需要回收的對象,在標(biāo)記完成后統(tǒng)一回收掉所有被標(biāo)記的對象。之所以說它是最基礎(chǔ)的收集算法,是因為后續(xù)的收集算法都是基于這種思路并對其缺點進(jìn)行改進(jìn)而得到的。

它的主要缺點有兩個:一個是效率問題,標(biāo)記和清除過程的效率都不高;另外一個是空間問題,標(biāo)記清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片,空間碎片太多可能會導(dǎo)致,當(dāng)程序在以后的運行過程中需要分配較大對象時無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)另一次垃圾收集動作。

標(biāo)記-清除算法

復(fù)制算法

“復(fù)制”(Copying)的收集算法,它將可用內(nèi)存按容量劃分為大小相等的兩塊,每次只使用其中的一塊。當(dāng)這一塊的內(nèi)存用完了,就將還存活著的對象復(fù)制到另外一塊上面,然后再把已使用過的內(nèi)存空間一次清理掉。

這樣使得每次都是對其中的一塊進(jìn)行內(nèi)存回收,內(nèi)存分配時也就不用考慮內(nèi)存碎片等復(fù)雜情況,只要移動堆頂指針,按順序分配內(nèi)存即可,實現(xiàn)簡單,運行高效。只是這種算法的代價是將內(nèi)存縮小為原來的一半,持續(xù)復(fù)制長生存期的對象則導(dǎo)致效率降低。

復(fù)制算法

標(biāo)記-壓縮算法

復(fù)制收集算法在對象存活率較高時就要執(zhí)行較多的復(fù)制操作,效率將會變低。更關(guān)鍵的是,如果不想浪費50%的空間,就需要有額外的空間進(jìn)行分配擔(dān)保,以應(yīng)對被使用的內(nèi)存中所有對象都100%存活的極端情況,所以在老年代一般不能直接選用這種算法。

根據(jù)老年代的特點,有人提出了另外一種“標(biāo)記-整理”(Mark-Compact)算法,標(biāo)記過程仍然與“標(biāo)記-清除”算法一樣,但后續(xù)步驟不是直接對可回收對象進(jìn)行清理,而是讓所有存活的對象都向一端移動,然后直接清理掉端邊界以外的內(nèi)存。

標(biāo)記-壓縮算法

分代收集算法

GC分代的基本假設(shè):絕大部分對象的生命周期都非常短暫,存活時間短。

“分代收集”(Generational Collection)算法,把Java堆分為新生代和老年代,這樣就可以根據(jù)各個年代的特點采用最適當(dāng)?shù)氖占惴āT谛律?,每次垃圾收集時都發(fā)現(xiàn)有大批對象死去,只有少量存活,那就選用復(fù)制算法,只需要付出少量存活對象的復(fù)制成本就可以完成收集。而老年代中因為對象存活率高、沒有額外空間對它進(jìn)行分配擔(dān)保,就必須使用“標(biāo)記-清理”或“標(biāo)記-整理”算法來進(jìn)行回收。

垃圾收集器

如果說收集算法是內(nèi)存回收的方法論,垃圾收集器就是內(nèi)存回收的具體實現(xiàn)

Serial收集器

串行收集器是最古老,最穩(wěn)定以及效率高的收集器,可能會產(chǎn)生較長的停頓,只使用一個線程去回收。新生代、老年代使用串行回收;新生代復(fù)制算法、老年代標(biāo)記-壓縮;垃圾收集的過程中會Stop The World(服務(wù)暫停)

參數(shù)控制:-XX:+UseSerialGC 串行收集器

Serial收集器

ParNew收集器 ParNew收集器其實就是Serial收集器的多線程版本。新生代并行,老年代串行;新生代復(fù)制算法、老年代標(biāo)記-壓縮

參數(shù)控制:

-XX:+UseParNewGC ParNew收集器
-XX:ParallelGCThreads 限制線程數(shù)量

ParNew收集器

Parallel收集器

Parallel Scavenge收集器類似ParNew收集器,Parallel收集器更關(guān)注系統(tǒng)的吞吐量??梢酝ㄟ^參數(shù)來打開自適應(yīng)調(diào)節(jié)策略,虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或最大的吞吐量;也可以通過參數(shù)控制GC的時間不大于多少毫秒或者比例;新生代復(fù)制算法、老年代標(biāo)記-壓縮

參數(shù)控制:-XX:+UseParallelGC 使用Parallel收集器+ 老年代串行

Parallel Old 收集器

Parallel Old是Parallel Scavenge收集器的老年代版本,使用多線程和“標(biāo)記-整理”算法。這個收集器是在JDK 1.6中才開始提供

參數(shù)控制: -XX:+UseParallelOldGC 使用Parallel收集器+ 老年代并行

CMS收集器

CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器。目前很大一部分的Java應(yīng)用都集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)的服務(wù)端上,這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度,希望系統(tǒng)停頓時間最短,以給用戶帶來較好的體驗。

從名字(包含“Mark Sweep”)上就可以看出CMS收集器是基于“標(biāo)記-清除”算法實現(xiàn)的,它的運作過程相對于前面幾種收集器來說要更復(fù)雜一些,整個過程分為4個步驟,包括:

  • 初始標(biāo)記(CMS initial mark)
  • 并發(fā)標(biāo)記(CMS concurrent mark)
  • 重新標(biāo)記(CMS remark)
  • 并發(fā)清除(CMS concurrent sweep)

其中初始標(biāo)記、重新標(biāo)記這兩個步驟仍然需要“Stop The World”。初始標(biāo)記僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象,速度很快,并發(fā)標(biāo)記階段就是進(jìn)行GC Roots Tracing的過程,而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間,因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些,但遠(yuǎn)比并發(fā)標(biāo)記的時間短。

由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中,收集器線程都可以與用戶線程一起工作,所以總體上來說,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)地執(zhí)行。老年代收集器(新生代使用ParNew)

優(yōu)點: 并發(fā)收集、低停頓
缺點: 產(chǎn)生大量空間碎片、并發(fā)階段會降低吞吐量

參數(shù)控制:

-XX:+UseConcMarkSweepGC 使用CMS收集器
-XX:+UseCMSCompactAtFullCollection Full GC后,進(jìn)行一次碎片整理;整理過程是獨占的,會引起停頓時間變長
-XX:+CMSFullGCsBeforeCompaction 設(shè)置進(jìn)行幾次Full GC后,進(jìn)行一次碎片整理
-XX:ParallelCMSThreads 設(shè)定CMS的線程數(shù)量(一般情況約等于可用CPU數(shù)量)

CMS收集器

G1收集器

G1是目前技術(shù)發(fā)展的最前沿成果之一,HotSpot開發(fā)團(tuán)隊賦予它的使命是未來可以替換掉JDK1.5中發(fā)布的CMS收集器。與CMS收集器相比G1收集器有以下特點:

  1. 空間整合,G1收集器采用標(biāo)記整理算法,不會產(chǎn)生內(nèi)存空間碎片。分配大對象時不會因為無法找到連續(xù)空間而提前觸發(fā)下一次GC。
  2. 可預(yù)測停頓,這是G1的另一大優(yōu)勢,降低停頓時間是G1和CMS的共同關(guān)注點,但G1除了追求低停頓外,還能建立可預(yù)測的停頓時間模型,能讓使用者明確指定在一個長度為N毫秒的時間片段內(nèi),消耗在垃圾收集上的時間不得超過N毫秒,這幾乎已經(jīng)是實時Java(RTSJ)的垃圾收集器的特征了。

上面提到的垃圾收集器,收集的范圍都是整個新生代或者老年代,而G1不再是這樣。使用G1收集器時,Java堆的內(nèi)存布局與其他收集器有很大差別,它將整個Java堆劃分為多個大小相等的獨立區(qū)域(Region),雖然還保留有新生代和老年代的概念,但新生代和老年代不再是物理隔閡了,它們都是一部分(可以不連續(xù))Region的集合。

G1收集器

G1的新生代收集跟ParNew類似,當(dāng)新生代占用達(dá)到一定比例的時候,開始出發(fā)收集。和CMS類似,G1收集器收集老年代對象會有短暫停頓。

收集步驟:

  • 1、標(biāo)記階段,首先初始標(biāo)記(Initial-Mark),這個階段是停頓的(Stop the World Event),并且會觸發(fā)一次普通Mintor GC。對應(yīng)GC log:GC pause (young) (inital-mark)
  • 2、Root Region Scanning,程序運行過程中會回收survivor區(qū)(存活到老年代),這一過程必須在young GC之前完成。
  • 3、Concurrent Marking,在整個堆中進(jìn)行并發(fā)標(biāo)記(和應(yīng)用程序并發(fā)執(zhí)行),此過程可能被young GC中斷。在并發(fā)標(biāo)記階段,若發(fā)現(xiàn)區(qū)域?qū)ο笾械乃袑ο蠖际抢?,那個這個區(qū)域會被立即回收(圖中打X)。同時,并發(fā)標(biāo)記過程中,會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)。
Concurrent Marking
  • 4、Remark,再標(biāo)記,會有短暫停頓(STW)。再標(biāo)記階段是用來收集并發(fā)標(biāo)記階段產(chǎn)生新的垃圾(并發(fā)階段和應(yīng)用程序一同運行);G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)。

  • 5、Copy/Clean up,多線程清除失活對象,會有STW。G1將回收區(qū)域的存活對象拷貝到新區(qū)域,清除Remember Sets,并發(fā)清空回收區(qū)域并把它返回到空閑區(qū)域鏈表中。

Copy/Clean up
  • 6、復(fù)制/清除過程后,回收區(qū)域的活性對象已經(jīng)被集中回收到深藍(lán)色和深綠色區(qū)域。
復(fù)制/清除

常用的收集器組合

服務(wù)器31 新生代GC策略 老年老代GC策略 說明
組合1 Serial Serial Old Serial和Serial Old都是單線程進(jìn)行GC,特點就是GC時暫停所有應(yīng)用線程。
組合2 Serial CMS+Serial Old CMS(Concurrent Mark Sweep)是并發(fā)GC,實現(xiàn)GC線程和應(yīng)用線程并發(fā)工作,不需要暫停所有應(yīng)用線程。另外,當(dāng)CMS進(jìn)行GC失敗時,會自動使用Serial Old策略進(jìn)行GC。
組合3 ParNew CMS 使用-XX:+UseParNewGC選項來開啟。ParNew是Serial的并行版本,可以指定GC線程數(shù),默認(rèn)GC線程數(shù)為CPU的數(shù)量??梢允褂?code>-XX:ParallelGCThreads選項指定GC的線程數(shù)。如果指定了選項-XX:+UseConcMarkSweepGC選項,則新生代默認(rèn)使用ParNew GC策略。
組合4 ParNew Serial Old 使用-XX:+UseParNewGC選項來開啟。新生代使用ParNew GC策略,年老代默認(rèn)使用Serial Old GC策略。
組合5 Parallel Scavenge Serial Old Parallel Scavenge策略主要是關(guān)注一個可控的吞吐量:應(yīng)用程序運行時間 / (應(yīng)用程序運行時間 + GC時間),可見這會使得CPU的利用率盡可能的高,適用于后臺持久運行的應(yīng)用程序,而不適用于交互較多的應(yīng)用程序。
組合6 Parallel Scavenge Parallel Old Parallel Old是Serial Old的并行版本
組合7 G1GC G1GC -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC #開啟;
-XX:MaxGCPauseMillis =50 #暫停時間目標(biāo);
-XX:GCPauseIntervalMillis =200 #暫停間隔目標(biāo);
-XX:+G1YoungGenSize=512m #年輕代大?。?br>-XX:SurvivorRatio=6#幸存區(qū)比例
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容