Java垃圾收集器

?若果說收集算法是內(nèi)存會說的方法論,那么垃圾收集器就是內(nèi)存回收的具體實(shí)現(xiàn)。Java虛擬機(jī)中對垃圾收集器應(yīng)該如何實(shí)現(xiàn)并沒有任何規(guī)定,因此不同的廠商、不同版本的虛擬機(jī)所提供的垃圾收集器可能會有很大差別,并且一般都會提供參數(shù)供用戶根據(jù)自己的應(yīng)用特點(diǎn)和要求組合使用各個年代所使用的收集器。HotSpot虛擬機(jī)包含的收集器入下圖所示:

HotSpot垃圾收集器

?上圖展示了7種作用于不同分代的收集器,如果兩個收集器之間有連線,就說明他們可以搭配使用;虛擬機(jī)所處的區(qū)域,則表示它是屬于新生代收集器還是老年代收集器。Hotspot實(shí)現(xiàn)了如此多的收集器,正是因?yàn)槟壳安o完美的收集器出現(xiàn),只是選擇對具體應(yīng)用最適合的收集器。


一、Serial收集器

?Serial(串行)收集器是一個最基本的,發(fā)展歷史悠久的單線程串行收集器,它在新生代采用復(fù)制算法,老年代采用標(biāo)記-整理算法;但它的“單線程”的意義并不僅僅說明它只會使用一個CPU或者一條收集線程去完成垃圾收集工作,更重要的是它在進(jìn)行垃圾收集時,必須暫停其他所有的工作線程,直到它收集結(jié)束(“Stop The World”)。這項(xiàng)工作是由虛擬機(jī)在后臺自動發(fā)起和自動完成的,在用戶不可見的情況下把用戶正常工作的線程全部停掉,這對很多應(yīng)用來說是難以接收的。Serial/Serial Old收集器(新生代采用Serial收集器,老年代采用Serial Old收集器)的運(yùn)行過程如圖:

Serial/Serial Old收集器

?雖然“Stop The World”給用戶帶來很大的不良的體驗(yàn),但是它依然是虛擬機(jī)運(yùn)行在Client模式下的默認(rèn)新生代收集器。它也有著優(yōu)于其他收集器的地方:簡單高效(與其他收集器的單線程比),對于限定單個CPU的環(huán)境來說,Serial收集器優(yōu)于沒有線程交互的開銷,專心做垃圾收集自然可以獲得最高的單線程收集效率。


二、ParNew收集器

?ParNew收集器其實(shí)就是Serial收集器的多線程版本,除了使用多線程進(jìn)行垃圾收集之外,其余行為包括Serial收集器可用的所有控制參數(shù)(例如:-XX:SurvivorRatio、-XX:PretenureSizeThreshold、-XX:HandlePromotionFailure等)、收集算法、Stop The World、對象分配規(guī)則、回收策略等都與Serial收集器完全一樣。ParNew收集器的工作過程如圖:


ParNew/Serial Old收集器

?ParNew收集器除了使用多線程收集外,其他與Serial收集器相比并無太多創(chuàng)新之處,但它卻是許多運(yùn)行在Server模式下的虛擬機(jī)中首選的新生代收集器,其中有一個與性能無關(guān)的重要原因是,除了Serial收集器外,目前只有它能和CMS收集器(Concurrent Mark Sweep)配合工作,CMS收集器是JDK 1.5推出的一個具有劃時代意義的收集器,具體內(nèi)容將在稍后進(jìn)行介紹。

?ParNew 收集器在單CPU的環(huán)境中絕對不會有比Serial收集器有更好的效果,甚至由于存在線程交互的開銷,該收集器在通過超線程技術(shù)實(shí)現(xiàn)的兩個CPU的環(huán)境中都不能百分之百地保證可以超越。在多CPU環(huán)境下,隨著CPU的數(shù)量增加,它對于GC時系統(tǒng)資源的有效利用是很有好處的。它默認(rèn)開啟的收集線程數(shù)與CPU的數(shù)量相同,在CPU非常多的情況下可使用-XX:ParallerGCThreads參數(shù)設(shè)置。


四、 Parallel Scavenge收集器

?Parallel Scavenge收集器是一個新生代收集器,它也是使用復(fù)制算法的收集器,又是并行的多線程收集器。它的特點(diǎn)是它的關(guān)注點(diǎn)與其他收集器不同,CMS等收集器的關(guān)注點(diǎn)是盡可能地縮短垃圾收集時用戶線程的停頓時間,而Parallel Scavenge收集器的目標(biāo)是達(dá)到一個可控制的吞吐量(Throughput),也即CPU用于運(yùn)行用戶代碼的時間與CPU總消耗時間的比值,即吞吐量=運(yùn)行用戶代碼時間/(運(yùn)行用戶代碼時間 + 垃圾收集時間)。
?停頓時間越短就越適合需要與用戶交互的程序,良好的響應(yīng)速度能提升用戶體驗(yàn),而高吞吐量則可以高效率利用CPU時間,盡快完成程序的運(yùn)算任務(wù),主要適合在后臺運(yùn)算而不需要太多交互的任務(wù)。
?Parallel Scavenge收集器提供了兩個參數(shù)用于精確控制吞吐量,分別是控制最大垃圾收集停頓時間的-XX:MaxGCPauseMillis參數(shù)以及直接設(shè)置吞吐量大小的-XX:GCTimeRatio參數(shù)。
?除以上參數(shù)外,Parallel Scavenge收集器還有一個參數(shù)-XX:+UseAdaptiveSizePolicy值得關(guān)注。這是一個開關(guān)參數(shù),當(dāng)這個參數(shù)打開之后,就不需要手工指定新生代的大小(-Xmn)、Eden與Survivor區(qū)的比例(-XX:SurvivorRatio)、晉升老年代對象年齡(-XX:PretenureSizeThreshold)等細(xì)節(jié)參數(shù)了,虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運(yùn)行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或者最大的吞吐量,這種調(diào)節(jié)方式稱為GC自適應(yīng)的調(diào)整策略(GC Ergonomics)。自適應(yīng)調(diào)節(jié)策略也是Parallel Scavenge收集器與ParNew收集器的一個重要區(qū)別。


五、Serial Old收集器

?Serial Old收集器的老年代版本,它同樣是一個單線程收集器,使用“標(biāo)記-整理”算法。這個收集器的主要意義也是在于給Client模式下的虛擬機(jī)使用。如果在Server模式下,它還有兩大用途:

  • 在JDK1.5 以及之前版本(Parallel Old誕生以前)中與Parallel Scavenge收集器搭配使用。
  • 作為CMS收集器的后備預(yù)案,在并發(fā)收集發(fā)生Concurrent Mode Failure時使用。

六、Parallel Old收集器

?Parallel Old收集器時Parallel Scavenge收集器的老年代版本,使用多線程和“標(biāo)記-整理”算法。這個收集器在JDK1.6中才開始提供的,在此之前,新生代的Parallel Scavenge收集器一直處于比較尷尬的狀態(tài)。原因是,如果新生代選擇了Parallel Scavenge收集器,老年代除了Serial Old收集器外別無選擇。由于老年代Serial Old收集器在服務(wù)端應(yīng)用性能上的“拖累”,使用了Parallel Scavenge收集器也未必能在整體應(yīng)用上獲得吞吐量最大化的效果,由于單線程的老年代收集中無法充分利用服務(wù)器多CPU的處理能力。
?直到Parallel Old搜狐及其出現(xiàn)后,“吞吐量優(yōu)先”收集器終于有了比較名副其實(shí)的應(yīng)用組合,在注重吞吐量以及CPU資源敏感的場合,都可以優(yōu)先考慮Parallel Scavenge加Parallel Old收集器。Parallel Old收集器的工作過程如圖:


Parallel Scavenge/Parallel Old收集器

七、CMS收集器

?CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器。目前很大一部分的Java應(yīng)用集中在互聯(lián)網(wǎng)或者B/S系統(tǒng)的服務(wù)端上,這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度,希望停頓時間最短,以給用戶帶來較好的體驗(yàn)。CMS收集器就非常符合這類應(yīng)用的需求。
?CMS收集器時基于“標(biāo)記-清除”算法實(shí)現(xiàn)的,它的運(yùn)作過程相對于前面幾種收集器來說更復(fù)雜一些,整個過程分為四個步驟:

  • 初始標(biāo)記(CMS initial mark):僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象,速度很快,需要“Stop The World”。
  • 并發(fā)標(biāo)記(CMS concurrent mark):GC Roots Tracing的過程
  • 重新標(biāo)記(CMS remark):為了修正并發(fā)標(biāo)記期間因用戶程序繼續(xù)運(yùn)作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些,但遠(yuǎn)比并發(fā)標(biāo)記的時間短。
  • 并發(fā)清除(CMS concurrent sweep):
    ?由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程收集器線程都可以與用戶線程一起工作,所以,從總體上來說,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)執(zhí)行的。通過下圖可以比較清楚地看到CMS收集器的運(yùn)作步驟中并發(fā)和需要停頓的時間:
    CMS垃圾收集器

優(yōu)點(diǎn)

  • CMS是一款優(yōu)秀的收集器,它的主要優(yōu)點(diǎn)在名字上已經(jīng)體現(xiàn)出來了:并發(fā)收集、低停頓,因此CMS收集器也被稱為并發(fā)低停頓收集器(Concurrent Low Pause Collector)。

缺點(diǎn)

  • 對CPU資源非常敏感其實(shí),面向并發(fā)設(shè)計的程序都對CPU資源比較敏感。在并發(fā)階段,它雖然不會導(dǎo)致用戶線程停頓,但會因?yàn)檎加昧艘徊糠志€程(或者說CPU資源)而導(dǎo)致應(yīng)用程序變慢,總吞吐量會降低。CMS默認(rèn)啟動的回收線程數(shù)是(CPU數(shù)量+3)/4,也就是當(dāng)CPU在4個以上時,并發(fā)回收時垃圾收集線程不少于25%的CPU資源,并且隨著CPU數(shù)量的增加而下降。但是當(dāng)CPU不足4個時(比如2個),CMS對用戶程序的影響就可能變得很大,如果本來CPU負(fù)載就比較大,還要分出一半的運(yùn)算能力去執(zhí)行收集器線程,就可能導(dǎo)致用戶程序的執(zhí)行速度忽然降低了50%,其實(shí)也讓人無法接受。
  • 無法處理浮動垃圾(Floating Garbage) 可能出現(xiàn)“Concurrent Mode Failure”失敗而導(dǎo)致另一次Full GC的產(chǎn)生。由于CMS并發(fā)清理階段用戶線程還在運(yùn)行著,伴隨程序運(yùn)行自然就還會有新的垃圾不斷產(chǎn)生。這一部分垃圾出現(xiàn)在標(biāo)記過程之后,CMS無法再當(dāng)次收集中處理掉它們,只好留待下一次GC時再清理掉。這一部分垃圾就被稱為“浮動垃圾”。也是由于在垃圾收集階段用戶線程還需要運(yùn)行,那也就還需要預(yù)留有足夠的內(nèi)存空間給用戶線程使用,因此CMS收集器不能像其他收集器那樣等到老年代幾乎完全被填滿了再進(jìn)行收集,需要預(yù)留一部分空間提供并發(fā)收集時的程序運(yùn)作使用。
  • 標(biāo)記-清除算法導(dǎo)致的空間碎片 CMS是一款基于“標(biāo)記-清除”算法實(shí)現(xiàn)的收集器,這意味著收集結(jié)束時會有大量空間碎片產(chǎn)生??臻g碎片過多時,將會給大對象分配帶來很大麻煩,往往出現(xiàn)老年代空間剩余,但無法找到足夠大連續(xù)空間來分配當(dāng)前對象。

八、G1收集器

?G1(Garbage-First)是一款面向服務(wù)端應(yīng)用的垃圾收集器,未來可以替換掉JDK1.5中發(fā)布的CMS收集器。與其他GC收集器相比,G1具備如下特點(diǎn):

  • 并行與并發(fā):G1能充分利用CPU、多核環(huán)境下的硬件優(yōu)勢,使用多個CPU(CPU或者CPU核心)來縮短Stop-The-World停頓的時間,部分其他收集器原本需要停頓Java線程執(zhí)行的GC動作,G1收集器仍然可以通過并發(fā)的方式讓Java程序繼續(xù)執(zhí)行。
  • 分代收集:與其他收集器一樣,分代概念在G1中依然得以保留。雖然G1可以不需要其他收集器配合就能獨(dú)立管理整個GC堆,但它能夠采用不同的方式去處理新創(chuàng)建的對象和已經(jīng)存活了一段時間、熬過多次GC的舊對象以獲取更好的手機(jī)效果。
  • 空間整合:與CMS的“標(biāo)記-清理”算法不同,G1從整體來看是基于“標(biāo)記-整理”算法實(shí)現(xiàn)的收集器,從局部(兩個Region之間)上來看是基于“復(fù)制”算法實(shí)現(xiàn)的,但無論如何,這兩種算法都意味著G1運(yùn)作期間不會產(chǎn)生內(nèi)存空間碎片,收集后能提供規(guī)整的可用內(nèi)存。這種特性有利于程序長時間運(yùn)行,分配大對象時不會因?yàn)闊o法找到連續(xù)內(nèi)存空間而提前觸發(fā)下一次GC。
  • 可預(yù)測的停頓:這是G1相對于CMS的另一大優(yōu)勢,降低停頓時間是G1和CMS共同的關(guān)注點(diǎn),但G1除了追求低停頓外,還能建立可預(yù)測的停頓時間模型,能讓使用者明確指定在一個長度為M毫秒的時間片段內(nèi),消耗在垃圾收集上的時間不得超過N毫秒,這幾乎已經(jīng)是實(shí)時Java(RTSJ)的垃圾收集器的特征了。
    橫跨整個堆內(nèi)存

?在G1之前的其他收集器進(jìn)行收集的范圍都是整個新生代或者老生代,而G1不再是這樣。G1在使用時,Java堆的內(nèi)存布局與其他收集器有很大區(qū)別,它將整個Java堆劃分為多個大小相等的獨(dú)立區(qū)域(Region),雖然還保留新生代和老年代的概念,但新生代和老年代不再是物理隔離的了,而都是一部分Region(不需要連續(xù))的集合。

建立可預(yù)測的時間模型

?G1收集器之所以能建立可預(yù)測的停頓時間模型,是因?yàn)樗梢杂杏媱澋乇苊庠谡麄€Java堆中進(jìn)行全區(qū)域的垃圾收集。G1跟蹤各個Region里面的垃圾堆積的價值大?。ɑ厥账@得的空間大小以及回收所需時間的經(jīng)驗(yàn)值),在后臺維護(hù)一個優(yōu)先列表,每次根據(jù)允許的收集時間,優(yōu)先回收價值最大的Region(這也就是Garbage-First名稱的來由)。這種使用Region劃分內(nèi)存空間以及有優(yōu)先級的區(qū)域回收方式,保證了G1收集器在有限的時間內(nèi)可以獲取盡可能高的收集效率。

避免全堆掃描——Remembered Set

?G1把Java堆分為多個Region,就是“化整為零”。但是Region不可能是孤立的,一個對象分配在某個Region中,可以與整個Java堆任意的對象發(fā)生引用關(guān)系。在做可達(dá)性分析確定對象是否存活的時候,需要掃描整個Java堆才能保證準(zhǔn)確性,這顯然是對GC效率的極大傷害。

?為了避免全堆掃描的發(fā)生,虛擬機(jī)為G1中每個Region維護(hù)了一個與之對應(yīng)的Remembered Set。虛擬機(jī)發(fā)現(xiàn)程序在對Reference類型的數(shù)據(jù)進(jìn)行寫操作時,會產(chǎn)生一個Write Barrier暫時中斷寫操作,檢查Reference引用的對象是否處于不同的Region之中(在分代的例子中就是檢查是否老年代中的對象引用了新生代中的對象),如果是,便通過CardTable把相關(guān)引用信息記錄到被引用對象所屬的Region的Remembered Set之中。當(dāng)進(jìn)行內(nèi)存回收時,在GC根節(jié)點(diǎn)的枚舉范圍中加入Remembered Set即可保證不對全堆掃描也不會有遺漏。

?如果不計算維護(hù)Remembered Set的操作,G1收集器的運(yùn)作大致可劃分為以下幾個步驟:

  • 初始標(biāo)記(Initial Marking) 僅僅只是標(biāo)記一下GC Roots 能直接關(guān)聯(lián)到的對象,并且修改TAMS(Nest Top Mark Start)的值,讓下一階段用戶程序并發(fā)運(yùn)行時,能在正確可以的Region中創(chuàng)建對象,此階段需要停頓線程,但耗時很短。
  • 并發(fā)標(biāo)記(Concurrent Marking) 從GC Root 開始對堆中對象進(jìn)行可達(dá)性分析,找到存活對象,此階段耗時較長,但可與用戶程序并發(fā)執(zhí)行。
    最終標(biāo)記(Final Marking) 為了修正在并發(fā)標(biāo)記期間因用戶程序繼續(xù)運(yùn)作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分標(biāo)記記錄,虛擬機(jī)將這段時間對象變化記錄在線程的Remembered Set Logs里面,最終標(biāo)記階段需要把Remembered Set Logs的數(shù)據(jù)合并到Remembered Set中,這階段需要停頓線程,但是可并行執(zhí)行。
  • 篩選回收(Live Data Counting and Evacuation) 首先對各個Region中的回收價值和成本進(jìn)行排序,根據(jù)用戶所期望的GC 停頓是時間來制定回收計劃。此階段其實(shí)也可以做到與用戶程序一起并發(fā)執(zhí)行,但是因?yàn)橹换厥找徊糠諶egion,時間是用戶可控制的,而且停頓用戶線程將大幅度提高收集效率。

?通過下圖可以比較清楚地看到G1收集器的運(yùn)作步驟中并發(fā)和需要停頓的階段(Safepoint處):


G1收集器

總結(jié)

收集器 串行、并行or并發(fā) 新生代/老年代 算法 目標(biāo) 適用場景
Serial 串行 新生代 復(fù)制算法 響應(yīng)速度優(yōu)先 單CPU環(huán)境下的Client模式
Serial Old 串行 老年代 標(biāo)記-整理 響應(yīng)速度優(yōu)先 單CPU環(huán)境下的Client模式、CMS的后備預(yù)案
ParNew 并行 新生代 復(fù)制算法 響應(yīng)速度優(yōu)先 多CPU環(huán)境時在Server模式下與CMS配合
Parallel Scavenge 并行 新生代 復(fù)制算法 吞吐量優(yōu)先 在后臺運(yùn)算而不需要太多交互的任務(wù)
Parallel Old 并行 老年代 標(biāo)記-整理 吞吐量優(yōu)先 在后臺運(yùn)算而不需要太多交互的任務(wù)
CMS 并發(fā) 老年代 標(biāo)記-清除 響應(yīng)速度優(yōu)先 集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)服務(wù)端上的Java應(yīng)用
G1 并發(fā) Both 標(biāo)記-整理+復(fù)制算法 響應(yīng)速度優(yōu)先 面向服務(wù)端應(yīng)用,將來替換CMS

參考資料

  • [《深入理解Java虛擬機(jī)——JVM高級特性與最佳實(shí)踐》-周志明]
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容