扒一扒JVM的垃圾回收機(jī)制,下次面試你準(zhǔn)備好了嗎

來源:https://www.cnblogs.com/1024Community/p/honery.html


一、 技術(shù)背景你要了解吧

按照套路是要先裝裝X,談?wù)凧VM垃圾回收的前世今生的。說起垃圾回收(GC),大部分人都把這項技術(shù)當(dāng)做Java語言的伴生產(chǎn)物。事實上,GC的歷史比Java久遠(yuǎn),早在1960年Lisp這門語言中就使用了內(nèi)存動態(tài)分配和垃圾回收技術(shù)。設(shè)計和優(yōu)化C++這門語言的專家們要長點心啦~~

二、 哪些內(nèi)存需要回收?

猿們都知道JVM的內(nèi)存結(jié)構(gòu)包括五大區(qū)域:程序計數(shù)器、虛擬機(jī)棧、本地方法棧、堆區(qū)、方法區(qū)。其中程序計數(shù)器、虛擬機(jī)棧、本地方法棧3個區(qū)域隨線程而生、隨線程而滅,因此這幾個區(qū)域的內(nèi)存分配和回收都具備確定性,就不需要過多考慮回收的問題,因為方法結(jié)束或者線程結(jié)束時,內(nèi)存自然就跟隨著回收了。而Java堆區(qū)和方法區(qū)則不一樣、不一樣!(怎么不一樣說的朗朗上口),這部分內(nèi)存的分配和回收是動態(tài)的,正是垃圾收集器所需關(guān)注的部分。

垃圾收集器在對堆區(qū)和方法區(qū)進(jìn)行回收前,首先要確定這些區(qū)域的對象哪些可以被回收,哪些暫時還不能回收,這就要用到判斷對象是否存活的算法!(面試官肯定沒少問你吧)

2.1 引用計數(shù)算法

2.1.1 算法分析

引用計數(shù)是垃圾收集器中的早期策略。在這種方法中,堆中每個對象實例都有一個引用計數(shù)。當(dāng)一個對象被創(chuàng)建時,就將該對象實例分配給一個變量,該變量計數(shù)設(shè)置為1。當(dāng)任何其它變量被賦值為這個對象的引用時,計數(shù)加1(a = b,則b引用的對象實例的計數(shù)器+1),但當(dāng)一個對象實例的某個引用超過了生命周期或者被設(shè)置為一個新值時,對象實例的引用計數(shù)器減1。任何引用計數(shù)器為0的對象實例可以被當(dāng)作垃圾收集。當(dāng)一個對象實例被垃圾收集時,它引用的任何對象實例的引用計數(shù)器減1。

2.1.2 優(yōu)缺點

優(yōu)點:引用計數(shù)收集器可以很快的執(zhí)行,交織在程序運行中。對程序需要不被長時間打斷的實時環(huán)境比較有利。

缺點:無法檢測出循環(huán)引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數(shù)永遠(yuǎn)不可能為0。

2.1.3 是不是很無趣,來段代碼壓壓驚

這段代碼是用來驗證引用計數(shù)算法不能檢測出循環(huán)引用。最后面兩句將object1和object2賦值為null,也就是說object1和object2指向的對象已經(jīng)不可能再被訪問,但是由于它們互相引用對方,導(dǎo)致它們的引用計數(shù)器都不為0,那么垃圾收集器就永遠(yuǎn)不會回收它們。

2.2 可達(dá)性分析算法

可達(dá)性分析算法是從離散數(shù)學(xué)中的圖論引入的,程序把所有的引用關(guān)系看作一張圖,從一個節(jié)點GC ROOT開始,尋找對應(yīng)的引用節(jié)點,找到這個節(jié)點以后,繼續(xù)尋找這個節(jié)點的引用節(jié)點,當(dāng)所有的引用節(jié)點尋找完畢之后,剩余的節(jié)點則被認(rèn)為是沒有被引用到的節(jié)點,即無用的節(jié)點,無用的節(jié)點將會被判定為是可回收的對象。

在Java語言中,可作為GC Roots的對象包括下面幾種:

a) 虛擬機(jī)棧中引用的對象(棧幀中的本地變量表);

b) 方法區(qū)中類靜態(tài)屬性引用的對象;

c) 方法區(qū)中常量引用的對象;

d) 本地方法棧中JNI(Native方法)引用的對象。

2.3 Java中的引用你了解多少

無論是通過引用計數(shù)算法判斷對象的引用數(shù)量,還是通過可達(dá)性分析算法判斷對象的引用鏈?zhǔn)欠窨蛇_(dá),判定對象是否存活都與“引用”有關(guān)。在Java語言中,將引用又分為強(qiáng)引用、軟引用、弱引用、虛引用4種,這四種引用強(qiáng)度依次逐漸減弱。

強(qiáng)引用

在程序代碼中普遍存在的,類似?Object obj = new Object()?這類引用,只要強(qiáng)引用還存在,垃圾收集器永遠(yuǎn)不會回收掉被引用的對象。

軟引用

用來描述一些還有用但并非必須的對象。對于軟引用關(guān)聯(lián)著的對象,在系統(tǒng)將要發(fā)生內(nèi)存溢出異常之前,將會把這些對象列進(jìn)回收范圍之中進(jìn)行第二次回收。如果這次回收后還沒有足夠的內(nèi)存,才會拋出內(nèi)存溢出異常。

弱引用

也是用來描述非必需對象的,但是它的強(qiáng)度比軟引用更弱一些,被弱引用關(guān)聯(lián)的對象只能生存到下一次垃圾收集發(fā)生之前。當(dāng)垃圾收集器工作時,無論當(dāng)前內(nèi)存是否足夠,都會回收掉只被弱引用關(guān)聯(lián)的對象。

虛引用

也叫幽靈引用或幻影引用(名字真會取,很魔幻的樣子),是最弱的一種引用關(guān)系。

一個對象是否有虛引用的存在,完全不會對其生存時間構(gòu)成影響,也無法通過虛引用來取得一個對象實例。它的作用是能在這個對象被收集器回收時收到一個系統(tǒng)通知。

不要被概念嚇到,也別擔(dān)心,還沒跑題,再深入,可就不好說了。小編羅列這四個概念的目的是為了說明,無論引用計數(shù)算法還是可達(dá)性分析算法都是基于強(qiáng)引用而言的。

2.4 對象死亡(被回收)前的最后一次掙扎

即使在可達(dá)性分析算法中不可達(dá)的對象,也并非是“非死不可”,這時候它們暫時處于“緩刑”階段,要真正宣告一個對象死亡,至少要經(jīng)歷兩次標(biāo)記過程。

第一次標(biāo)記:如果對象在進(jìn)行可達(dá)性分析后發(fā)現(xiàn)沒有與GC Roots相連接的引用鏈,那它將會被第一次標(biāo)記;

第二次標(biāo)記:第一次標(biāo)記后接著會進(jìn)行一次篩選,篩選的條件是此對象是否有必要執(zhí)行finalize()方法。在finalize()方法中沒有重新與引用鏈建立關(guān)聯(lián)關(guān)系的,將被進(jìn)行第二次標(biāo)記。

第二次標(biāo)記成功的對象將真的會被回收,如果對象在finalize()方法中重新與引用鏈建立了關(guān)聯(lián)關(guān)系,那么將會逃離本次回收,繼續(xù)存活。猿們還跟的上吧,嘿嘿。

2.5 方法區(qū)如何判斷是否需要回收

猿們,方法區(qū)存儲內(nèi)容是否需要回收的判斷可就不一樣咯。方法區(qū)主要回收的內(nèi)容有:廢棄常量和無用的類。對于廢棄常量也可通過引用的可達(dá)性來判斷,但是對于無用的類則需要同時滿足下面3個條件:

該類所有的實例都已經(jīng)被回收,也就是Java堆中不存在該類的任何實例;

加載該類的ClassLoader已經(jīng)被回收;

該類對應(yīng)的java.lang.Class對象沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。

關(guān)于類加載的原理,也是阿里面試的主角,面試官也問過我比如:能否自己定義String,答案是不行,因為jvm在加載類的時候會執(zhí)行雙親委派

三、常用的垃圾收集算法

3.1 標(biāo)記-清除算法(Mark-Sweep)

標(biāo)記-清除算法采用從根集合(GC Roots)進(jìn)行掃描,對存活的對象進(jìn)行標(biāo)記,標(biāo)記完畢后,再掃描整個空間中未被標(biāo)記的對象,進(jìn)行回收,如下圖所示。標(biāo)記-清除算法不需要進(jìn)行對象的移動,只需對不存活的對象進(jìn)行處理,在存活對象比較多的情況下極為高效,但由于標(biāo)記-清除算法直接回收不存活的對象,因此會造成內(nèi)存碎片。

3.2 復(fù)制算法(Copying)

復(fù)制算法的提出是為了克服句柄的開銷和解決內(nèi)存碎片的問題。它開始時把堆分成 一個對象 面和多個空閑面, 程序從對象面為對象分配空間,當(dāng)對象滿了,基于copying算法的垃圾 收集就從根集合(GC Roots)中掃描活動對象,并將每個 活動對象復(fù)制到空閑面(使得活動對象所占的內(nèi)存之間沒有空閑洞),這樣空閑面變成了對象面,原來的對象面變成了空閑面,程序會在新的對象面中分配內(nèi)存。

3.3 標(biāo)記-整理算法(Mark-compact)

標(biāo)記-整理算法采用標(biāo)記-清除算法一樣的方式進(jìn)行對象的標(biāo)記,但在清除時不同,在回收不存活的對象占用的空間后,會將所有的存活對象往左端空閑空間移動,并更新對應(yīng)的指針。標(biāo)記-整理算法是在標(biāo)記-清除算法的基礎(chǔ)上,又進(jìn)行了對象的移動,因此成本更高,但是卻解決了內(nèi)存碎片的問題。具體流程見下圖:

3.4 分代收集算法

分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根據(jù)對象存活的生命周期將內(nèi)存劃分為若干個不同的區(qū)域。一般情況下將堆區(qū)劃分為老年代(Tenured Generation)和新生代(Young Generation),在堆區(qū)之外還有一個代就是永久代(Permanet Generation)。老年代的特點是每次垃圾收集時只有少量對象需要被回收,而新生代的特點是每次垃圾回收時都有大量的對象需要被回收,那么就可以根據(jù)不同代的特點采取最適合的收集算法。

3.4.1 年輕代(Young Generation)的回收算法 (回收主要以Copying為主)

a) 所有新生成的對象首先都是放在年輕代的。年輕代的目標(biāo)就是盡可能快速的收集掉那些生命周期短的對象。

b) 新生代內(nèi)存按照8:1:1的比例分為一個eden區(qū)和兩個survivor(survivor0,survivor1)區(qū)。一個Eden區(qū),兩個 Survivor區(qū)(一般而言)。大部分對象在Eden區(qū)中生成?;厥諘r先將eden區(qū)存活對象復(fù)制到一個survivor0區(qū),然后清空eden區(qū),當(dāng)這個survivor0區(qū)也存放滿了時,則將eden區(qū)和survivor0區(qū)存活對象復(fù)制到另一個survivor1區(qū),然后清空eden和這個survivor0區(qū),此時survivor0區(qū)是空的,然后將survivor0區(qū)和survivor1區(qū)交換,即保持survivor1區(qū)為空, 如此往復(fù)。

c) 當(dāng)survivor1區(qū)不足以存放 eden和survivor0的存活對象時,就將存活對象直接存放到老年代。若是老年代也滿了就會觸發(fā)一次Full GC(Major GC),也就是新生代、老年代都進(jìn)行回收。

d) 新生代發(fā)生的GC也叫做Minor GC,MinorGC發(fā)生頻率比較高(不一定等Eden區(qū)滿了才觸發(fā))。

3.4.2 年老代(Old Generation)的回收算法(回收主要以Mark-Compact為主)

a) 在年輕代中經(jīng)歷了N次垃圾回收后仍然存活的對象,就會被放到年老代中。因此,可以認(rèn)為年老代中存放的都是一些生命周期較長的對象。

b) 內(nèi)存比新生代也大很多(大概比例是1:2),當(dāng)老年代內(nèi)存滿時觸發(fā)Major GC即Full GC,F(xiàn)ull GC發(fā)生頻率比較低,老年代對象存活時間比較長,存活率標(biāo)記高。

3.4.3 持久代(Permanent Generation)的回收算法

用于存放靜態(tài)文件,如Java類、方法等。持久代對垃圾回收沒有顯著影響,但是有些應(yīng)用可能動態(tài)生成或者調(diào)用一些class,例如Hibernate 等,在這種時候需要設(shè)置一個比較大的持久代空間來存放這些運行過程中新增的類。持久代也稱方法區(qū),具體的回收可參見上文2.5節(jié)。

四、常見的垃圾收集器

下面一張圖是HotSpot虛擬機(jī)包含的所有收集器,圖是借用過來滴:

Serial收集器(復(fù)制算法)

新生代單線程收集器,標(biāo)記和清理都是單線程,優(yōu)點是簡單高效。是client級別默認(rèn)的GC方式,可以通過-XX:+UseSerialGC來強(qiáng)制指定。

Serial Old收集器(標(biāo)記-整理算法)

老年代單線程收集器,Serial收集器的老年代版本。

ParNew收集器(停止-復(fù)制算法) 

新生代收集器,可以認(rèn)為是Serial收集器的多線程版本,在多核CPU環(huán)境下有著比Serial更好的表現(xiàn)。

Parallel Scavenge收集器(停止-復(fù)制算法)

并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般為99%, 吞吐量= 用戶線程時間/(用戶線程時間+GC線程時間)。適合后臺應(yīng)用等對交互相應(yīng)要求不高的場景。是server級別默認(rèn)采用的GC方式,可用-XX:+UseParallelGC來強(qiáng)制指定,用-XX:ParallelGCThreads=4來指定線程數(shù)。

Parallel Old收集器(停止-復(fù)制算法)

Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量優(yōu)先。

CMS(Concurrent Mark Sweep)收集器(標(biāo)記-清理算法)

高并發(fā)、低停頓,追求最短GC回收停頓時間,cpu占用比較高,響應(yīng)時間快,停頓時間短,多核cpu 追求高響應(yīng)時間的選擇。

五、GC是什么時候觸發(fā)的(面試最常見的問題之一)

由于對象進(jìn)行了分代處理,因此垃圾回收區(qū)域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。

5.1 Scavenge GC

一般情況下,當(dāng)新對象生成,并且在Eden申請空間失敗時,就會觸發(fā)Scavenge GC,對Eden區(qū)域進(jìn)行GC,清除非存活對象,并且把尚且存活的對象移動到Survivor區(qū)。然后整理Survivor的兩個區(qū)。這種方式的GC是對年輕代的Eden區(qū)進(jìn)行,不會影響到年老代。因為大部分對象都是從Eden區(qū)開始的,同時Eden區(qū)不會分配的很大,所以Eden區(qū)的GC會頻繁進(jìn)行。因而,一般在這里需要使用速度快、效率高的算法,使Eden去能盡快空閑出來。

5.2 Full GC

對整個堆進(jìn)行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進(jìn)行回收,所以比Scavenge GC要慢,因此應(yīng)該盡可能減少Full GC的次數(shù)。在對JVM調(diào)優(yōu)的過程中,很大一部分工作就是對于Full GC的調(diào)節(jié)。有如下原因可能導(dǎo)致Full GC:

a) 年老代(Tenured)被寫滿;

b) 持久代(Perm)被寫滿;

c) System.gc()被顯示調(diào)用;

d) 上一次GC之后Heap的各域分配策略動態(tài)變化;

擴(kuò)展閱讀

Java垃圾回收(GC)機(jī)制詳解

JVM初探:內(nèi)存分配、GC原理與垃圾收集器

一個“Hello World”理解JVM運行時數(shù)據(jù)區(qū)

Twitter工程師談JVM調(diào)優(yōu)

三年半 Java 后端鵝廠面試經(jīng)歷

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容