Java與C++之間有一堵由內(nèi)存動態(tài)分配和垃圾收集技術(shù)所圍成的“高墻”,墻外面的人想進(jìn)去,墻里面的人卻想出來。
1. 運(yùn)行時數(shù)據(jù)區(qū)域
Java虛擬機(jī)在執(zhí)行Java程序的過程中會把它所管理的內(nèi)存劃分為若干個不同的數(shù)據(jù)區(qū)域。

1.1 程序計(jì)數(shù)器
程序計(jì)數(shù)器(Program Counter Register)是一塊較小的內(nèi)存空間,它可以看作是當(dāng)前線程所執(zhí)行的字節(jié)碼的行號指示器。程序計(jì)數(shù)器是線程私有的。
何為線程私有? 由于Java虛擬機(jī)的多線程是通過線程輪流切換并分配處理器執(zhí)行時間的方式來實(shí)現(xiàn)的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內(nèi)核)都只會執(zhí)行一條線程中的指令。因此,為了線程切換后能恢復(fù)到正確的執(zhí)行位置,每條線程都需要有一個獨(dú)立的程序計(jì)數(shù)器,各條線程之間計(jì)數(shù)器互不影響,獨(dú)立存儲,我們稱這類內(nèi)存區(qū)域?yàn)椤熬€程私有”的內(nèi)存。
特點(diǎn):行號指示器;線程私有;并且是唯一沒有OutOfMemoryError異常的區(qū)域。
1.2 Java虛擬機(jī)棧
虛擬機(jī)棧(Java Virtual Machine Stacks)描述的是Java方法執(zhí)行的內(nèi)存模型:每個方法在執(zhí)行的同時都會創(chuàng)建一個棧幀(Stack Frame)用于存儲局部變量表、操作數(shù)棧、動態(tài)鏈接、方法出口等信息。每一個方法從調(diào)用直至執(zhí)行完成的過程,就對應(yīng)著一個棧幀在虛擬機(jī)棧中入棧到出棧的過程。
經(jīng)常有人把Java內(nèi)存區(qū)分為堆內(nèi)存(Heap)和棧內(nèi)存(Stack),實(shí)際劃分遠(yuǎn)比這復(fù)雜。這里的“?!本褪乾F(xiàn)在講的虛擬機(jī)棧,或者說是虛擬機(jī)棧中局部變量表部分。局部變量表存放了編譯期可知的各種基本數(shù)據(jù)類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型)和returnAddress類型。
在Java虛擬機(jī)規(guī)范中,對這個區(qū)域規(guī)定了兩種異常狀況:如果線程請求的棧深度大于虛 擬機(jī)所允許的深度,將拋出StackOverflowError異常;如果虛擬機(jī)棧可以動態(tài)擴(kuò)展(當(dāng)前大部分的Java虛擬機(jī)都可動態(tài)擴(kuò)展,只不過Java虛擬機(jī)規(guī)范中也允許固定長度的虛擬機(jī)棧),如果擴(kuò)展時無法申請到足夠的內(nèi)存,就會拋出OutOfMemoryError異常。
特點(diǎn):描述方法的內(nèi)存模型,包含局部變量表等;俗稱的堆和棧中的“棧;會拋出StackOverflowError和OutOfMemoryError兩種異常。
1.3 本地方法棧
本地方法棧(Native Method Stack)與虛擬機(jī)棧所類似,區(qū)別是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法(也就是字節(jié)碼)服務(wù),而本地方法棧則為虛擬機(jī)使用到的Native方法服務(wù)。甚至有的虛擬機(jī)(譬如 Sun HotSpot虛擬機(jī))直接就把本地方法棧和虛擬機(jī)棧合二為一。與虛擬機(jī)棧一樣,本地方法棧區(qū)域也會拋出StackOverflowError和OutOfMemoryError異常。
特點(diǎn):和虛擬機(jī)棧類似,不過是為本地方法服務(wù);HotSpot虛擬機(jī)中和虛擬機(jī)棧合并;拋出兩種異常。
1.4 Java堆
Java堆(Java Heap)是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java堆是被所有線程共享的一塊內(nèi)存區(qū)域,在虛擬機(jī)啟動時創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對象實(shí)例及數(shù)組,幾乎所有的對象實(shí)例都在這里分配內(nèi)存。
Java堆是垃圾收集器管理的主要區(qū)域,因此很多時候也被稱做“GC堆”(Garbage Collected Heap)。從內(nèi)存回收的角度來看,由于現(xiàn)在收集器基本都采用分代收集算法,所以Java堆中還可以細(xì)分為:新生代和老年代;再細(xì)致一點(diǎn)的有Eden空間、From Survivor空間、To Survivor空間等。
Java堆可以處于物理上不連續(xù)的內(nèi)存空間中。Java堆可以固定也可以擴(kuò)展。如果在堆中沒有內(nèi)存完成實(shí)例分配,并且堆也無法再擴(kuò)展時,將會拋出OutOfMemoryError異常。
特點(diǎn):存儲對象實(shí)例;被所有線程共享,虛擬機(jī)啟動時創(chuàng)建;垃圾收集器的主要區(qū)域;會拋出OutOfMemoryError異常。
1.5 方法區(qū)
方法區(qū)(Method Area)與Java堆一樣,是各個線程共享的內(nèi)存區(qū)域,它用于存儲已被虛擬機(jī)加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等數(shù)據(jù)。它有一個別名叫做Non-Heap(非堆)。在HotSpot中也被稱為永久代。
這區(qū)域的內(nèi)存回收目標(biāo)主要是針對常量池的回收和對類型的卸載,一般來說,這個區(qū)域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當(dāng)苛刻,但是這部分區(qū)域的回收確實(shí)是必要的。
當(dāng)方法區(qū)無法滿足內(nèi)存分配需求時,將拋出OutOfMemoryError異常。
特點(diǎn):存儲類信息、常量、靜態(tài)變量等數(shù)據(jù),包含運(yùn)行時常量池;被所有線程共享;別稱非堆,在HotSpot中也被稱為永久代;會拋出OutOfMemoryError異常。
2. HotSpot虛擬機(jī)對象探秘
2.1 對象的創(chuàng)建
虛擬機(jī)遇到一條new指令時,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符號引用,并且檢查這個符號引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須先執(zhí)行相應(yīng)的類加載過程。
在類加載檢查通過后,接下來虛擬機(jī)將為新生對象分配內(nèi)存。對象所需內(nèi)存的大小在類加載完成后便可完全確定,為對象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來。假設(shè)Java堆中內(nèi)存是絕對規(guī)整的,所有用過的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個指針作為分界點(diǎn)的指示器,那所分配內(nèi)存就僅僅是把那個指針向空閑空間那邊挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”(Bump the Pointer)。如果Java堆中的內(nèi)存并不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存相互交錯,那就沒有辦法簡單地進(jìn)行指針碰撞了,虛擬機(jī)就必須維護(hù)一個列表,記錄上哪些內(nèi)存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實(shí)例,并更新列表上的記錄,這種分配方式稱為“空閑列表”(Free List)。選擇哪種分配方式由Java堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。因此,在使用Serial、ParNew等帶Compact過程的收集器時,系統(tǒng)采用的分配算法是指針碰撞,而使用CMS這種基于Mark-Sweep算法的收集器時,通常采用空閑列表。
除如何劃分可用空間之外,還有另外一個需要考慮的問題是對象創(chuàng)建在虛擬機(jī)中是非常頻繁的行為,即使是僅僅修改一個指針?biāo)赶虻奈恢?,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對象A分配內(nèi)存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內(nèi)存的情況。解決這個問題有兩種方案,一種是對分配內(nèi)存空間的動作進(jìn)行同步處理——實(shí)際上虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性;另一種是把內(nèi)存分配的動作按照線程劃分在不同的空間之中進(jìn)行,即每個線程在Java堆中預(yù)先分配一小塊內(nèi)存,稱為本地線程分配緩沖(Thread Local Allocation Buffer,TLAB)。哪個線程要分配內(nèi)存,就在哪個線程的TLAB上分配,只有TLAB用完并分配新的TLAB時,才需要同步鎖定。虛擬機(jī)是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設(shè)定。
內(nèi)存分配完成后,虛擬機(jī)需要將分配到的內(nèi)存空間都初始化為零值(不包括對象頭),如果使用TLAB,這一工作過程也可以提前至TLAB分配時進(jìn)行。這一步操作保證了對象的實(shí)例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應(yīng)的零值。
接下來,虛擬機(jī)要對對象進(jìn)行必要的設(shè)置,例如這個對象是哪個類的實(shí)例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希碼、對象的GC分代年齡等信息。這些信息存放在對象的對象頭(Object Header)之中。
在上面工作都完成之后,從虛擬機(jī)的視角來看,一個新的對象已經(jīng)產(chǎn)生了,但從Java程序的視角來看,對象創(chuàng)建才剛剛開始——<init>方法還沒有執(zhí)行,所有的字段都還為零。所以,一般來說(由字節(jié)碼中是否跟隨invokespecial指令所決定),執(zhí)行new指令之后會接著執(zhí)行<init>方法,把對象按照程序員的意愿進(jìn)行初始化,這樣一個真正可用的對象才算完全產(chǎn)生出來。
總結(jié):虛擬機(jī)遇到一條new指令時,首先檢查是否能在常量池中找到該類的符號引用,并且查看該類是否已被加載和初始化過,若沒有,則執(zhí)行類加載過程。類加載檢查通過后,為對象分配內(nèi)存,有兩種分配方式,若堆是完全規(guī)整的,則采用指針碰撞,若不規(guī)整,則需要采用空閑列表方式。另外對象創(chuàng)建可能會遇到并發(fā)問題,有兩種解決方案,一種是對分配空間動作進(jìn)行同步處理,一種是把分配動作按照線程劃分在不同空間中進(jìn)行。內(nèi)存分配完成后,則把分配的內(nèi)存空間都初始化為零值,然后對對象進(jìn)行必要的設(shè)置,比如該對象是哪個類的實(shí)例,如何找到類的元數(shù)據(jù)信息等,這些在對象的對象頭中。上面動作完成后,虛擬機(jī)方面對象創(chuàng)建已經(jīng)完成,但Java程序方面,還需要用<init>方法進(jìn)行初始化,這樣真正的對象才算創(chuàng)建出來。
2.2 對象的內(nèi)存布局
在HotSpot虛擬機(jī)中,對象在內(nèi)存中存儲的布局可以分為3塊區(qū)域:對象頭(Header)、實(shí)例數(shù)據(jù)(Instance Data)和對齊填充(Padding)。
HotSpot虛擬機(jī)的對象頭包括兩部分信息,第一部分用于存儲對象自身的運(yùn)行時數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時間戳等,這部分?jǐn)?shù)據(jù)的長度在32位和64位的虛擬機(jī)(未開啟壓縮指針)中分別為32bit和64bit,官方稱它為“Mark Word”。
對象頭的另外一部分是類型指針,即對象指向它的類元數(shù)據(jù)的指針,虛擬機(jī)通過這個指針來確定這個對象是哪個類的實(shí)例。并不是所有的虛擬機(jī)實(shí)現(xiàn)都必須在對象數(shù)據(jù)上保留類型指針,比如采用句柄訪問就沒有。另外,如果對象是一個Java數(shù)組,那在對象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù)。
第二部分實(shí)例數(shù)據(jù)部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內(nèi)容。無論是從父類繼承下來的,還是在子類中定義的,都需要記錄起來。這部分的存儲順序會受到虛擬機(jī)分配策略參數(shù)(FieldsAllocationStyle)和字段在Java源碼中定義順序的影響。HotSpot虛擬機(jī)默認(rèn)的分配策略為相同寬度的字段總是被分配到一起。在滿足這個前提條件的情況下,在父類中定義的變量會出現(xiàn)在子類之前。
第三部分對齊填充并不是必然存在的,也沒有特別的含義,它僅僅起著占位符的作用。由于HotSpot VM的自動內(nèi)存管理系統(tǒng)要求對象起始地址必須是8字節(jié)的整數(shù)倍,因此用以補(bǔ)齊。
總結(jié):對象在內(nèi)存可以分為3個部分:對象頭、實(shí)例數(shù)據(jù)和對齊填充。對象頭分兩個部分,一部分用于存儲對象自身的運(yùn)行時數(shù)據(jù),一部分存儲類型指針,但采用句柄方式的虛擬機(jī)沒有類型指針,直接指針方式才有。實(shí)例數(shù)據(jù)部分存儲對象的有效信息,一般相同寬度的字段分配到一起,然后父類的變量在子類之前。第三部分對其填充非必要,因?yàn)镠otSpot虛擬機(jī)要求對象必須是8字節(jié)的整數(shù)倍,所以用以補(bǔ)齊。
2.3 對象的訪問定位
我們的Java程序需要通過棧上的reference數(shù)據(jù)來操作堆上的具體對象。由于reference類型在Java虛擬機(jī)規(guī)范中只規(guī)定了一個指向?qū)ο蟮囊?,并沒有定義這個引用應(yīng)該通過何種方式去定位、訪問堆中的對象的具體位置,所以對象訪問方式也是取決于虛擬機(jī)實(shí)現(xiàn)而定的。目前主流的訪問方式有使用句柄和直接指針兩種。
如果使用句柄訪問的話,那么Java堆中將會劃分出一塊內(nèi)存來作為句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實(shí)例數(shù)據(jù)與類型數(shù)據(jù)各自的具體地址信息,如圖2-2所示。

如果使用直接指針訪問,那么Java堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息,而reference中存儲的直接就是對象地址,如圖2-3所示。

這兩種對象訪問方式各有優(yōu)勢,使用句柄來訪問的最大好處就是reference中存儲的是穩(wěn)定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改變句柄中的實(shí)例數(shù)據(jù)指針,而reference本身不需要修改。使用直接指針訪問方式的最大好處就是速度更快,它節(jié)省了一次指針定位的時間開銷,由于對象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是一項(xiàng)非??捎^的執(zhí)行成本。就本書討論的主要虛擬機(jī)Sun HotSpot而言,它是使用第二種方式進(jìn)行對象訪問的,但從整個軟件開發(fā)的范圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。
總結(jié):對象訪問方式取決于虛擬機(jī)實(shí)現(xiàn),主流的有兩種:使用句柄和直接指針。
句柄方式的話,句柄中存儲的是對象的實(shí)例數(shù)據(jù)和對象類型數(shù)據(jù)的具體地址,棧中存儲的是對象的句柄地址。直接指針方式的話,對象實(shí)例數(shù)據(jù)的對象頭則包含對象類型數(shù)據(jù)的地址,而棧中存儲的是對象實(shí)例數(shù)據(jù)的地址。兩種方式各有優(yōu)劣,句柄方式是因?yàn)闂V写鎯Φ氖蔷浔刂?,所以方便對象移動,而直接指針的好處則是速度快,HotSpot采用的是直接指針。
3. OutOfMemoryError異常
在Java虛擬機(jī)規(guī)范的描述中,除了程序計(jì)數(shù)器外,虛擬機(jī)內(nèi)存的其他幾個運(yùn)行時區(qū)域都有發(fā)生OutOfMemoryError異常。
3.1 Java堆溢出
Java堆內(nèi)存的OOM(OutOfMemoryError的簡寫)異常是實(shí)際應(yīng)用中常見的內(nèi)存溢出異常情況。當(dāng)出現(xiàn)Java堆內(nèi)存溢出時,異常堆棧信息為“java.lang.OutOfMemoryError: Java heap space”。
要解決該異常,需要先用工具分析是內(nèi)存泄露(Memory Leak)還是內(nèi)存溢出(Memory Overflow)。若是內(nèi)存溢出,則需要擴(kuò)大虛擬機(jī)的堆參數(shù)(-Xmx與-Xms)?!?Xmx”代表可擴(kuò)充的最大堆內(nèi)存?!?Xms”為最小堆內(nèi)存。
3.2 虛擬機(jī)棧和本地方法棧溢出
如果線程請求的棧深度大于虛擬機(jī)所允許的最大深度,將拋出StackOverflowError異常。如果虛擬機(jī)在擴(kuò)展棧時無法申請到足夠的內(nèi)存空間,則拋出OutOfMemoryError異常。棧容量只由-Xss參數(shù)設(shè)定。
在單個線程下,無論是由于棧幀太大還是虛擬機(jī)棧容量太小,當(dāng)內(nèi)存無法分配的時候,虛擬機(jī)拋出的都是StackOverflowError異常。在多線程時才可能出現(xiàn)OutOfMemoryError異常。因此為了避免OOM異常,在不減少線程的情況下,可以通過減少最大堆和減少棧容量來換取更多的線程。
3.3 方法區(qū)和運(yùn)行時常量池溢出
在JDK1.6及以前,當(dāng)方法區(qū)和運(yùn)行時常量池出現(xiàn)內(nèi)存溢出時,異常堆棧信息為“java.lang.OutOfMemoryError: PermGen space”。 可以通過-XX:PermSize和-XX:MaxPermSize設(shè)置方法區(qū)大小。JDK1.7以后,運(yùn)行時常量池從方法區(qū)(永久代)移除到了堆中,此方法不再對常量池適用。工作中經(jīng)常造成方法區(qū)溢出的一個可能場景是經(jīng)常動態(tài)生成大量Class文件。比如多個應(yīng)用都需要很多的jar包,其實(shí)可以提取出公共的放到tomcat下,或者擴(kuò)大方法區(qū)。