JVM 內(nèi)存模型

概述

  • 對(duì)于從事 C、C++ 程序開發(fā)的開發(fā)人員來說,在內(nèi)存管理領(lǐng)域,他們既是擁有最高權(quán)力的“皇帝”,又是從事最基礎(chǔ)工作的勞動(dòng)人民——既擁有每一個(gè)對(duì)象的“所有權(quán)”,又擔(dān)負(fù)著每一個(gè)對(duì)象生命從開始到終結(jié)的維護(hù)責(zé)任。

  • 對(duì)于 Java 程序員來說,在虛擬機(jī)自動(dòng)內(nèi)存管理機(jī)制的幫助下,不再需要為每一個(gè) new 操作去寫配對(duì)的 delete/free 代碼,不容易出現(xiàn)內(nèi)存泄漏和內(nèi)存溢出問題,看起來由虛擬機(jī)管理內(nèi)存一切都很美好。不過,也正是因?yàn)?Java 程序員把控制內(nèi)存的權(quán)力交給了 Java 虛擬機(jī),一旦出現(xiàn)內(nèi)存泄漏和溢出方面的問題,如果不了解虛擬機(jī)是怎樣使用內(nèi)存的,那排查錯(cuò)誤、修正問題將會(huì)成為一項(xiàng)異常艱難的工作。

  • 將從概念上介紹 Java 虛擬機(jī)內(nèi)存的各個(gè)區(qū)域,講解這些區(qū)域的作用、服務(wù)對(duì)象以及其中可能產(chǎn)生的問題,這也是翻越虛擬機(jī)內(nèi)存管理這堵圍墻的第一步。

運(yùn)行時(shí)數(shù)據(jù)區(qū)域

Java 虛擬機(jī)在執(zhí)行 Java 程序的過程中會(huì)把它所管理的內(nèi)存劃分為若干個(gè)不同的數(shù)據(jù)區(qū)域。這些區(qū)域有各自的用途,以及創(chuàng)建和銷毀的時(shí)間,有的區(qū)域隨著虛擬機(jī)進(jìn)程的啟動(dòng)而一直存在,有些區(qū)域則是依賴用戶線程的啟動(dòng)和結(jié)束而建立和銷毀。根據(jù)《Java 虛擬機(jī)規(guī)范》的規(guī)定,Java 虛擬機(jī)所管理的內(nèi)存將會(huì)包括以下幾個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū)域,

Java 運(yùn)行時(shí)數(shù)據(jù)區(qū)域圖解

程序計(jì)數(shù)器

  • 程序計(jì)數(shù)器(Program Counter Register)是一塊較小的內(nèi)存空間,它可以看作是當(dāng)前線程所執(zhí)行的字節(jié)碼的行號(hào)指示器。在 Java 虛擬機(jī)的概念模型里,字節(jié)碼解釋器工作時(shí)就是通過改變這個(gè)計(jì)數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令,它是程序控制流的指示器,分支、循環(huán)、跳轉(zhuǎn)、異常處理、線程恢復(fù)等基礎(chǔ)功能都需要依賴這個(gè)計(jì)數(shù)器來完成。

  • 由于 Java 虛擬機(jī)的多線程是通過線程輪流切換、分配處理器執(zhí)行時(shí)間的方式來實(shí)現(xiàn)的,在任何一個(gè)確定的時(shí)刻,一個(gè)處理器(對(duì)于多核處理器來說是一個(gè)內(nèi)核)都只會(huì)執(zhí)行一條線程中的指令。因此,為了線程切換后能恢復(fù)到正確的執(zhí)行位置,每條線程都需要有一個(gè)獨(dú)立的程序計(jì)數(shù)器,各條線程之間計(jì)數(shù)器互不影響,獨(dú)立存儲(chǔ),我們稱這類內(nèi)存區(qū)域?yàn)椤熬€程私有”的內(nèi)存。

  • 如果線程正在執(zhí)行的是一個(gè) Java 方法,這個(gè)計(jì)數(shù)器記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址;如果正在執(zhí)行的是本地(Native)方法,這個(gè)計(jì)數(shù)器值則應(yīng)為空(Undefined)。此內(nèi)存區(qū)域是唯一一個(gè)在《Java 虛擬機(jī)規(guī)范》中沒有規(guī)定任何 OutOfMemoryError 情況的區(qū)域。

Java 虛擬機(jī)棧

  • 與程序計(jì)數(shù)器一樣,Java 虛擬機(jī)棧(Java Virtual Machine Stack)也是線程私有的,它的生命周期與線程相同。虛擬機(jī)棧描述的是 Java 方法執(zhí)行的線程內(nèi)存模型:每個(gè)方法被執(zhí)行的時(shí)候,Java 虛擬機(jī)都會(huì)同步創(chuàng)建一個(gè)棧幀(Stack Frame)用于存儲(chǔ)局部變量表、操作數(shù)棧、動(dòng)態(tài)連接、方法出口等信息。每一個(gè)方法被調(diào)用直至執(zhí)行完畢的過程,就對(duì)應(yīng)著一個(gè)棧幀在虛擬機(jī)棧中從入棧到出棧的過程。

  • 經(jīng)常有人把 Java 內(nèi)存區(qū)域籠統(tǒng)地劃分為堆內(nèi)存(Heap)和棧內(nèi)存(Stack),這種劃分方式直接繼承自傳統(tǒng)的 C、C++ 程序的內(nèi)存布局結(jié)構(gòu),在 Java 語言里就顯得有些粗糙了,實(shí)際的內(nèi)存區(qū)域劃分要比這更復(fù)雜。不過這種劃分方式的流行也間接說明了程序員最關(guān)注的、與對(duì)象內(nèi)存分配關(guān)系最密切的區(qū)域是“堆”和“?!眱蓧K。其中,“堆”在稍后筆者會(huì)專門講述,而“?!蓖ǔ>褪侵高@里講的虛擬機(jī)棧,或者更多的情況下只是指虛擬機(jī)棧中局部變量表部分。

  • 局部變量表存放了編譯期可知的各種 Java 虛擬機(jī)基本數(shù)據(jù)類型(boolean、byte、char、short、int、float、long、double)、對(duì)象引用(reference 類型,它并不等同于對(duì)象本身,可能是一個(gè)指向?qū)ο笃鹗嫉刂返囊弥羔?,也可能是指向一個(gè)代表對(duì)象的句柄或者其他與此對(duì)象相關(guān)的位置)和 returnAddress 類型(指向了一條字節(jié)碼指令的地址)。

  • 這些數(shù)據(jù)類型在局部變量表中的存儲(chǔ)空間以局部變量槽(Slot)來表示,其中 64 位長(zhǎng)度的 longdouble 類型的數(shù)據(jù)會(huì)占用兩個(gè)變量槽,其余的數(shù)據(jù)類型只占用一個(gè)。局部變量表所需的內(nèi)存空間在編譯期間完成分配,當(dāng)進(jìn)入一個(gè)方法時(shí),這個(gè)方法需要在棧幀中分配多大的局部變量空間是完全確定的,在方法運(yùn)行期間不會(huì)改變局部變量表的大小。請(qǐng)讀者注意,這里說的“大小”是指變量槽的數(shù)量,虛擬機(jī)真正使用多大的內(nèi)存空間(譬如按照 1 個(gè)變量槽占用 32 個(gè)比特、64 個(gè)比特,或者更多)來實(shí)現(xiàn)一個(gè)變量槽,這是完全由具體的虛擬機(jī)實(shí)現(xiàn)自行決定的事情。

  • 在《Java 虛擬機(jī)規(guī)范》中,對(duì)這個(gè)內(nèi)存區(qū)域規(guī)定了兩類異常狀況:如果線程請(qǐng)求的棧深度大于虛擬機(jī)所允許的深度,將拋出 StackOverflowError 異常;如果Java虛擬機(jī)棧容量可以動(dòng)態(tài)擴(kuò)展,當(dāng)棧擴(kuò)展時(shí)無法申請(qǐng)到足夠的內(nèi)存會(huì)拋出 OutOfMemoryError 異常。

本地方法棧

  • 本地方法棧(Native Method Stacks)與虛擬機(jī)棧所發(fā)揮的作用是非常相似的,其區(qū)別只是虛擬機(jī)棧為虛擬機(jī)執(zhí)行 Java 方法(也就是字節(jié)碼)服務(wù),而本地方法棧則是為虛擬機(jī)使用到的本地(Native)方法服務(wù)。

  • 《Java 虛擬機(jī)規(guī)范》對(duì)本地方法棧中方法使用的語言、使用方式與數(shù)據(jù)結(jié)構(gòu)并沒有任何強(qiáng)制規(guī)定,因此具體的虛擬機(jī)可以根據(jù)需要自由實(shí)現(xiàn)它,甚至有的 Java 虛擬機(jī)(譬如 Hot-Spot 虛擬機(jī))直接就把本地方法棧和虛擬機(jī)棧合二為一。與虛擬機(jī)棧一樣,本地方法棧也會(huì)在棧深度溢出或者棧擴(kuò)展失敗時(shí)分別拋出StackOverflowErrorOutOfMemoryError 異常。

Java 堆

  • 對(duì)于 Java 應(yīng)用程序來說,Java 堆(Java Heap)是虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java 堆是被所有線程共享的一塊內(nèi)存區(qū)域,在虛擬機(jī)啟動(dòng)時(shí)創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對(duì)象實(shí)例,Java 世界里“幾乎”所有的對(duì)象實(shí)例都在這里分配內(nèi)存。在《Java虛擬機(jī)規(guī)范》中對(duì)Java堆的描述是:“所有的對(duì)象實(shí)例以及數(shù)組都應(yīng)當(dāng)在堆上分配”,而這里寫的“幾乎”是指從實(shí)現(xiàn)角度來看,隨著 Java 語言的發(fā)展,現(xiàn)在已經(jīng)能看到些許跡象表明日后可能出現(xiàn)值類型的支持,即使只考慮現(xiàn)在,由于即時(shí)編譯技術(shù)的進(jìn)步,尤其是逃逸分析技術(shù)的日漸強(qiáng)大,棧上分配、標(biāo)量替換優(yōu)化手段已經(jīng)導(dǎo)致一些微妙的變化悄然發(fā)生,所以說 Java 對(duì)象實(shí)例都分配在堆上也漸漸變得不是那么絕對(duì)了。

  • Java 堆是垃圾收集器管理的內(nèi)存區(qū)域,因此一些資料中它也被稱作“GC堆”(Garbage Collected Heap,幸好國(guó)內(nèi)沒翻譯成“垃圾堆”)。從回收內(nèi)存的角度看,由于現(xiàn)代垃圾收集器大部分都是基于分代收集理論設(shè)計(jì)的,所以 Java 堆中經(jīng)常會(huì)出現(xiàn)“新生代”“老年代”“永久代”“Eden 空間”“From Survivor 空間”“To Survivor 空間”等名詞,這些概念在本書后續(xù)章節(jié)中還會(huì)反復(fù)登場(chǎng)亮相,在這里想先說明的是這些區(qū)域劃分僅僅是一部分垃圾收集器的共同特性或者說設(shè)計(jì)風(fēng)格而已,而非某個(gè) Java 虛擬機(jī)具體實(shí)現(xiàn)的固有內(nèi)存布局,更不是《Java 虛擬機(jī)規(guī)范》里對(duì) Java 堆的進(jìn)一步細(xì)致劃分。不少資料上經(jīng)常寫著類似于“Java 虛擬機(jī)的堆內(nèi)存分為新生代、老年代、永久代、Eden、Survivor……”這樣的內(nèi)容。在十年之前(以 G1 收集器的出現(xiàn)為分界),作為業(yè)界絕對(duì)主流的 HotSpot 虛擬機(jī),它內(nèi)部的垃圾收集器全部都基于“經(jīng)典分代”來設(shè)計(jì),需要新生代、老年代收集器搭配才能工作,在這種背景下,上述說法還算是不會(huì)產(chǎn)生太大歧義。但是到了今天,垃圾收集器技術(shù)與十年前已不可同日而語,HotSpot 里面也出現(xiàn)了不采用分代設(shè)計(jì)的新垃圾收集器,再按照上面的提法就有很多需要商榷的地方了。

  • 如果從分配內(nèi)存的角度看,所有線程共享的 Java 堆中可以劃分出多個(gè)線程私有的分配緩沖區(qū)(Thread Local Allocation Buffer,TLAB),以提升對(duì)象分配時(shí)的效率。不過無論從什么角度,無論如何劃分,都不會(huì)改變Java堆中存儲(chǔ)內(nèi)容的共性,無論是哪個(gè)區(qū)域,存儲(chǔ)的都只能是對(duì)象的實(shí)例,將 Java 堆細(xì)分的目的只是為了更好地回收內(nèi)存,或者更快地分配內(nèi)存。

  • 根據(jù)《Java 虛擬機(jī)規(guī)范》的規(guī)定,Java 堆可以處于物理上不連續(xù)的內(nèi)存空間中,但在邏輯上它應(yīng)該被視為連續(xù)的,這點(diǎn)就像我們用磁盤空間去存儲(chǔ)文件一樣,并不要求每個(gè)文件都連續(xù)存放。但對(duì)于大對(duì)象(典型的如數(shù)組對(duì)象),多數(shù)虛擬機(jī)實(shí)現(xiàn)出于實(shí)現(xiàn)簡(jiǎn)單、存儲(chǔ)高效的考慮,很可能會(huì)要求連續(xù)的內(nèi)存空間。

  • Java 堆既可以被實(shí)現(xiàn)成固定大小的,也可以是可擴(kuò)展的,不過當(dāng)前主流的 Java 虛擬機(jī)都是按照可擴(kuò)展來實(shí)現(xiàn)的(通過參數(shù) -Xmx-Xms 設(shè)定)。如果在 Java 堆中沒有內(nèi)存完成實(shí)例分配,并且堆也無法再擴(kuò)展時(shí),Java 虛擬機(jī)將會(huì)拋出 OutOfMemoryError 異常。

方法區(qū)

  • 方法區(qū)(Method Area)與 Java 堆一樣,是各個(gè)線程共享的內(nèi)存區(qū)域,它用于存儲(chǔ)已被虛擬機(jī)加載的類型信息、常量、靜態(tài)變量、即時(shí)編譯器編譯后的代碼緩存等數(shù)據(jù)。雖然《Java 虛擬機(jī)規(guī)范》中把方法區(qū)描述為堆的一個(gè)邏輯部分,但是它卻有一個(gè)別名叫作“非堆”(Non-Heap),目的是與 Java 堆區(qū)分開來。

  • 說到方法區(qū),不得不提一下“永久代”這個(gè)概念,尤其是在 JDK 8以前,許多Java程序員都習(xí)慣在 HotSpot 虛擬機(jī)上開發(fā)、部署程序,很多人都更愿意把方法區(qū)稱呼為“永久代”(Permanent Generation),或?qū)烧呋鞛橐徽?。本質(zhì)上這兩者并不是等價(jià)的,因?yàn)閮H僅是當(dāng)時(shí)的 HotSpot 虛擬機(jī)設(shè)計(jì)團(tuán)隊(duì)選擇把收集器的分代設(shè)計(jì)擴(kuò)展至方法區(qū),或者說使用永久代來實(shí)現(xiàn)方法區(qū)而已,這樣使得 HotSpot 的垃圾收集器能夠像管理 Java 堆一樣管理這部分內(nèi)存,省去專門為方法區(qū)編寫內(nèi)存管理代碼的工作。但是對(duì)于其他虛擬機(jī)實(shí)現(xiàn),譬如 BEA JRockit、IBM J9 等來說,是不存在永久代的概念的。原則上如何實(shí)現(xiàn)方法區(qū)屬于虛擬機(jī)實(shí)現(xiàn)細(xì)節(jié),不受《Java 虛擬機(jī)規(guī)范》管束,并不要求統(tǒng)一。但現(xiàn)在回頭來看,當(dāng)年使用永久代來實(shí)現(xiàn)方法區(qū)的決定并不是一個(gè)好主意,這種設(shè)計(jì)導(dǎo)致了 Java 應(yīng)用更容易遇到內(nèi)存溢出的問題(永久代有 -XX:MaxPermSize 的上限,即使不設(shè)置也有默認(rèn)大小,而 J9 和 JRockit 只要沒有觸碰到進(jìn)程可用內(nèi)存的上限,例如 32 位系統(tǒng)中的 4GB 限制,就不會(huì)出問題),而且有極少數(shù)方法(例如String::intern())會(huì)因永久代的原因而導(dǎo)致不同虛擬機(jī)下有不同的表現(xiàn)。當(dāng) Oracle 收購(gòu) BEA 獲得了 JRockit 的所有權(quán)后,準(zhǔn)備把 JRockit 中的優(yōu)秀功能,譬如 Java Mission Control 管理工具,移植到 HotSpot 虛擬機(jī)時(shí),但因?yàn)閮烧邔?duì)方法區(qū)實(shí)現(xiàn)的差異而面臨諸多困難。考慮到 HotSpot 未來的發(fā)展,在 JDK6 的時(shí)候 HotSpot 開發(fā)團(tuán)隊(duì)就有放棄永久代,逐步改為采用本地內(nèi)存(NativeMemory)來實(shí)現(xiàn)方法區(qū)的計(jì)劃了,到了 JDK 7的 HotSpot ,已經(jīng)把原本放在永久代的字符串常量池、靜態(tài)變量等移出,而到了 JDK 8,終于完全廢棄了永久代的概念,改用與 JRockit、J9 一樣在本地內(nèi)存中實(shí)現(xiàn)的元空間(Meta-space)來代替,把 JDK 7中永久代還剩余的內(nèi)容(主要是類型信息)全部移到元空間中。

直接內(nèi)存

  • 直接內(nèi)存(Direct Memory)并不是虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分,也不是《Java 虛擬機(jī)規(guī)范》中定義的內(nèi)存區(qū)域。但是這部分內(nèi)存也被頻繁地使用,而且也可能導(dǎo)致 OutOfMemoryError 異常出現(xiàn),所以我們放到這里一起講解。

  • 在 JDK 1.4中新加入了 NIO(New Input/Output)類,引入了一種基于通道(Channel)與緩沖區(qū)(Buffer)的 I/O 方式,它可以使用 Native 函數(shù)庫直接分配堆外內(nèi)存,然后通過一個(gè)存儲(chǔ)在 Java 堆里面的 DirectByteBuffer 對(duì)象作為這塊內(nèi)存的引用進(jìn)行操作。這樣能在一些場(chǎng)景中顯著提高性能,因?yàn)楸苊饬嗽?Java 堆和 Native 堆中來回復(fù)制數(shù)據(jù)。

  • 顯然,本機(jī)直接內(nèi)存的分配不會(huì)受到 Java 堆大小的限制,但是,既然是內(nèi)存,則肯定還是會(huì)受到本機(jī)總內(nèi)存(包括物理內(nèi)存、SWAP 分區(qū)或者分頁文件)大小以及處理器尋址空間的限制,一般服務(wù)器管理員配置虛擬機(jī)參數(shù)時(shí),會(huì)根據(jù)實(shí)際內(nèi)存去設(shè)置 -Xmx 等參數(shù)信息,但經(jīng)常忽略掉直接內(nèi)存,使得各個(gè)內(nèi)存區(qū)域總和大于物理內(nèi)存限制(包括物理的和操作系統(tǒng)級(jí)的限制),從而導(dǎo)致動(dòng)態(tài)擴(kuò)展時(shí)出現(xiàn) OutOfMemoryError 異常。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容