我們知道,計(jì)算機(jī)CPU和內(nèi)存的交互是最頻繁的,內(nèi)存是我們的高速緩存區(qū),用戶磁盤和CPU的交互,而CPU運(yùn)轉(zhuǎn)速度越來越快,磁盤遠(yuǎn)遠(yuǎn)跟不上CPU的讀寫速度,才設(shè)計(jì)了內(nèi)存,用戶緩沖用戶IO等待導(dǎo)致CPU的等待成本,但是隨著CPU的發(fā)展,內(nèi)存的讀寫速度也遠(yuǎn)遠(yuǎn)跟不上CPU的讀寫速度,因此,為了解決這一糾紛,CPU廠商在每顆CPU上加入了高速緩存,用來緩解這種癥狀,因此,現(xiàn)在CPU同內(nèi)存交互就變成了下面的樣子。

同樣,根據(jù)摩爾定律,我們知道單核
CPU的主頻不可能無限制的增長,要想很多的提升新能,需要多個處理器協(xié)同工作, Intel總裁的貝瑞特單膝下跪事件標(biāo)志著多核時代的到來。

基于高速緩存的存儲交互很好的解決了處理器與內(nèi)存之間的矛盾,也引入了新的問題:緩存一致性問題。在多處理器系統(tǒng)中,每個處理器有自己的高速緩存,而他們又共享同一塊內(nèi)存(下文成主存,
main memory 主要內(nèi)存),當(dāng)多個處理器運(yùn)算都涉及到同一塊內(nèi)存區(qū)域的時候,就有可能發(fā)生緩存不一致的現(xiàn)象。為了解決這一問題,需要各個處理器運(yùn)行時都遵循一些協(xié)議,在運(yùn)行時需要將這些協(xié)議保證數(shù)據(jù)的一致性。這類協(xié)議包括MSI、MESI、MOSI、Synapse、Firely、DragonProtocol等。如下圖所示

Java
虛擬機(jī)內(nèi)存模型中定義的訪問操作與物理計(jì)算機(jī)處理的基本一致!

Java
中通過多線程機(jī)制使得多個任務(wù)同時執(zhí)行處理,所有的線程共享JVM內(nèi)存區(qū)域main memory,而每個線程又單獨(dú)的有自己的工作內(nèi)存,當(dāng)線程與內(nèi)存區(qū)域進(jìn)行交互時,數(shù)據(jù)從主存拷貝到工作內(nèi)存,進(jìn)而交由線程處理(操作碼+操作數(shù))。更多信息我們會在后面的《深入JVM—JVM類執(zhí)行機(jī)制中詳細(xì)解說》。在之前,我們也已經(jīng)提到,JVM的邏輯內(nèi)存模型如下:

我們現(xiàn)在來逐個的看下每個到底是做什么的!
1、程序計(jì)數(shù)器
程序計(jì)數(shù)器(Program Counter Register)是一塊較小的內(nèi)存空間,它的作用可以看
做是當(dāng)前線程所執(zhí)行的字節(jié)碼的行號指示器。在虛擬機(jī)的概念模型里(僅是概念模型,
各種虛擬機(jī)可能會通過一些更高效的方式去實(shí)現(xiàn)),字節(jié)碼解釋器工作時就是通過改變
這個計(jì)數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令,分支、循環(huán)、跳轉(zhuǎn)、異常處理、
線程恢復(fù)等基礎(chǔ)功能都需要依賴這個計(jì)數(shù)器來完成。
由于Java 虛擬機(jī)的多線程是通過線程輪流切換并分配處理器執(zhí)行時間的方式來實(shí)現(xiàn)
的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內(nèi)核)只會執(zhí)行
一條線程中的指令。因此,為了線程切換后能恢復(fù)到正確的執(zhí)行位置,每條線程都需要
有一個獨(dú)立的程序計(jì)數(shù)器,各條線程之間的計(jì)數(shù)器互不影響,獨(dú)立存儲,我們稱這類內(nèi)
存區(qū)域?yàn)椤熬€程私有”的內(nèi)存。
如果線程正在執(zhí)行的是一個Java 方法,這個計(jì)數(shù)器記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)
碼指令的地址;如果正在執(zhí)行的是Natvie 方法,這個計(jì)數(shù)器值則為空(Undefined)。此
內(nèi)存區(qū)域是唯一一個在Java 虛擬機(jī)規(guī)范中沒有規(guī)定任何OutOfMemoryError 情況的區(qū)域。
2、Java 虛擬機(jī)棧
與程序計(jì)數(shù)器一樣,Java 虛擬機(jī)棧(Java Virtual Machine Stacks)也是線程私有的,
它的生命周期與線程相同。虛擬機(jī)棧描述的是Java 方法執(zhí)行的內(nèi)存模型:每個方法被執(zhí)
行的時候都會同時創(chuàng)建一個棧幀(Stack Frame ①)用于存儲局部變量表、操作棧、動態(tài)
鏈接、方法出口等信息。每一個方法被調(diào)用直至執(zhí)行完成的過程,就對應(yīng)著一個棧幀在
虛擬機(jī)棧中從入棧到出棧的過程。
經(jīng)常有人把Java 內(nèi)存區(qū)分為堆內(nèi)存(Heap)和棧內(nèi)存(Stack),這種分法比較粗
糙,Java 內(nèi)存區(qū)域的劃分實(shí)際上遠(yuǎn)比這復(fù)雜。這種劃分方式的流行只能說明大多數(shù)程序
員最關(guān)注的、與對象內(nèi)存分配關(guān)系最密切的內(nèi)存區(qū)域是這兩塊。其中所指的“堆”在后
面會專門講述,而所指的“?!本褪乾F(xiàn)在講的虛擬機(jī)棧,或者說是虛擬機(jī)棧中的局部變
量表部分。
局部變量表存放了編譯期可知的各種基本數(shù)據(jù)類型(boolean、byte、char、short、int、
float、long、double)、對象引用(reference 類型,它不等同于對象本身,根據(jù)不同的虛擬
機(jī)實(shí)現(xiàn),它可能是一個指向?qū)ο笃鹗嫉刂返囊弥羔?,也可能指向一個代表對象的句柄或
者其他與此對象相關(guān)的位置)和returnAddress 類型(指向了一條字節(jié)碼指令的地址)。
其中64 位長度的long 和double 類型的數(shù)據(jù)會占用2 個局部變量空間(Slot),其余
的數(shù)據(jù)類型只占用1 個。局部變量表所需的內(nèi)存空間在編譯期間完成分配,當(dāng)進(jìn)入一個
方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運(yùn)行期間
不會改變局部變量表的大小。
在Java 虛擬機(jī)規(guī)范中,對這個區(qū)域規(guī)定了兩種異常狀況:如果線程請求的棧深度大
于虛擬機(jī)所允許的深度,將拋出StackOverflowError 異常;如果虛擬機(jī)??梢詣討B(tài)擴(kuò)展
(當(dāng)前大部分的Java 虛擬機(jī)都可動態(tài)擴(kuò)展,只不過Java 虛擬機(jī)規(guī)范中也允許固定長度的
虛擬機(jī)棧),當(dāng)擴(kuò)展時無法申請到足夠的內(nèi)存時會拋出OutOfMemoryError 異常。
3、本地方法棧
本地方法棧(Native Method Stacks)與虛擬機(jī)棧所發(fā)揮的作用是非常相似的,其
區(qū)別不過是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java 方法(也就是字節(jié)碼)服務(wù),而本地方法棧則
是為虛擬機(jī)使用到的Native 方法服務(wù)。虛擬機(jī)規(guī)范中對本地方法棧中的方法使用的語
言、使用方式與數(shù)據(jù)結(jié)構(gòu)并沒有強(qiáng)制規(guī)定,因此具體的虛擬機(jī)可以自由實(shí)現(xiàn)它。甚至
有的虛擬機(jī)(譬如Sun HotSpot 虛擬機(jī))直接就把本地方法棧和虛擬機(jī)棧合二為一。
與虛擬機(jī)棧一樣,本地方法棧區(qū)域也會拋出StackOverflowError 和OutOfMemoryError
異常。
4、Java 堆
對于大多數(shù)應(yīng)用來說,Java 堆(Java Heap)是Java 虛擬機(jī)所管理的內(nèi)存中最大的
一塊。Java 堆是被所有線程共享的一塊內(nèi)存區(qū)域,在虛擬機(jī)啟動時創(chuàng)建。此內(nèi)存區(qū)域的
唯一目的就是存放對象實(shí)例,幾乎所有的對象實(shí)例都在這里分配內(nèi)存。這一點(diǎn)在Java 虛
擬機(jī)規(guī)范中的描述是:所有的對象實(shí)例以及數(shù)組都要在堆上分配①,但是隨著JIT 編譯器
的發(fā)展與逃逸分析技術(shù)的逐漸成熟,棧上分配、標(biāo)量替換②優(yōu)化技術(shù)將會導(dǎo)致一些微妙
的變化發(fā)生,所有的對象都分配在堆上也漸漸變得不是那么“絕對”了。
Java 堆是垃圾收集器管理的主要區(qū)域,因此很多時候也被稱做“GC 堆”(Garbage
Collected Heap,幸好國內(nèi)沒翻譯成“垃圾堆”)。如果從內(nèi)存回收的角度看,由于現(xiàn)在
收集器基本都是采用的分代收集算法,所以Java 堆中還可以細(xì)分為:新生代和老年代;
再細(xì)致一點(diǎn)的有Eden 空間、From Survivor 空間、To Survivor 空間等。如果從內(nèi)存分配
的角度看,線程共享的Java 堆中可能劃分出多個線程私有的分配緩沖區(qū)(Thread Local
Allocation Buffer,TLAB)。不過,無論如何劃分,都與存放內(nèi)容無關(guān),無論哪個區(qū)域,
存儲的都仍然是對象實(shí)例,進(jìn)一步劃分的目的是為了更好地回收內(nèi)存,或者更快地分配
內(nèi)存。在本章中,我們僅僅針對內(nèi)存區(qū)域的作用進(jìn)行討論,Java 堆中的上述各個區(qū)域的
分配和回收等細(xì)節(jié)將會是下一章的主題。
根據(jù)Java 虛擬機(jī)規(guī)范的規(guī)定,Java 堆可以處于物理上不連續(xù)的內(nèi)存空間中,只要
邏輯上是連續(xù)的即可,就像我們的磁盤空間一樣。在實(shí)現(xiàn)時,既可以實(shí)現(xiàn)成固定大小
的,也可以是可擴(kuò)展的,不過當(dāng)前主流的虛擬機(jī)都是按照可擴(kuò)展來實(shí)現(xiàn)的(通過-Xmx
和-Xms 控制)。如果在堆中沒有內(nèi)存完成實(shí)例分配,并且堆也無法再擴(kuò)展時,將會拋出
OutOfMemoryError 異常。
4、方法區(qū)
方法區(qū)(Method Area)與Java 堆一樣,是各個線程共享的內(nèi)存區(qū)域,它用于存
儲已被虛擬機(jī)加載的類信息、常量、靜態(tài)變量、即時編譯器編譯后的代碼等數(shù)據(jù)。雖
然Java 虛擬機(jī)規(guī)范把方法區(qū)描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-
Heap(非堆),目的應(yīng)該是與Java 堆區(qū)分開來。
對于習(xí)慣在HotSpot 虛擬機(jī)上開發(fā)和部署程序的開發(fā)者來說,很多人愿意把方法區(qū)
稱為“永久代”(Permanent Generation),本質(zhì)上兩者并不等價,僅僅是因?yàn)镠otSpot 虛
擬機(jī)的設(shè)計(jì)團(tuán)隊(duì)選擇把GC 分代收集擴(kuò)展至方法區(qū),或者說使用永久代來實(shí)現(xiàn)方法區(qū)而
已。對于其他虛擬機(jī)(如BEA JRockit、IBM J9 等)來說是不存在永久代的概念的。即
使是HotSpot 虛擬機(jī)本身,根據(jù)官方發(fā)布的路線圖信息,現(xiàn)在也有放棄永久代并“搬家”
至Native Memory 來實(shí)現(xiàn)方法區(qū)的規(guī)劃了。
Java 虛擬機(jī)規(guī)范對這個區(qū)域的限制非常寬松,除了和Java 堆一樣不需要連續(xù)的內(nèi)
存和可以選擇固定大小或者可擴(kuò)展外,還可以選擇不實(shí)現(xiàn)垃圾收集。相對而言,垃圾
收集行為在這個區(qū)域是比較少出現(xiàn)的,但并非數(shù)據(jù)進(jìn)入了方法區(qū)就如永久代的名字一
樣“永久”存在了。這個區(qū)域的內(nèi)存回收目標(biāo)主要是針對常量池的回收和對類型的卸
載,一般來說這個區(qū)域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件
相當(dāng)苛刻,但是這部分區(qū)域的回收確實(shí)是有必要的。在Sun 公司的BUG 列表中,曾出
現(xiàn)過的若干個嚴(yán)重的BUG 就是由于低版本的HotSpot 虛擬機(jī)對此區(qū)域未完全回收而導(dǎo)
致內(nèi)存泄漏。
根據(jù)Java 虛擬機(jī)規(guī)范的規(guī)定,當(dāng)方法區(qū)無法滿足內(nèi)存分配需求時,將拋出
OutOfMemoryError 異常。
5、運(yùn)行時常量池
運(yùn)行時常量池(Runtime Constant Pool)是方法區(qū)的一部分。Class 文件中除了有
類的版本、字段、方法、接口等描述等信息外,還有一項(xiàng)信息是常量池(Constant Pool
Table),用于存放編譯期生成的各種字面量和符號引用,這部分內(nèi)容將在類加載后存放
到方法區(qū)的運(yùn)行時常量池中。
Java 虛擬機(jī)對Class 文件的每一部分(自然也包括常量池)的格式都有嚴(yán)格的規(guī)
定,每一個字節(jié)用于存儲哪種數(shù)據(jù)都必須符合規(guī)范上的要求,這樣才會被虛擬機(jī)認(rèn)可、
裝載和執(zhí)行。但對于運(yùn)行時常量池,Java 虛擬機(jī)規(guī)范沒有做任何細(xì)節(jié)的要求,不同的
提供商實(shí)現(xiàn)的虛擬機(jī)可以按照自己的需要來實(shí)現(xiàn)這個內(nèi)存區(qū)域。不過,一般來說,除
了保存Class 文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運(yùn)行時常
量池中①。
運(yùn)行時常量池相對于Class 文件常量池的另外一個重要特征是具備動態(tài)性,Java 語
言并不要求常量一定只能在編譯期產(chǎn)生,也就是并非預(yù)置入Class 文件中常量池的內(nèi)容
才能進(jìn)入方法區(qū)運(yùn)行時常量池,運(yùn)行期間也可能將新的常量放入池中,這種特性被開發(fā)
人員利用得比較多的便是String 類的intern() 方法。
既然運(yùn)行時常量池是方法區(qū)的一部分,自然會受到方法區(qū)內(nèi)存的限制,當(dāng)常量池?zé)o
法再申請到內(nèi)存時會拋出OutOfMemoryError 異常
6、直接內(nèi)存
直接內(nèi)存(Direct Memory)并不是虛擬機(jī)運(yùn)行時數(shù)據(jù)區(qū)的一部分,也不是Java
虛擬機(jī)規(guī)范中定義的內(nèi)存區(qū)域,但是這部分內(nèi)存也被頻繁地使用,而且也可能導(dǎo)致
OutOfMemoryError 異常出現(xiàn),所以我們放到這里一起講解。
在JDK 1.4 中新加入了NIO(New Input/Output)類,引入了一種基于通道(Channel)
與緩沖區(qū)(Buffer)的I/O 方式,它可以使用Native 函數(shù)庫直接分配堆外內(nèi)存,然
后通過一個存儲在Java 堆里面的DirectByteBuffer 對象作為這塊內(nèi)存的引用進(jìn)行
操作。這樣能在一些場景中顯著提高性能,因?yàn)楸苊饬嗽贘ava 堆和Native 堆中來
回復(fù)制數(shù)據(jù)。
顯然,本機(jī)直接內(nèi)存的分配不會受到Java 堆大小的限制,但是,既然是內(nèi)存,則
肯定還是會受到本機(jī)總內(nèi)存(包括RAM 及SWAP 區(qū)或者分頁文件)的大小及處理器
尋址空間的限制。服務(wù)器管理員配置虛擬機(jī)參數(shù)時,一般會根據(jù)實(shí)際內(nèi)存設(shè)置-Xmx
等參數(shù)信息,但經(jīng)常會忽略掉直接內(nèi)存,使得各個內(nèi)存區(qū)域的總和大于物理內(nèi)存限制
(包括物理上的和操作系統(tǒng)級的限制),從而導(dǎo)致動態(tài)擴(kuò)展時出現(xiàn)OutOfMemoryError
異常。
邏輯內(nèi)存模型我們已經(jīng)看到了,那當(dāng)我們建立一個對象的時候是怎么進(jìn)行訪問的呢?
在Java 語言中,對象訪問是如何進(jìn)行的?對象訪問在Java 語言中無處不在,是最普通的程序行為,但即使是最簡單的訪問,也會卻涉及Java 棧、Java 堆、方法區(qū)這三個最重要內(nèi)存區(qū)
域之間的關(guān)聯(lián)關(guān)系,如下面的這句代碼:
Object obj = new Object();
假設(shè)這句代碼出現(xiàn)在方法體中,那“Object obj”這部分的語義將會反映到Java 棧
的本地變量表中,作為一個reference 類型數(shù)據(jù)出現(xiàn)。而“new Object()”這部分的語義
將會反映到Java 堆中,形成一塊存儲了Object 類型所有實(shí)例數(shù)據(jù)值(Instance Data,對
象中各個實(shí)例字段的數(shù)據(jù))的結(jié)構(gòu)化內(nèi)存,根據(jù)具體類型以及虛擬機(jī)實(shí)現(xiàn)的對象內(nèi)存布
局(Object Memory Layout)的不同,這塊內(nèi)存的長度是不固定的。另外,在Java 堆中
還必須包含能查找到此對象類型數(shù)據(jù)(如對象類型、父類、實(shí)現(xiàn)的接口、方法等)的地
址信息,這些類型數(shù)據(jù)則存儲在方法區(qū)中。
由于reference 類型在Java 虛擬機(jī)規(guī)范里面只規(guī)定了一個指向?qū)ο蟮囊茫]有
定義這個引用應(yīng)該通過哪種方式去定位,以及訪問到Java 堆中的對象的具體位置,因此
不同虛擬機(jī)實(shí)現(xiàn)的對象訪問方式會有所不同,主流的訪問方式有兩種:使用句柄和直接
指針。
如果使用句柄訪問方式,Java 堆中將會劃分出一塊內(nèi)存來作為句柄池,reference
中存儲的就是對象的句柄地址,而句柄中包含了對象實(shí)例數(shù)據(jù)和類型數(shù)據(jù)各自的
具體地址信息,如下圖所示。

如果使用直接指針訪問方式,
Java 堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息,reference 中直接存儲的就是對象地址,如下圖所示

這兩種對象的訪問方式各有優(yōu)勢,使用句柄訪問方式的最大好處就是
reference 中存儲的是穩(wěn)定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只
會改變句柄中的實(shí)例數(shù)據(jù)指針,而reference 本身不需要被修改。
使用直接指針訪問方式的最大好處就是速度更快,它節(jié)省了一次指針定位的時間開
銷,由于對象的訪問在Java 中非常頻繁,因此這類開銷積少成多后也是一項(xiàng)非??捎^的
執(zhí)行成本。就本書討論的主要虛擬機(jī)Sun HotSpot 而言,它是使用第二種方式進(jìn)行對象訪問的,但從整個軟件開發(fā)的范圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。