類裝載子系統(tǒng)
在JAVA虛擬機(jī)中,負(fù)責(zé)查找并裝載類型的那部分被稱為類裝載子系統(tǒng)。
JAVA虛擬機(jī)有兩種類裝載器:啟動類裝載器和用戶自定義類裝載器。前者是JAVA虛擬機(jī)實現(xiàn)的一部分,后者則是Java程序的一部分。由不同的類裝載器裝載的類將被放在虛擬機(jī)內(nèi)部的不同命名空間中。
類裝載器子系統(tǒng)涉及Java虛擬機(jī)的其他幾個組成部分,以及幾個來自java.lang庫的類。比如,用戶自定義的類裝載器是普通的Java對象,它的類必須派生自java.lang.ClassLoader類。ClassLoader中定義的方法為程序提供了訪問類裝載器機(jī)制的接口。此外,對于每一個被裝載的類型,JAVA虛擬機(jī)都會為它創(chuàng)建一個java.lang.Class類的實例來代表該類型。和所有其他對象一樣,用戶自定義的類裝載器以及Class類的實例都放在內(nèi)存中的堆區(qū),而裝載的類型信息則都位于方法區(qū)。
類裝載器子系統(tǒng)除了要定位和導(dǎo)入二進(jìn)制class文件外,還必須負(fù)責(zé)驗證被導(dǎo)入類的正確性,為類變量分配并初始化內(nèi)存,以及幫助解析符號引用。這些動作必須嚴(yán)格按以下順序進(jìn)行:
?。?)裝載——查找并裝載類型的二進(jìn)制數(shù)據(jù)。
?。?)連接——指向驗證、準(zhǔn)備、以及解析(可選)。
● 驗證 確保被導(dǎo)入類型的正確性。
● 準(zhǔn)備 為類變量分配內(nèi)存,并將其初始化為默認(rèn)值。
● 解析 把類型中的符號引用轉(zhuǎn)換為直接引用。
(3)初始化——把類變量初始化為正確初始值。
每個JAVA虛擬機(jī)實現(xiàn)都必須有一個啟動類裝載器,它知道怎么裝載受信任的類。
每個類裝載器都有自己的命名空間,其中維護(hù)著由它裝載的類型。所以一個Java程序可以多次裝載具有同一個全限定名的多個類型。這樣一個類型的全限定名就不足以確定在一個Java虛擬機(jī)中的唯一性。因此,當(dāng)多個類裝載器都裝載了同名的類型時,為了惟一地標(biāo)識該類型,還要在類型名稱前加上裝載該類型(指出它所位于的命名空間)的類裝載器標(biāo)識。
方法區(qū)
在Java虛擬機(jī)中,關(guān)于被裝載類型的信息存儲在一個邏輯上被稱為方法區(qū)的內(nèi)存中。當(dāng)虛擬機(jī)裝載某個類型時,它使用類裝載器定位相應(yīng)的class文件,然后讀入這個class文件——1個線性二進(jìn)制數(shù)據(jù)流,然后它傳輸?shù)教摂M機(jī)中,緊接著虛擬機(jī)提取其中的類型信息,并將這些信息存儲到方法區(qū)。該類型中的類(靜態(tài))變量同樣也是存儲在方法區(qū)中。
JAVA虛擬機(jī)在內(nèi)部如何存儲類型信息,這是由具體實現(xiàn)的設(shè)計者來決定的。
當(dāng)虛擬機(jī)運行Java程序時,它會查找使用存儲在方法區(qū)中的類型信息。由于所有線程都共享方法區(qū),因此它們對方法區(qū)數(shù)據(jù)的訪問必須被設(shè)計為是線程安全的。比如,假設(shè)同時有兩個線程都企圖訪問一個名為Lava的類,而這個類還沒有被裝入虛擬機(jī),那么,這時只應(yīng)該有一個線程去裝載它,而另一個線程則只能等待。
對于每個裝載的類型,虛擬機(jī)都會在方法區(qū)中存儲以下類型信息:
● 這個類型的全限定名
● 這個類型的直接超類的全限定名(除非這個類型是java.lang.Object,它沒有超類)
● 這個類型是類類型還是接口類型
● 這個類型的訪問修飾符(public、abstract或final的某個子集)
● 任何直接超接口的全限定名的有序列表
除了上面列出的基本類型信息外,虛擬機(jī)還得為每個被裝載的類型存儲以下信息:
● 該類型的常量池
● 字段信息
● 方法信息
● 除了常量以外的所有類(靜態(tài))變量
● 一個到類ClassLoader的引用
● 一個到Class類的引用
常量池
虛擬機(jī)必須為每個被裝載的類型維護(hù)一個常量池。常量池就是該類型所用常量的一個有序集合,包括直接常量和對其他類型、字段和方法的符號引用。池中的數(shù)據(jù)項就像數(shù)組一樣是通過索引訪問的。因為常量池存儲了相應(yīng)類型所用到的所有類型、字段和方法的符號引用,所以它在Java程序的動態(tài)連接中起著核心的作用。
字段信息
對于類型中聲明的每一個字段。方法區(qū)中必須保存下面的信息。除此之外,這些字段在類或者接口中的聲明順序也必須保存。
○ 字段名
○ 字段的類型
○ 字段的修飾符(public、private、protected、static、final、volatile、transient的某個子集)
方法信息
對于類型中聲明的每一個方法,方法區(qū)中必須保存下面的信息。和字段一樣,這些方法在類或者接口中的聲明順序也必須保存。
○ 方法名
○ 方法的返回類型(或void)
○ 方法參數(shù)的數(shù)量和類型(按聲明順序)
○ 方法的修飾符(public、private、protected、static、final、synchronized、native、abstract的某個子集)
除了上面清單中列出的條目之外,如果某個方法不是抽象的和本地的,它還必須保存下列信息:
○ 方法的字節(jié)碼(bytecodes)
○ 操作數(shù)棧和該方法的棧幀中的局部變量區(qū)的大小
○ 異常表
類(靜態(tài))變量
類變量是由所有類實例共享的,但是即使沒有任何類實例,它也可以被訪問。這些變量只與類有關(guān)——而非類的實例,因此它們總是作為類型信息的一部分而存儲在方法區(qū)。除了在類中聲明的編譯時常量外,虛擬機(jī)在使用某個類之前,必須在方法區(qū)中為這些類變量分配空間。
而編譯時常量(就是那些用final聲明以及用編譯時已知的值初始化的類變量)則和一般的類變量處理方式不同,每個使用編譯時常量的類型都會復(fù)制它的所有常量到自己的常量池中,或嵌入到它的字節(jié)碼流中。作為常量池或字節(jié)碼流的一部分,編譯時常量保存在方法區(qū)中——就和一般的類變量一樣。但是當(dāng)一般的類變量作為聲明它們的類型的一部分?jǐn)?shù)據(jù)面保存的時候,編譯時常量作為使用它們的類型的一部分而保存。
指向ClassLoader類的引用
每個類型被裝載的時候,虛擬機(jī)必須跟蹤它是由啟動類裝載器還是由用戶自定義類裝載器裝載的。如果是用戶自定義類裝載器裝載的,那么虛擬機(jī)必須在類型信息中存儲對該裝載器的引用。這是作為方法表中的類型數(shù)據(jù)的一部分保存的。
虛擬機(jī)會在動態(tài)連接期間使用這個信息。當(dāng)某個類型引用另一個類型的時候,虛擬機(jī)會請求裝載發(fā)起引用類型的類裝載器來裝載被引用的類型。這個動態(tài)連接的過程,對于虛擬機(jī)分離命名空間的方式也是至關(guān)重要的。為了能夠正確地執(zhí)行動態(tài)連接以及維護(hù)多個命名空間,虛擬機(jī)需要在方法表中得知每個類都是由哪個類裝載器裝載的。
指向Class類的引用
對于每一個被裝載的類型(不管是類還是接口),虛擬機(jī)都會相應(yīng)地為它創(chuàng)建一個java.lang.Class類的實例,而且虛擬機(jī)還必須以某種方式把這個實例和存儲在方法區(qū)中的類型數(shù)據(jù)關(guān)聯(lián)起來。
在Java程序中,你可以得到并使用指向Class對象的引用。Class類中的一個靜態(tài)方法可以讓用戶得到任何已裝載的類的Class實例的引用。
public static Class<?> forName(String className)
比如,如果調(diào)用forName("java.lang.Object"),那么將得到一個代表java.lang.Object的Class對象的引用??梢允褂胒orName()來得到代表任何包中任何類型的Class對象的引用,只要這個類型可以被(或者已經(jīng)被)裝載到當(dāng)前命名空間中。如果虛擬機(jī)無法把請求的類型裝載到當(dāng)前命名空間,那么會拋出ClassNotFoundException異常。
另一個得到Class對象引用的方法是,可以調(diào)用任何對象引用的getClass()方法。這個方法被來自O(shè)bject類本身的所有對象繼承:
public final native Class<?> getClass();
比如,如果你有一個到j(luò)ava.lang.Integer類的對象的引用,那么你只需簡單地調(diào)用Integer對象引用的getClass()方法,就可以得到表示java.lang.Integer類的Class對象。
方法區(qū)使用實例
為了展示虛擬機(jī)如何使用方法區(qū)中的信息,下面來舉例說明:
class Lava {
private int speed = 5;
void flow(){
}
}
public class Volcano {
public static void main(String[] args){
Lava lava = new Lava();
lava.flow();
}
}
不同的虛擬機(jī)實現(xiàn)可能會用完全不同的方法來操作,下面描述的只是其中一種可能——但并不是僅有的一種。
要運行Volcano程序,首先得以某種“依賴于實現(xiàn)的”方式告訴虛擬機(jī)“Volcano”這個名字。之后,虛擬機(jī)將找到并讀入相應(yīng)的class文件“Volcano.class”,然后它會從導(dǎo)入的class文件里的二進(jìn)制數(shù)據(jù)中提取類型信息并放到方法區(qū)中。通過執(zhí)行保存在方法區(qū)中的字節(jié)碼,虛擬機(jī)開始執(zhí)行main()方法,在執(zhí)行時,它會一直持有指向當(dāng)前類(Volcano類)的常量池(方法區(qū)中的一個數(shù)據(jù)結(jié)構(gòu))的指針。
注意:虛擬機(jī)開始執(zhí)行Volcano類中main()方法的字節(jié)碼的時候,盡管Lava類還沒被裝載,但是和大多數(shù)(也許所有)虛擬機(jī)實現(xiàn)一樣,它不會等到把程序中用到的所有類都裝載后才開始運行。恰好相反,它只會需要時才裝載相應(yīng)的類。
main()的第一條指令告知虛擬機(jī)為列在常量池第一項的類分配足夠的內(nèi)存。所以虛擬機(jī)使用指向Volcano常量池的指針找到第一項,發(fā)現(xiàn)它是一個對Lava類的符號引用,然后它就檢查方法區(qū),看Lava類是否已經(jīng)被加載了。
這個符號引用僅僅是一個給出了類Lava的全限定名“Lava”的字符串。為了能讓虛擬機(jī)盡可能快地從一個名稱找到類,虛擬機(jī)的設(shè)計者應(yīng)當(dāng)選擇最佳的數(shù)據(jù)結(jié)構(gòu)和算法。
當(dāng)虛擬機(jī)發(fā)現(xiàn)還沒有裝載過名為“Lava”的類時,它就開始查找并裝載文件“Lava.class”,并把從讀入的二進(jìn)制數(shù)據(jù)中提取的類型信息放在方法區(qū)中。
緊接著,虛擬機(jī)以一個直接指向方法區(qū)Lava類數(shù)據(jù)的指針來替換常量池第一項(就是那個字符串“Lava”),以后就可以用這個指針來快速地訪問Lava類了。這個替換過程稱為常量池解析,即把常量池中的符號引用替換為直接引用。
終于,虛擬機(jī)準(zhǔn)備為一個新的Lava對象分配內(nèi)存。此時它又需要方法區(qū)中的信息。還記得剛剛放到Volcano類常量池第一項的指針嗎?現(xiàn)在虛擬機(jī)用它來訪問Lava類型信息,找出其中記錄的這樣一條信息:一個Lava對象需要分配多少堆空間。
JAVA虛擬機(jī)總能夠通過存儲與方法區(qū)的類型信息來確定一個對象需要多少內(nèi)存,當(dāng)JAVA虛擬機(jī)確定了一個Lava對象的大小后,它就在堆上分配這么大的空間,并把這個對象實例的變量speed初始化為默認(rèn)初始值0。
當(dāng)把新生成的Lava對象的引用壓到棧中,main()方法的第一條指令也完成了。接下來的指令通過這個引用調(diào)用Java代碼(該代碼把speed變量初始化為正確初始值5)。另一條指令將用這個引用調(diào)用Lava對象引用的flow()方法。
堆
Java程序在運行時創(chuàng)建的所有類實例或數(shù)組都放在同一個堆中。而一個JAVA虛擬機(jī)實例中只存在一個堆空間,因此所有線程都將共享這個堆。又由于一個Java程序獨占一個JAVA虛擬機(jī)實例,因而每個Java程序都有它自己的堆空間——它們不會彼此干擾。但是同一個Java程序的多個線程卻共享著同一個堆空間,在這種情況下,就得考慮多線程訪問對象(堆數(shù)據(jù))的同步問題了。
JAVA虛擬機(jī)有一條在堆中分配新對象的指令,卻沒有釋放內(nèi)存的指令,正如你無法用Java代碼區(qū)明確釋放一個對象一樣。虛擬機(jī)自己負(fù)責(zé)決定如何以及何時釋放不再被運行的程序引用的對象所占據(jù)的內(nèi)存。通常,虛擬機(jī)把這個任務(wù)交給垃圾收集器。
數(shù)組的內(nèi)部表示
在Java中,數(shù)組是真正的對象。和其他對象一樣,數(shù)組總是存儲在堆中。同樣,數(shù)組也擁有一個與它們的類相關(guān)聯(lián)的Class實例,所有具有相同維度和類型的數(shù)組都是同一個類的實例,而不管數(shù)組的長度(多維數(shù)組每一維的長度)是多少。例如一個包含3個int整數(shù)的數(shù)組和一個包含300個整數(shù)的數(shù)組擁有同一個類。數(shù)組的長度只與實例數(shù)據(jù)有關(guān)。
數(shù)組類的名稱由兩部分組成:每一維用一個方括號“[”表示,用字符或字符串表示元素類型。比如,元素類型為int整數(shù)的、一維數(shù)組的類名為“[I”,元素類型為byte的三維數(shù)組為“[[[B”,元素類型為Object的二維數(shù)組為“[[Ljava/lang/Object”。
多維數(shù)組被表示為數(shù)組的數(shù)組。比如,int類型的二維數(shù)組,將表示為一個一維數(shù)組,其中的每一個元素是一個一維int數(shù)組的引用,如下圖:

在堆中的每個數(shù)組對象還必須保存的數(shù)據(jù)時數(shù)組的長度、數(shù)組數(shù)據(jù),以及某些指向數(shù)組的類數(shù)據(jù)的引用。虛擬機(jī)必須能夠通過一個數(shù)組對象的引用得到此數(shù)組的長度,通過索引訪問其元素(期間要檢查數(shù)組邊界是否越界),調(diào)用所有數(shù)組的直接超類Object聲明的方法等等。
程序計數(shù)器
對于一個運行中的Java程序而言,其中的每一個線程都有它自己的PC(程序計數(shù)器)寄存器,它是在該線程啟動時創(chuàng)建的,PC寄存器的大小是一個字長,因此它既能夠持有一個本地指針,也能夠持有一個returnAddress。當(dāng)線程執(zhí)行某個Java方法時,PC寄存器的內(nèi)容總是下一條將被執(zhí)行指令的“地址”,這里的“地址”可以是一個本地指針,也可以是在方法字節(jié)碼中相對于該方法起始指令的偏移量。如果該線程正在執(zhí)行一個本地方法,那么此時PC寄存器的值是“undefined”。
Java棧
每當(dāng)啟動一個新線程時,Java虛擬機(jī)都會為它分配一個Java棧。Java棧以幀為單位保存線程的運行狀態(tài)。虛擬機(jī)只會直接對Java棧執(zhí)行兩種操作:以幀為單位的壓棧和出棧。
某個線程正在執(zhí)行的方法被稱為該線程的當(dāng)前方法,當(dāng)前方法使用的棧幀稱為當(dāng)前幀,當(dāng)前方法所屬的類稱為當(dāng)前類,當(dāng)前類的常量池稱為當(dāng)前常量池。在線程執(zhí)行一個方法時,它會跟蹤當(dāng)前類和當(dāng)前常量池。此外,當(dāng)虛擬機(jī)遇到棧內(nèi)操作指令時,它對當(dāng)前幀內(nèi)數(shù)據(jù)執(zhí)行操作。
每當(dāng)線程調(diào)用一個Java方法時,虛擬機(jī)都會在該線程的Java棧中壓入一個新幀。而這個新幀自然就成為了當(dāng)前幀。在執(zhí)行這個方法時,它使用這個幀來存儲參數(shù)、局部變量、中間運算結(jié)果等數(shù)據(jù)。
Java方法可以以兩種方式完成。一種通過return返回的,稱為正常返回;一種是通過拋出異常而異常終止的。不管以哪種方式返回,虛擬機(jī)都會將當(dāng)前幀彈出Java棧然后釋放掉,這樣上一個方法的幀就成為當(dāng)前幀了。
Java幀上的所有數(shù)據(jù)都是此線程私有的。任何線程都不能訪問另一個線程的棧數(shù)據(jù),因此我們不需要考慮多線程情況下棧數(shù)據(jù)的訪問同步問題。當(dāng)一個線程調(diào)用一個方法時,方法的的局部變量保存在調(diào)用線程Java棧的幀中。只有一個線程能總是訪問那些局部變量,即調(diào)用方法的線程。
本地方法棧
前面提到的所有運行時數(shù)據(jù)區(qū)都是Java虛擬機(jī)規(guī)范中明確定義的,除此之外,對于一個運行中的Java程序而言,它還可能會用到一些跟本地方法相關(guān)的數(shù)據(jù)區(qū)。當(dāng)某個線程調(diào)用一個本地方法時,它就進(jìn)入了一個全新的并且不再受虛擬機(jī)限制的世界。本地方法可以通過本地方法接口來訪問虛擬機(jī)的運行時數(shù)據(jù)區(qū),但不止如此,它還可以做任何它想做的事情。
本地方法本質(zhì)上時依賴于實現(xiàn)的,虛擬機(jī)實現(xiàn)的設(shè)計者們可以自由地決定使用怎樣的機(jī)制來讓Java程序調(diào)用本地方法。
任何本地方法接口都會使用某種本地方法棧。當(dāng)線程調(diào)用Java方法時,虛擬機(jī)會創(chuàng)建一個新的棧幀并壓入Java棧。然而當(dāng)它調(diào)用的是本地方法時,虛擬機(jī)會保持Java棧不變,不再在線程的Java棧中壓入新的幀,虛擬機(jī)只是簡單地動態(tài)連接并直接調(diào)用指定的本地方法。
如果某個虛擬機(jī)實現(xiàn)的本地方法接口是使用C連接模型的話,那么它的本地方法棧就是C棧。當(dāng)C程序調(diào)用一個C函數(shù)時,其棧操作都是確定的。傳遞給該函數(shù)的參數(shù)以某個確定的順序壓入棧,它的返回值也以確定的方式傳回調(diào)用者。同樣,這就是虛擬機(jī)實現(xiàn)中本地方法棧的行為。
很可能本地方法接口需要回調(diào)Java虛擬機(jī)中的Java方法,在這種情況下,該線程會保存本地方法棧的狀態(tài)并進(jìn)入到另一個Java棧。

該線程首先調(diào)用了兩個Java方法,而第二個Java方法又調(diào)用了一個本地方法,這樣導(dǎo)致虛擬機(jī)使用了一個本地方法棧。假設(shè)這是一個C語言棧,其間有兩個C函數(shù),第一個C函數(shù)被第二個Java方法當(dāng)做本地方法調(diào)用,而這個C函數(shù)又調(diào)用了第二個C函數(shù)。之后第二個C函數(shù)又通過本地方法接口回調(diào)了一個Java方法(第三個Java方法),最終這個Java方法又調(diào)用了一個Java方法(它成為圖中的當(dāng)前方法)。