對象的創(chuàng)建過程

1.使用new創(chuàng)建對象的流程

對象創(chuàng)建流程圖

????????????當Java虛擬機遇到一條字節(jié)碼new指令時,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符號引用,并且檢查這個符號引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須先執(zhí)行相應的類加載過程。

????????????在類加載檢查通過后,接下來虛擬機將為新生對象分配內(nèi)存。對象所需內(nèi)存的大小在類加載完成后便可完全確定,為對象分配空間的任務實際上便等同于把一塊確定大小的內(nèi)存塊從Java堆中劃分出來。假設(shè)Java堆中內(nèi)存是絕對規(guī)整的,所有被使用過的內(nèi)存都被放在一邊,空閑的內(nèi)存被放在另一邊,中間放著一個指針作為分界點的指示器,那所分配內(nèi)存就僅僅是把那個指針向空閑空間方向挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”(Bump ThePointer)。

????????????但如果Java堆中的內(nèi)存并不是規(guī)整的,已被使用的內(nèi)存和空閑的內(nèi)存相互交錯在一起,那就沒有辦法簡單地進行指針碰撞了,虛擬機就必須維護一個列表,記錄上哪些內(nèi)存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實例,并更新列表上的記錄,這種分配方式稱為“空閑列表”(Free List)。

????????????選擇哪種分配方式由Java堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有空間壓縮整理(Compact)的能力決定。因此,當使用Serial、ParNew等帶壓縮整理過程的收集器時,系統(tǒng)采用的分配算法是指針碰撞,既簡單又高效;而當使用CMS這種基于清除(Sweep)算法的收集器時,理論上[1]就只能采用較為復雜的空閑列表來分配內(nèi)存。

????????????除如何劃分可用空間之外,還有另外一個需要考慮的問題:對象創(chuàng)建在虛擬機中是非常頻繁的行為,即使僅僅修改一個指針所指向的位置,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對象A分配內(nèi)存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內(nèi)存的情況。解決這個問題有兩種可選方案:一種是對分配內(nèi)存空間的動作進行同步處理——實際上虛擬機是采用CAS配上失敗重試的方式保證更新操作的原子性;另外一種是把內(nèi)存分配的動作按照線程劃分在不同的空間之中進行,即每個線程在Java堆中預先分配一小塊內(nèi)存,稱為本地線程分配緩沖(Thread Local AllocationBuffer,TLAB),哪個線程要分配內(nèi)存,就在哪個線程的本地緩沖區(qū)中分配,只有本地緩沖區(qū)用完了,分配新的緩存區(qū)時才需要同步鎖定。虛擬機是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設(shè)定。

????????????內(nèi)存分配完成之后,虛擬機必須將分配到的內(nèi)存空間(但不包括對象頭)都初始化為零值,如果使用了TLAB的話,這一項工作也可以提前至TLAB分配時順便進行。這步操作保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,使程序能訪問到這些字段的數(shù)據(jù)類型所對應的零值。

????????????接下來,Java虛擬機還要對對象進行必要的設(shè)置,例如這個對象是哪個類的實例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希碼(實際上對象的哈希碼會延后到真正調(diào)用Object::hashCode()方法時才計算)、對象的GC分代年齡等信息。這些信息存放在對象的對象頭(Object Header)之中。根據(jù)虛擬機當前運行狀態(tài)的不同,如是否啟用偏向鎖等,對象頭會有不同的設(shè)置方式。關(guān)于對象頭的具體內(nèi)容,稍后會詳細介紹。在上面工作都完成之后,從虛擬機的視角來看,一個新的對象已經(jīng)產(chǎn)生了。但是從Java程序的視角看來,對象創(chuàng)建才剛剛開始——構(gòu)造函數(shù),即Class文件中的()方法還沒有執(zhí)行,所有的字段都為默認的零值,對象需要的其他資源和狀態(tài)信息也還沒有按照預定的意圖構(gòu)造好。一般來說(由字節(jié)碼流中new指令后面是否跟隨invokespecial指令所決定,Java編譯器會在遇到new關(guān)鍵字的地方同時生成這兩條字節(jié)碼指令,但如果直接通過其他方式產(chǎn)生的則不一定如此),new指令之后會接著執(zhí)行()方法,按照程序員的意愿對對象進行初始化,這樣一個真正可用的對象才算完全被構(gòu)造出來。

2.對象的內(nèi)存布局

? ??????對象在堆內(nèi)存中的存儲布局可以劃分為三個部分:對象頭(Header)、實例數(shù)據(jù)(Instance Data)和對齊填充(Padding)。

對象的內(nèi)存布局

? ? 1.對象頭:分包括兩類信息。第一類是用于存儲對象自身的運行時數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標志、線程持有的鎖、偏向線程ID、偏向時間戳等,這部分數(shù)據(jù)的長度在32位和64位的虛擬機(未開啟壓縮指針)中分別為32個比特和64個比特,官方稱它為“Mark Word”。對象需要存儲的運行時數(shù)據(jù)很多,其實已經(jīng)超出了32、64位Bitmap結(jié)構(gòu)所能記錄的最大限度,但對象頭里的信息是與對象自身定義的數(shù)據(jù)無關(guān)的額外存儲成本,考慮到虛擬機的空間效率,Mark Word被設(shè)計成一個有著動態(tài)定義的數(shù)據(jù)結(jié)構(gòu),以便在極小的空間內(nèi)存儲盡量多的數(shù)據(jù),根據(jù)對象的狀態(tài)復用自己的存儲空間。對象頭的另外一部分是類型指針,即對象指向它的類型元數(shù)據(jù)的指針,Java虛擬機通過這個指針來確定該對象是哪個類的實例。并不是所有的虛擬機實現(xiàn)都必須在對象數(shù)據(jù)上保留類型指針,換句話說,查找對象的元數(shù)據(jù)信息并不一定要經(jīng)過對象本身。此外,如果對象是一個Java數(shù)組,那在對象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù),因為虛擬機可以通過普通Java對象的元數(shù)據(jù)信息確定Java對象的大小,但是如果數(shù)組的長度是不確定的,將無法通過元數(shù)據(jù)中的信息推斷出數(shù)組的大小。

對象頭

????2.實例數(shù)據(jù):是對象真正存儲的有效信息,即我們在程序代碼里面所定義的各種類型的字段內(nèi)容,無論是從父類繼承下來的,還是在子類中定義的字段都必須記錄起來。這部分的存儲順序會受到虛擬機分配策略參數(shù)(-XX:FieldsAllocationStyle參數(shù))和字段在Java源碼中定義順序的影響。HotSpot虛擬機默認的分配順序為longs/doubles、ints、shorts/chars、bytes/booleans、oops(OrdinaryObject Pointers,OOPs),從以上默認的分配策略中可以看到,相同寬度的字段總是被分配到一起存放,在滿足這個前提條件的情況下,在父類中定義的變量會出現(xiàn)在子類之前。如果HotSpot虛擬機的+XX:CompactFields參數(shù)值為true(默認就為true),那子類之中較窄的變量也允許插入父類變量的空隙之中,以節(jié)省出一點點空間。

? ? ?3.對齊填充:這并不是必然存在的,也沒有特別的含義,它僅僅起著占位符的作用。由于HotSpot虛擬機的自動內(nèi)存管理系統(tǒng)要求對象起始地址必須是8字節(jié)的整數(shù)倍,換句話說就是任何對象的大小都必須是8字節(jié)的整數(shù)倍。對象頭部分已經(jīng)被精心設(shè)計成正好是8字節(jié)的倍數(shù)(1倍或者2倍),因此,如果對象實例數(shù)據(jù)部分沒有對齊的話,就需要通過對齊填充來補全。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容