文本來自:《深入理解Java虛擬機》部分修改
對象生成
我們知道在Java代碼中,通過
Object o = new Object();
這樣的語句就可以創建對象及其引用,對象的創建只不過是一個new關鍵字而已,那么在虛擬機中又是一個怎樣的過程呢?
HotSpot檢測到new指令之后會進行下面幾步操作:
一 .檢測類是否加載
判斷類是否加載。虛擬機遇到一條new指令的時候,首先會檢查這個指令的參數是否能在常量池中定位到一個類的符號引用,并且檢查這個符號代表的類是否被加載、解析并初始化。如果沒有完成這個過程,則必須執行相應類的加載。確保類加載完成之后才能生成其實例。
二. 堆上分配空間
在堆上為對象分配空間。所有對象都是在堆上分配空間的,但是隨著時代的發展已經不是那么絕對了,對象需要的空間大小在類加載完成后便能確定。之后便是在堆上為該對象分配固定大小的空間。分配的方式也有兩種:
i.第一種如果使用Serial、ParNew等帶Compact過程的收集器的時候,Java內存中的堆都是規整的,只需把作為使用和未使用空間的分界點的指針移動一段距離就可以了,稱為指針碰撞方式。
ii.第二種如果使用CMS這種基于Mark-Sweep算法的收集器的時候,Java內存并不是規整的,虛擬機就要維護了一個列表來記錄內存的使用情況,這種方式叫做“空閑列表”的方式。
虛擬機為對象分配空間是非常頻繁的,如果同時為多個線程分配對象,就可能發生指針錯誤控制,就涉及到并發安全控制了。一般有兩個解決方案:
(1)第一種是對分配內存空間動作進行同步-使用CAS配上失敗重試的方式保證更新操作的原子性。
(2)第二種是把內存分配的動作分配在不同的空間中進行,既每個線程在Java堆中預先分配一小塊內存,稱之為本地線程分配緩沖(ThreadLocalAllocationBuffer,TLAB)。哪個線程要分配內存,就在哪個線程的TLAB上分配。只有TLAB使用完并需要分配新的TLAB的時候才需要同步鎖定。
三.初始化內存
初始化內存空間。內存分配完成之后,虛擬機會將分配空間內都初始化為零(不包括對象頭),如果使用TLAB分配,這一過程也可以提前至TLAB分配時進行。
四.設置對象頭
設置對象的對象頭。接下來虛擬機要設置對象的對象頭。包括對象的哈希碼、類元素信息、GC分代年齡等。這些信息都放置在對象頭中。
對象頭是必不可少的一部分。
五.初始化類成員
執行方法,初始化對象內成員。
執行完這五步,一個對象才算是真正產生。
對象組成
內存中,對象存儲布局可分為三部分:對象頭(Header),實例數據(InstanceData)和對齊填充(Padding)。
1.對象頭:包括兩部分信息。第一部分用于存儲對象自身的運行時數據,如哈希碼,GC分代年齡、鎖狀態、線程持有鎖、等等。這部分數據的長度在32為或64位,官方稱之為“MarkWord”。對象頭的另一部分是類型指針,即對象指向它的類元素的指針,通過這個指針來確定這個對象時那個類的實例。(如果Java對象時一個數組,則對象頭還必須有一塊用于記錄數組長度的數據。因為Java數組元數據中沒有數組大小的記錄)
2.實例數據:這部分是真正用來存儲對象有效信息的地方,也就是在代碼中定義的,包括父類的屬性等
3.對齊填充:這部分并不是必需存在的,只是起著占位符的作用。因為HotSpot虛擬機要求對象起始地址必須是8字節的倍數。而對象頭是8字節或者16字節,加入實例數據不是8的整數倍,那么就需要padding來補充。
對象引用
我們可以通過使用棧上的reference數據來操作堆上的具體對象。有兩種方式來訪問具體對象:句柄和直接指針。
句柄:Java堆中劃分出一個句柄池,專門用來存放對象的實例地址和類型地址。而棧中的reference只是該句柄池中某一句柄的地址。
這樣做的好處是當進行垃圾回收并被移動后,對象地址改變而reference的數據不用改變。
直接指針:reference直接指向某一對象的地址。好處便是速度快,節省了一次定位的時間開銷。