對(duì)象的創(chuàng)建
??????虛擬機(jī)遇到一條new指令時(shí),首先將去檢查這個(gè)指令的參數(shù)是否能在常量池中定位到一 個(gè)類的符號(hào)引用,并且檢查這個(gè)符號(hào)引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須先執(zhí)行相應(yīng)的類加載過程。
?? ? ? ?在類加載檢查通過后,接下來虛擬機(jī)將為新生對(duì)象分配內(nèi)存。對(duì)象所需內(nèi)存的大小在類加載完成后便可完全確定,為對(duì)象分配空間的任務(wù)等同于 把一塊確定大小的內(nèi)存從Java堆中劃分出來。假設(shè)Java堆中內(nèi)存是絕對(duì)規(guī)整的,所有用過的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個(gè)指針作為分界點(diǎn)的指示器,那所分配內(nèi)存就僅僅是把那個(gè)指針向空閑空間那邊挪動(dòng)一段與對(duì)象大小相等的距離,這種分配方式稱為“指針碰撞"(Bump the Pointer)。如果Java堆中的內(nèi)存并不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存相互交錯(cuò),那就沒有辦法簡(jiǎn)單地進(jìn)行指針碰撞了,虛擬機(jī)就必須維護(hù)一個(gè)列表,記錄上哪些內(nèi)存塊是可用的,在分配的時(shí)候從列表中找到一塊足夠大的空間劃分給對(duì)象 實(shí)例,并更新列表上的記錄,這種分配方式稱為“空閑列表"(Free List)。選擇哪種分配方式由Java堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。因此,在使用Serial、ParNew等帶Compact過程的收集器時(shí),系統(tǒng)采用的分配算法是指針碰撞,而使用CMS這種基于Mark-Sweep算法的收集器時(shí),通常采用空閑列表。
????????除如何劃分可用空間之外,還有另外—個(gè)需要考慮的問題是對(duì)象創(chuàng)建在虛擬機(jī)中是非常頻繁的行為,即使是僅僅修改一個(gè)指針?biāo)赶虻奈恢茫诓l(fā)情況下也并不是線程安全 的,可能出現(xiàn)正在給對(duì)象A分配內(nèi)存,指針還沒來得及修改,對(duì)象B又同時(shí)使用了原來的指 針來分配內(nèi)存的情況。解決這個(gè)問題有兩種方案,一種是對(duì)分配內(nèi)存空間的動(dòng)作進(jìn)行同步處理:實(shí)際上虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性;另一種是把內(nèi)存分配的動(dòng)作按照線程劃分在不同的空間之中進(jìn)行,即每個(gè)線程在Java堆中預(yù)先分配一小塊內(nèi)存,稱為本地線程分配緩沖(Thread? Local Allocation Buffer? TLAB)。哪個(gè)線程要分配內(nèi)存,就在哪個(gè)線程的TLAB上分配,只有TLAB用完并分配新的TLAB時(shí),才需要同步鎖定,虛擬機(jī)是否使用TLAB,可以通過 -XX;+/-UserTLAB參數(shù)來決定。
? ??????內(nèi)存分配完成后,虛擬機(jī)需要將分配到的內(nèi)存空間都初始化為零值(不包括對(duì)象頭),如果使用TLAB, 這一工作過程也可以提前至TLAB 分配時(shí)進(jìn)行。這一步操作保證了對(duì)象的實(shí)例字段在Java 代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對(duì)應(yīng)的零值。
????????接下來,虛擬機(jī)要對(duì)對(duì)象進(jìn)行必要的設(shè)置,例如這個(gè)對(duì)象是哪個(gè)類的實(shí)例、如何才能找到類的元數(shù)據(jù)信息、對(duì)象的哈希碼、對(duì)象的GC分代年齡等信息。這些信息存放在對(duì)象的對(duì)象頭(Object Header)之中。根據(jù)虛擬機(jī)當(dāng)前的運(yùn)行狀態(tài)不同,如是否啟用偏向鎖等, 對(duì)象頭會(huì)有不同的設(shè)置方式。
????????在上面工作一都完成之后,從虛擬機(jī)的視角來看, 一個(gè)新的對(duì)象已經(jīng)產(chǎn)生了,但從Java 程序的視角來看,對(duì)象創(chuàng)建剛剛開始 方法還沒有執(zhí)行,所有的字段都還為零。所以, 一般來說(由字節(jié)碼中是否跟隨invokespecial 指令所決定)執(zhí)行new 指令之后會(huì)接著執(zhí)行方法,把對(duì)象按照程序員的意愿進(jìn)往初始化,這樣一個(gè)真正可用的對(duì)象才算完全產(chǎn)生出來。
對(duì)象的內(nèi)存布局
????????在HotSpot虛擬機(jī)中, 對(duì)象在內(nèi)存中存儲(chǔ)的布局可以分為3塊區(qū)域:?對(duì)象頭(Header)、實(shí)例數(shù)據(jù)(Instance Data)和對(duì)齊填充(Padding)。
????????HotSpot虛擬機(jī)的對(duì)象頭包括兩部分信息, 第一部分用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID 、偏向時(shí)間戳等, 這部分?jǐn)?shù)據(jù)的長(zhǎng)度在32位和64位的虛擬機(jī)(未開啟壓縮指針)中分別為32bit和64bit, 官方稱它為"Mark Word"。對(duì)象需要存儲(chǔ)的運(yùn)行時(shí)數(shù)據(jù)很多, 其實(shí)已經(jīng)超出了32位、64位Bitmap結(jié)構(gòu)所能記錄的限度, 但是對(duì)象頭信息是與對(duì)象自身定義的數(shù)據(jù)無關(guān)的額外存儲(chǔ)成本, 考慮到虛擬機(jī)的空間效率, Mark Word被設(shè)計(jì)成一個(gè)非固定的數(shù)據(jù)結(jié)構(gòu)以便在極小的空間內(nèi)存儲(chǔ)盡雖多的信息, 它會(huì)根據(jù)對(duì)象的狀態(tài)復(fù)用自己的存儲(chǔ)空間。
????????對(duì)象頭的另外一部分是類型指針, 即對(duì)象指向它的類元數(shù)據(jù)的指針, 虛擬機(jī)通過這個(gè)指針來確定這個(gè)對(duì)象是哪個(gè)類的實(shí)例。并不是所有的虛擬機(jī)實(shí)現(xiàn)都必須在對(duì)象數(shù)據(jù)上保留類型指針, 換句話說, 查找對(duì)象的元數(shù)據(jù)信息并不一定要經(jīng)過對(duì)象本身, 另外, 如果對(duì)象是一個(gè)Java數(shù)組, 那在對(duì)象頭中還必須有一塊用于記錄數(shù)組長(zhǎng)度的數(shù)據(jù), 因?yàn)樘摂M機(jī)可以通過普通Java對(duì)象的元數(shù)據(jù)信息確定Java對(duì)象的大小, 但是從數(shù)組的元數(shù)據(jù)中卻無法確定數(shù)組的大小。
? ??????實(shí)例數(shù)據(jù)部分是對(duì)對(duì)象真正存儲(chǔ)的有效信息,也是程序中所定義的各種類型的字段內(nèi)容。無論是從父類繼承下來,還是在子類中定義,都需要記錄起來。這部分的存儲(chǔ)順序會(huì)受到虛擬機(jī)分配策略參數(shù)和字段在Java源碼中定義順序的影響。Hotspot虛擬機(jī)默認(rèn)的分配策略為longs/doubles、ints、shorts、chars、bytes、booleans、oops,從分配策略中可以看出 相同寬度的字段總是被分配到一起。在滿足這個(gè)前提條件下,父類中定義的變量會(huì)出現(xiàn)在子類之前。如果CompactFields參數(shù)為true(默認(rèn)),那么子類之中較窄的變量也可能會(huì)插入到父類的空隙之中。
????????第三部分對(duì)齊填充不是必然存在的,僅僅起著占位符的作用。由于HotSpot VM的自動(dòng)內(nèi)存管理系統(tǒng)要求對(duì)象起始地址必須是8字節(jié)的整倍數(shù)、換句話說,對(duì)象必須是8字節(jié)的整數(shù)倍。而對(duì)象頭部分正好是8字節(jié)的倍數(shù)(1或2倍),因此,當(dāng)對(duì)象實(shí)例數(shù)據(jù)部分沒有對(duì)齊時(shí),就需要通過對(duì)齊填充補(bǔ)全。
對(duì)象的訪問定位
????????我們JAVA程序需要通過棧上的reference數(shù)據(jù)來操作堆上的具體對(duì)象。目前主流的訪問方式有使用句柄和直接指針2種
句柄訪問
? ? ? ? 如果使用句柄訪問的話,那么Java堆中將會(huì)劃分出一塊內(nèi)存來作為句柄池,reference中存儲(chǔ)的就是對(duì)象的句柄地址,而句柄中包含了對(duì)象實(shí)例數(shù)據(jù)與類型數(shù)據(jù)各自的具體地址信息。
指針訪問
? ? ? ? 如果使用直接指針訪問方式,java堆對(duì)象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息,reference中直接存儲(chǔ)的就是對(duì)象地址。
????????這兩種對(duì)象的訪問方式各有優(yōu)勢(shì),使用句柄訪問方式的最大好處就是reference中存儲(chǔ)的是穩(wěn)定的句柄地址,在對(duì)象被移動(dòng)時(shí)只會(huì)改變句柄中的實(shí)例數(shù)據(jù)指針,而reference本身不需要被修改。 使用直接指針訪問方式的最大好處就是速度更快,它節(jié)省了一次指針定位的的時(shí)間開銷。HotSpot使用第二種。