一個虛擬機是一個軟件實現物理機。Java是在WORA(Write Once Run Anywhere)基礎上開發的,它運行在虛擬機上。該編譯器編譯Java文件轉換成一個Java 的.class文件,那么 的.class文件輸入到JVM,它加載并執行類文件。以下是JVM的體系結構圖:
一、基礎知識
(一) JVM實例:JVM實例對應了一個獨立運行的java程序,它是進程級別。
(二) JVM執行引擎實例:JVM執行引擎實例則對應了屬于用戶運行程序的線程,它是線程級別的。
(三) JVM生命周期:
(1)JVM實例的誕生
當啟動一個Java程序時,一個JVM實例就產生了,任何一個擁有public static void main(String[] args)函數的class都可以作為JVM實例運行的起點
(2)JVM實例的運行
main()作為該程序初始線程的起點,任何其他線程均由該線程啟動。JVM內部有兩種線程:守護線程和非守護線程,main()屬于非守護線程,守護線程通常由JVM自己使用,java程序也可以標明自己創建的線程是守護線程。
(3)JVM實例的消亡
當程序中的所有非守護線程都終止時,JVM才退出;若安全管理器允許,程序也可以使用java.lang.Runtime類或者java.lang.System.exit()來退出。
二、JVM結構
JVM可以由不同的廠商來實現。由于廠商的不同必然導致JVM在實現上的一些不同,然而JVM還是可以實現跨平臺的特性,這就要歸功于設計JVM時的體系結構了。
JVM體系結構包含三部分:
類加載器(Class Loader)子系統
執行引擎(Execution Engine)
運行時數據區(Runtime Data Area)
Java程序執行過程
Java程序從源文件創建到程序運行要經過兩大步驟:1、源文件由編譯器編譯成字節碼(ByteCode) 2、字節碼由java虛擬機解釋運行。因為java程序既要編譯同時也要經過JVM的解釋運行,所以說Java被稱為半解釋語言( "semi-interpreted" language)。
三、運行時數據區
程序計數器(Program Counter Register)、Java棧(VM Stack)、本地方法棧(Native Method Stack)、方法區(Method Area)、堆(Heap)
** (一) 程序計數器(Program Counter Register**
程序計數器是一塊較小的內存空間, 可以看作是當前線程所執行的字節碼的行號指示器。 分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
由于Java 虛擬機的多線程是通過線程輪流切換并分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內核)只會執行一條線程中的指令。因此,為了線程切換后能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲,我們稱這類內存區域為 “線程私有” 的內存。
在JVM規范中規定,如果線程執行的是非native方法,則程序計數器中保存的是當前需要執行的指令的地址;如果線程執行的是native方法,則程序計數器中的值是undefined。
由于程序計數器中存儲的數據所占空間的大小不會隨程序的執行而發生改變,因此,對于程序計數器是不會發生內存溢出現象(OutOfMemory)的。
Java棧(VM Stack)
Java棧也稱作虛擬機棧(Java Vitual Machine Stack),是Java方法執行的內存模型。
Java棧中存放的是一個個的棧幀, 每個棧幀對應一個被調用的方法,在棧幀中包括局部變量表(Local Variables)、操作數棧(Operand Stack)、指向當前方法所屬的類的運行時常量池(運行時常量池的概念在方法區部分會談到)的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些額外的附加信息。
當線程執行一個方法時,就會隨之創建一個對應的棧幀,并將建立的棧幀壓棧。當方法執行完畢之后,便會將棧幀出棧。
會有兩種異常StackOverFlowError和 OutOfMemoneyError。當線程請求棧深度大于虛擬機所允許的深度就會拋出StackOverFlowError錯誤;虛擬機棧動態擴展,當擴展無法申請到足夠的內存空間時候,拋出OutOfMemoneyError。它是線程私有的,生命周期與線程相同。
本地方法棧(Native Method Stack) 本地方法棧與Java棧的作用和原理非常相似。區別只不過是Java棧是為執行Java方法服務的, 而本地方法棧則是為執行本地方法(Native Method)服務的。
在JVM規范中,并沒有對本地方發展的具體實現方法以及數據結構作強制規定,虛擬機可以自由實現它。在HotSopt虛擬機中直接就把本地方法棧和Java棧合二為一。
與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常
方法區(Method Area)
JDK7及之前版本的方法區(Method Area)和Java堆一樣, 是各個線程共享的內存區域,用于存儲已經被虛擬機加載的類信息、常量、靜態常量、即時編譯器編譯后的代碼等數據。
在方法區中有一個非常重要的部分就是 運行時常量池 ,它是每一個類或接口的常量池的運行時表示形式, 在類和接口被加載到JVM后,對應的運行時常量池就被創建出來。當然并非Class文件常量池中的內容才能進入運行時常量池,在運行期間也可將新的常量放入運行時常量池中,比如String的intern方法。
實際上對于以上代碼,在JDK6、JDK7、JDK8運行結果均不一樣。原因就在于字符串常量池在JDK6的時候還是存放在方法區(永久代)所以它會拋出
OutOfMemoryError:Permanent Space;而JDK7后則將字符串常量池移到了Java堆中,上面的代碼不會拋出OOM,若將堆內存改為20M則會拋出OutOfMemoryError:Java heap space;至于JDK8則是純粹取消了方法區這個概念,取而代之的是”元空間(Metaspace)“,所以在JDK8中虛擬機參數”-XX:MaxPermSize”也就沒有了任何意義,取代它的是”-XX:MetaspaceSize“和”-XX:MaxMetaspaceSize”等。
在JVM規范中,沒有強制要求方法區必須實現垃圾回收。很多人習慣將方法區稱為“永久代”,是因為HotSpot虛擬機以永久代來實現方法區,從而JVM的垃圾收集器可以像管理堆區一樣管理這部分區域,從而不需要專門為這部分設計垃圾回收機制。不過自從JDK7之后,Hotspot虛擬機便將運行時常量池從永久代移除了。
**堆(Heap) **
JVM中所管理內存中的最大的一塊。在虛擬機啟動時被創建。
唯一的目的是存放對象實例,幾乎所有的對象實例和數組都是在這里分配內存。 (JVM規范中說的是所有的,但是隨著JIT便編譯器的發展和逃逸技術分析的成熟,一些實例可以不在這個區域分配內存)
程序員基本不用去關心空間釋放的問題,Java的垃圾回收機制會自動進行處理,因此堆是垃圾收集管理的主要區域,所以也會被稱為”GC堆“。
堆是被所有線程共享的,在JVM中只有一個堆。
淺堆和深堆
淺堆(Shallow Heap)和深堆(Retained Heap)是兩個非常重要的概念,它們分別表示一個對象結構所占用的內存大小和一個對象被GC回收后,可以真實釋放的內存大小。
淺堆(Shallow Heap)是指一個對象所消耗的內存。在32位系統中,一個對象引用會占據4個字節,一個int類型會占據4個字節,long型變量會占據8個字節,每個對象需要占用8個字節。
深堆(Retained Heap)的概念略微復雜。要理解深堆,首先需要了解保留集(Retained Set)。對象A的保留集指當對象A被垃圾回收后,可以被釋放的所有對象集合(包括對象A本身),即對象A的保留集可以被認為是只能通過對象A被直接或間接訪問到的所有對象的集合。通俗地說,就是指僅被對象A所持有的對象的集合。深堆是指對象的保留集中所有的對象的淺堆大小之和。