看到JVM就不得不說垃圾回收,說到垃圾回收(Garbage Collection,GC),顧名思義,垃圾回收就是釋放垃圾占用的空間,在Java中,程序員不需要去關心內存動態分配和垃圾回收的問題,這一切都交給了JVM來處理。那么在Java中,什么樣的對象會被認定為“垃圾”?下面我們進行詳細解析。
垃圾回收
當程序創建對象、數組等引用類型實體時,系統都會在堆內存中為之分配一塊內存區,對象就保存在這塊內存區中,當這塊內存不再被任何引用變量引用時,這塊內存就變成垃圾,等待垃圾回收機制進行回收。垃圾回收機制具有如下特征。
1.垃圾回收機制只負責回收內存中的對象,不會回收任何物理資源(例如數據庫連接、網絡IO等資源)
2.程序無法精確控制垃圾回收的運行,垃圾回收會在合適的時候進行。
3.在垃圾回收機制回收任何對象之前,總會先調用它的finalize()方法,該方法可能使該對象重新復活(讓一個引用變量重新引用該對象),從而導致垃圾回收機制取消回收。
如果垃圾得不到及時的回收,就會出現內存泄漏的情況,具體的內存泄漏請先看這篇文章內存泄漏詳細分析,將有助于理解本文中的對象狀態。
對象的三種狀態
當一個對象在堆內存中運行時,根據它被引用變量所引用的狀態,可以把它所處的狀態分成如下三種:
- 可達狀態:當一個對象被創建后,若有一個以上的引用變量引用它,則這個對象在程序中處于可達狀態。
- 可恢復狀態:如果程序中某個對象不再有任何引用變量引用它,它就進入了可恢復狀態。此時,系統的垃圾回收機制準備回收該對象所占用的內存,在回收該對象之前,系統會調用所有可恢復狀態對象的finalize()方法進行資源清理。如果系統在調用finalize()方法時重新讓一個引用變量引用該對象,則這個對象會再次變成可達狀態;否則該對象將進入不可達狀態。
- 不可達狀態:當對象與所有引用變量的關聯都被切斷,且系統已經調用所有對象的finalize()方法后依然沒有使該對象變成可達狀態,那么這個對象將永久性地失去引用,最后變成不可達狀態。只有當一個對象處于不可達狀態時,系統才會真正回收該對象所占有的資源。
舉個例子
public static void test() {
String a = new String("C++");
a = new String("Java");
}
當程序執行test方法的第一行代碼時,代碼定義了一個a變量,并讓該變量指向"C++"字符串,該代碼執行結束后"C++"字符串對象處于可達狀態。
當程序執行test方法的第二行代碼時,代碼再次創建了"Java"字符串對象,并讓a變量指向該對象。此時"C++"字符串對象處于可恢復狀態,而"Java"字符串處于可達狀態。
總結:
一個對象可以被一個方法的局部變量引用,也可以被其他類的類變量引用,或被其他對象的實例變量引用。當某個對象被其他類的類變量引用時,只有該類被銷毀后,該對象才會進入可恢復狀態;當某個對象被其他對象的實例變量引用時,只有當該對象被銷毀后,該對象才會進入可恢復狀態。
GC如何找到“垃圾”對象
引用計數法:在java中是通過引用來和對象進行關聯的,那么很顯然一個簡單的辦法就是通過引用計數來判斷一個對象是否可以被回收。如果一個對象引用數為0,則說明該對象基本不太可能在其他地方被使用到,那么這個對象就成為可被回收的對象了。
這種方式的特點是實現簡單,而且效率較高,但是它無法解決循環引用的問題,因此在Java中并沒有采用這種方式(Python采用的是引用計數法)。看下面這段代碼:
public class Main {
public static void main(String[] args) {
MyObject object1 = new MyObject();
MyObject object2 = new MyObject();
object1.object = object2;
object2.object = object1;
object1 = null;
object2 = null;
}
}
class MyObject{
public Object object = null;
}
過程分析:
main方法中new了兩個MyObject對象,這兩個對象各有一個引用,一個是object1,一個是object2,然后object1和object2又把各自的屬性object指向了對方,這時候兩個MyObject對象引用數都為2,程序最后,分別將object1,object2釋放引用,這時候兩個MyObject對象的引用數由2-1成為1。這就導致它們的引用計數都不為0,那么垃圾收集器就永遠不會回收它們。
可達性分析法:為了解決循環引用的問題,在Java中采取了可達性分析法。該方法的基本思想是通過一系列的“GC Roots”對象作為起點進行搜索,如果在“GC Roots”和一個對象之間沒有可達路徑,則稱該對象是不可達的。
比較常見的將對象判定為可回收對象的情況:
1.顯示地將某個引用賦值為null或者將已經指向某個對象的引用指向新的對象,比如下面的代碼:
Object obj = new Object();(第一個對象)
obj = null;
Object obj1 = new Object();(第二個對象)
Object obj2 = new Object();(第三個對象)
obj1 = obj2;
上述代碼執行完成后,第一個和第二個對象由于沒有obj指向,所以可以進行回收。
2.局部引用所指向的對象,比如下面這段代碼:
void fun() {
.....
for(int i=0;i<10;i++) {
Object obj = new Object();
System.out.println(obj.getClass());
}
}
循環每執行完一次,生成的Object對象都會成為可回收的對象。
對象的軟、弱和虛引用
上面我們描述的都是用“=”來指向堆中的對象,是屬于強引用,在java中還有其他類型的引用,那么他們和垃圾回收的關系是怎樣的呢?
強引用(StrongReference)
Java程序中最常見的引用方式。程序創建一個對象,并把這個對象賦給一個引用變量,程序通過該引用變量來操作實際的對象。當一個對象被一個或一個以上的引用變量所引用時,它處于可達狀態,不可能被系統垃圾回收機制回收。
軟引用(SoftReference)
通過SoftReference類來實現,當一個對象只有軟引用時,它有可能被垃圾回收機制回收。當系統內存空間足夠時,它不會被系統回收,程序也可使用該對象;當系統內存空間不足時,系統可能會回收它。軟引用通常用于對內存敏感的程序中。
弱引用(WeakReference)
通過WeakReference類實現,弱引用和軟引用很像,但弱引用的引用級別更低。對于只有弱引用的對象而已,當系統垃圾回收機制運行時,不管系統內存是否足夠,總會回收該對象所占用的內存。當然,并不是說當一個對象只有弱引用時,它就會立即被回收——正如那些失去引用的對象一樣,必須等到系統垃圾回收機制運行時才會被回收。
虛引用(PhantomReference)
通過PhantomReference類實現,虛引用完全類似于沒有引用。虛引用對對象本身沒有太大影響,對象甚至感覺不到虛引用的存在。如果一個對象只有一個虛引用時,那么它和沒有引用的效果大致相同。虛引用主要用于跟蹤對象被垃圾回收的狀態,虛引用不能單獨使用,虛引用必須和引用隊列(ReferenceQueue)聯合使用。程序可以通過檢查與虛引用關聯的引用隊列中是否已經包含了該虛引用,從而了解虛引用所引用的對象被系統垃圾回收過程。