CopyOnWriteArrayList
無繼承,實現了List,RandomAccess,Cloneable,和Serializable接口,具有List的特性,提供可隨機訪問,提供自身克隆以及序列化的一個容器類。
特點:線程安全;讀寫分離;數組實現
CopyOnWriteArrayList這個容器類的名字也很好理解,寫時拷貝列表,網上對COW(CopyOnWrite)有一個高大上的名字,叫做讀寫分離,所以CopyOnWriteArrayList是讀寫分離列表類,下面描述下它的實現
成員變量
相比于ArrayList,CopyOnWriteArrayList的成員變量發生了很多改變,就只有下面幾個
// 序列化ID
private static final long serialVersionUID = 8673264195747942595L;
// 鎖變量
final transient ReentrantLock lock = new ReentrantLock();
// 真正存儲數據的數組
private transient volatile Object[] array;
甚至是size都沒了,而size()函數的實現則變成了下面這樣
public int size() {
return getArray().length;
}
方法
首先是對array
操作的限制,CopyOnWriteArrayList提供了array
的setter和getter方法,在下文會看到,涉及到array
的操作,都是通過setter和getter來完成的
final Object[] getArray() {
return array;
}
final void setArray(Object[] a) {
array = a;
}
其次是構造函數,CopyOnWriteArrayList提供了缺省,帶集合類和帶數組的三個構造函數,在這三個函數里面都能看到setArray()
的影子。而其中,缺省的構造函數初始化容器的容量為0
public CopyOnWriteArrayList() {
setArray(new Object[0]);
}
public CopyOnWriteArrayList(Collection<? extends E> c) {
Object[] elements;
if (c.getClass() == CopyOnWriteArrayList.class)
elements = ((CopyOnWriteArrayList<?>)c).getArray();
else {
elements = c.toArray();
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elements.getClass() != Object[].class)
elements = Arrays.copyOf(elements, elements.length, Object[].class);
}
setArray(elements);
}
public CopyOnWriteArrayList(E[] toCopyIn) {
setArray(Arrays.copyOf(toCopyIn, toCopyIn.length, Object[].class));
}
接著看最重頭戲的add()
方法,
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
我們可以看到,CopyOnWriteArrayList
沒有像ArrayList
和Vector
那樣復雜的擴容機制,只通過兩句代碼即實現了添加數據,又實現了擴容
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
接著,在方法的開始和結束分別是上鎖lock.lock();
和解鎖lock.unlock();
,給方法上鎖的一個原因是避免多線程環境下,多個線程拷貝出多個副本,然后多個副本操作數據后影響數據的正確性。
除了add()
方法外,set()
,remove()
等的操作數據的操作,基本都和add()
方法類似,這里就不在贅述了。
再接著看獲取的方法get()
private E get(Object[] a, int index) {
return (E) a[index];
}
public E get(int index) {
return get(getArray(), index);
}
可以看到,get()
方法是直接在array
中進行獲取。
綜合看add()
和get()
方法,add()
方法在進行的時候會先上鎖,然后拷貝一份數據的副本進行操作,然后將操作后的副本賦值到array
中去,至于get()
方法是直接獲取array
中的值,也正是這樣,實現了讀寫分離。但是這也會有一個問題,就是數據的實時不一致性,有可能副本還沒賦值到array
,而用戶通過get()
方法獲取了舊的array
的值。
來看下CopyOnWriteArrayList
的迭代器,因為它沒有繼承AbstractList
因此也沒有modCount
這個變量,先看下怎么得到它的迭代器
public ListIterator<E> listIterator(int index) {
Object[] elements = getArray();
int len = elements.length;
if (index < 0 || index > len)
throw new IndexOutOfBoundsException("Index: "+index);
return new COWIterator<E>(elements, index);
}
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
可以看到是直接通過array
和初始化的下標來獲取到迭代器。至于迭代數據則是直接獲取
@SuppressWarnings("unchecked")
public E next() {
if (! hasNext())
throw new NoSuchElementException();
return (E) snapshot[cursor++];
}
因此,這里沒有像ArrayList
那樣,有一個checkForComodification
,檢查是否迭代數據被修改,因此我又測試了下
在
ArrayList
中,如果獲取到迭代器之后對容器內數據進行操作,就會報ConcurrentModificationException
,而在CopyOnWriteArrayList
則不存在這個問題。但是也有另外一個問題,如圖片所展示那樣,獲取到迭代器之后修改容器內的數據,攔截器并不會有所更新,要獲取到修改后的數據,還得重新獲取迭代器。
剩下的一些方法就不贅述啦,大同小異。
總結
CopyOnWriteArrayList
的核心是在操作數據的時候,通過拷貝原容器數組的副本,在副本上進行操作后,將副本賦值到容器數組,從而實現讀寫分離。
CopyOnWriteArrayList
適用于讀多寫少的場景,因為寫的時候會拷貝數組,很容易產生大量垃圾而觸發GC,不利于系統的性能。