前言
上一篇我們認識了什么是Map、Hash,了解了Hash處理哈希沖突的幾種常用方法(拉鏈法、開放定址法),以及分析了JDK1.8版本的HashMap源碼,對Java集合框架有了初步的認識,我們本篇繼續分析JDK1.8版本的Hashtable源碼,最后比較HashMap和Hashtable的區別。
Hashtable
注意是Hashtable不是HashTable(t為小寫),這不是違背了駝峰定理了嘛?這還得從Hashtable的出生說起,Hashtable是在Java1.0的時候創建的,而集合的統一規范命名是在后來的Java2開始約定的,而當時又發布了新的集合代替它,所以這個命名也一直使用到現在,所以Hashtable是一個過時的集合了,不推崇大家使用這個類,雖說Hashtable是過時的了,我們還是有必要分析一下它,以便對Java集合框架有一個整體的認知。
首先Hashtable采用拉鏈法處理哈希沖突,是線程安全的,鍵值不允許為null,然后Hashtable繼承自Dictionary,實現Map接口,Hashtable有幾個重要的成員變量table、count、threshold、loadFactor
table:是一個Entry[]數據類型,而Entry實際是一個單鏈表
count:Hashtable的大小,即Hashtable中保存的鍵值對數量
threshold:Hashtable的閾值,用于判斷是否需要調整Hashtable的容量,threshold = 容量負載因子,threshold=11*0.75 取整即8
loadFactor:用來實現快速失敗機制的
?
構造函數
Hashtable有4個構造函數
//無參構造函數?默認Hashtable容量是11,默認負載因子是0.75
public?Hashtable()?{
????this(11,?0.75f);
}
//指定Hashtable容量,默認負載因子是0.75
public?Hashtable(int?initialCapacity)?{
????this(initialCapacity,?0.75f);
}
//指定Hashtable的容量和負載因子
public?Hashtable(int?initialCapacity,?float?loadFactor)?{
????if?(initialCapacity?<?0)
????????throw?new?IllegalArgumentException("Illegal?Capacity:?"+
???????????????????????????????????????????initialCapacity);
????if?(loadFactor?<=?0?||?Float.isNaN(loadFactor))
????????throw?new?IllegalArgumentException("Illegal?Load:?"+loadFactor);
????if?(initialCapacity==0)
????????initialCapacity?=?1;
????this.loadFactor?=?loadFactor;
????//new一個指定容量的Hashtable
????table?=?new?Entry<?,?>[initialCapacity];
????//閾值threshold=容量*負載因子
????threshold?=?(int)Math.min(initialCapacity?*?loadFactor,?MAX_ARRAY_SIZE?+?1);
}
//包含指定Map的構造函數
public?Hashtable(Map<??extends?K,???extends?V>?t)?{
????this(Math.max(2*t.size(),?11),?0.75f);
????putAll(t);
}
這里的Hashtable容量和HashMap的容量就有區別,Hashtable并不要求容量是2的冪次方,而HashMap要求容量是2的冪次方。負載因子則默認都是0.75。
put方法
put方法是同步的,即線程安全的,這點和HashMap不一樣,還有具體的put操作和HashMap也存在很大的差別,Hashtable插入的時候是插入到鏈表頭部,而HashMap是插入到鏈表尾部。
//synchronized同步鎖,所以Hashtable是線程安全的
public?synchronized?V?put(K?key,?V?value)?{
????//?Make?sure?the?value?is?not?null
????//如果值value為空,則拋出異常?至于為什么官方不允許為空,下面給出分析
????if?(value?==?null)?{
????????throw?new?NullPointerException();
????}
????//?Makes?sure?the?key?is?not?already?in?the?hashtable.
????Entry<?,?>?tab[]?=?table;
????//直接取key的hashCode()作為哈希地址,這與HashMap的取hashCode()之后再進行hash()的結果作為哈希地址?不一樣
????int?hash?=?key.hashCode();
????//數組下標=(哈希地址?&?0x7FFFFFFF)?%?Hashtable容量,這與HashMap的數組下標=哈希地址?&?(HashMap容量-1)計算數組下標方式不一樣,前者是取模運算,后者是位于運算,這也就是為什么HashMap的容量要是2的冪次方的原因,效率上后者的效率更高。
????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;
????@SuppressWarnings("unchecked")
????Entry<K,V>?entry?=?(Entry<K,V>)tab[index];
????//遍歷Entry鏈表,如果鏈表中存在key、哈希地址相同的節點,則將值更新,返回舊值
????for(;?entry?!=?null?;?entry?=?entry.next)?{
????????if?((entry.hash?==?hash)?&&?entry.key.equals(key))?{
????????????V?old?=?entry.value;
????????????entry.value?=?value;
????????????return?old;
????????}
????}
????//如果為新的節點,則調用addEntry()方法添加新的節點
????addEntry(hash,?key,?value,?index);
????//插入成功返回null
????return?null;
}
private?void?addEntry(int?hash,?K?key,?V?value,?int?index)?{
????modCount++;
????Entry<?,?>?tab[]?=?table;
????//如果當前鍵值對數量>=閾值,則執行rehash()方法擴容Hashtable的容量
????if?(count?>=?threshold)?{
????????//?Rehash?the?table?if?the?threshold?is?exceeded
????????rehash();
????????tab?=?table;
????????//獲取key的hashCode();
????????hash?=?key.hashCode();
????????//重新計算下標,因為Hashtable已經擴容了。
????????index?=?(hash?&?0x7FFFFFFF)?%?tab.length;
????}
????//?Creates?the?new?entry.
????@SuppressWarnings("unchecked")
????//獲取當前Entry鏈表的引用?復賦值給e
????Entry<K,V>?e?=?(Entry<K,V>)?tab[index];
????//創建新的Entry鏈表的?將新的節點插入到Entry鏈表的頭部,再指向之前的Entry,即在鏈表頭部插入節點,這個和HashMap在尾部插入不一樣。
????tab[index]?=?new?Entry<>(hash,?key,?value,?e);
????count++;
}
hashCode()為什么要& 0x7FFFFFFF呢?因為某些對象的hashCode()可能是負值,& 0x7FFFFFFF保證了進行%運算時候得到的下標是個正數
get方法
get方法也是同步的,和HashMap不一樣,即線程安全,具體的get操作和HashMap也有區別。
//同步
public?synchronized?V?get(Object?key)?{
????Entry<?,?>?tab[]?=?table;
????//和put方法一樣?都是直接獲取key的hashCode()作為哈希地址
????int?hash?=?key.hashCode();
????//和put方法一樣?通過(哈希地址?&?0x7FFFFFFF)與Hashtable容量做%運算?計算出下標
????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;
????//遍歷Entry鏈表,如果鏈表中存在key、哈希地址一樣的節點,則找到?返回該節點的值,否者返回null
????for?(Entry<?,?>?e?=?tab[index]?;?e?!=?null?;?e?=?e.next)?{
????????if?((e.hash?==?hash)?&&?e.key.equals(key))?{
????????????return?(V)e.value;
????????}
????}
????return?null;
}
remove方法
//同步
public?synchronized?V?remove(Object?key)?{
????Entry<?,?>?tab[]?=?table;
????int?hash?=?key.hashCode();
????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;
????@SuppressWarnings("unchecked")
????Entry<K,V>?e?=?(Entry<K,V>)tab[index];
????//遍歷Entry鏈表,e為當前節點,prev為上一個節點
????for(Entry<K,V>?prev?=?null?;?e?!=?null?;?prev?=?e,?e?=?e.next)?{
????????//找到key、哈希地址一樣的節點
????????if?((e.hash?==?hash)?&&?e.key.equals(key))?{
????????????modCount++;
????????????//如果上一個節點不為空(即不是當前節點頭結點),將上一個節點的next指向當前節點的next,即將當前節點移除鏈表
????????????if?(prev?!=?null)?{
????????????????prev.next?=?e.next;
????????????}?else?{?//如果上一個節點為空,即當前節點為頭結點,將table數組保存的鏈表頭結點地址改成當前節點的下一個節點
????????????????tab[index]?=?e.next;
????????????}
????????????//Hashtable的鍵值對數量-1
????????????count--;
????????????//獲取被刪除節點的值?并且返回
????????????V?oldValue?=?e.value;
????????????e.value?=?null;
????????????return?oldValue;
????????}
????}
????return?null;
}
rehash方法
Hashtable的rehash方法和HashMap的resize方法一樣,是用來擴容哈希表的,但是擴容的實現又有區別。
protected?void?rehash()?{
????//獲取舊的Hashtable的容量
????int?oldCapacity?=?table.length;
????//獲取舊的Hashtable引用,為舊哈希表
????Entry<?,?>[]?oldMap?=?table;
????//?overflow-conscious?code
????//新的Hashtable容量=舊的Hashtable容量?*?2?+?1,這里和HashMap的擴容不一樣,HashMap是新的Hashtable容量=舊的Hashtable容量?*?2。
????int?newCapacity?=?(oldCapacity?<<?1)?+?1;
????//如果新的Hashtable容量大于允許的最大容量值(Integer的最大值?-?8)
????if?(newCapacity?-?MAX_ARRAY_SIZE?>?0)?{
????????//如果舊的容量等于允許的最大容量值則返回
????????if?(oldCapacity?==?MAX_ARRAY_SIZE)
????????????//?Keep?running?with?MAX_ARRAY_SIZE?buckets
????????????return;
????????//新的容量等于允許的最大容量值
????????newCapacity?=?MAX_ARRAY_SIZE;
????}
????//new一個新的Hashtable?容量為新的容量
????Entry<?,?>[]?newMap?=?new?Entry<?,?>[newCapacity];
????modCount++;
????//計算新的閾值
????threshold?=?(int)Math.min(newCapacity?*?loadFactor,?MAX_ARRAY_SIZE?+?1);
????table?=?newMap;
????//擴容后遷移Hashtable的Entry鏈表到正確的下標上
????for?(int?i?=?oldCapacity?;?i--?>?0?;)?{
????????for?(Entry<K,V>?old?=?(Entry<K,V>)oldMap[i]?;?old?!=?null?;?)?{
????????????Entry<K,V>?e?=?old;
????????????old?=?old.next;
????????????int?index?=?(e.hash?&?0x7FFFFFFF)?%?newCapacity;
????????????e.next?=?(Entry<K,V>)newMap[index];
????????????newMap[index]?=?e;
????????}
????}
}
接下來我們執行以下代碼,驗證以下數據遷移過程
Hashtable?hashtable?=?new?Hashtable();
for?(int?i?=?1;?i?<=?24;?i?++)?{
????hashtable.put(String.valueOf(i),?i);
}
for?(int?i?=?25;?i?<=?80;?i?++)?{
????hashtable.put(String.valueOf(i),?i);
}
new一個Hashtable,默認容量是11,負載因子是0.75
執行第一個for循環后,20保存在下標為0的Entry中,即(hash &0x7FFFFFFF) % 容量 -> (1598 &0x7FFFFFFF) % 11 = 0
?
執行第二個for循環后,變成了20保存在下標為70的Entry中,因為Hashtable擴容了4次,分別是從容量為默認的11->23->47->95->191,然后此時容量是191,所以(hash &0x7FFFFFFF) % 容量 -> (1598 &0x7FFFFFFF) % 191 = 70
?
HashMap和Hashtable區別
到這里我們分析了HashMap和Hashtable的原理,現在比較以下他們的區別。
不同點
繼承的類不一樣:HashMap繼承的AbstractMap抽象類,Hashtable繼承的Dictionay抽象類
應對多線程處理方式不一樣:HashMap是非線程安全的,Hashtable是線程安全的,所以Hashtable效率比較低
定位算法不一樣:HashMap通過key的hashCode()進行hash()得到哈希地址,數組下標=哈希地址 & (容量 - 1),采用的是與運算,所以容量需要是2的冪次方結果才和取模運算結果一樣。而Hashtable則是:數組下標=(key的hashCode() & 0x7FFFFFFF ) % 容量,采用的取模運算,所以容量沒要求
鍵值對規則不一樣:HashMap允許鍵值為null,而Hashtable不允許鍵值為null
哈希表擴容算法不一樣:HashMap的容量擴容按照原來的容量*2,而Hashtable的容量擴容按照原來的容量*2+1
容量(capacity)默認值不一樣:HashMap的容量默認值為16,而Hashtable的默認值是11
put方法實現不一樣:HashMap是將節點插入到鏈表的尾部,而Hashtable是將節點插入到鏈表的頭部
底層結構不一樣:HashMap采用了數組+鏈表+紅黑樹,而Hashtable采用數組+鏈表
為什么HashMap允許null鍵值呢,而Hashtable不允許null鍵值呢?這里還得先介紹一下什么是null,我們知道Java語言中有兩種類型,一種是基本類型還有一種是引用類型,其實還有一種特殊的類型就是null類型,它不代表一個對象(Object)也不是一個對象(Object),然后在HashMap和Hashtable對鍵的操作中使用到了Object類中的equals方法,所以如果在Hashtable中置鍵值為null的話就可想而知會報錯了,但是為什么HashMap可以呢?因為HashMap采用了特殊的方式,將null轉為了對象(Object),具體怎么轉的,這里就不深究了。
相同點
實現相同的接口:HashMap和Hashtable均實現了Map接口
負載因子(loadFactor)默認值一樣:HashMap和Hashtable的負載因子默認都是0.75
采用相同的方法處理哈希沖突:都是采用鏈地址法即拉鏈法處理哈希沖突
相同哈希地址可能分配到不同的鏈表,同一個鏈表內節點的哈希地址不一定相同:因為HashMap和Hashtable都會擴容,擴容后容量變化了,相同的哈希地址取到的數組下標也就不一樣。