輕松看懂Hashtable源碼以及與HashMap的區別

前言

上一篇我們認識了什么是Map、Hash,了解了Hash處理哈希沖突的幾種常用方法(拉鏈法、開放定址法),以及分析了JDK1.8版本的HashMap源碼,對Java集合框架有了初步的認識,我們本篇繼續分析JDK1.8版本的Hashtable源碼,最后比較HashMap和Hashtable的區別。

Hashtable

注意是Hashtable不是HashTable(t為小寫),這不是違背了駝峰定理了嘛?這還得從Hashtable的出生說起,Hashtable是在Java1.0的時候創建的,而集合的統一規范命名是在后來的Java2開始約定的,而當時又發布了新的集合代替它,所以這個命名也一直使用到現在,所以Hashtable是一個過時的集合了,不推崇大家使用這個類,雖說Hashtable是過時的了,我們還是有必要分析一下它,以便對Java集合框架有一個整體的認知。

首先Hashtable采用拉鏈法處理哈希沖突,是線程安全的,鍵值不允許為null,然后Hashtable繼承自Dictionary,實現Map接口,Hashtable有幾個重要的成員變量table、count、threshold、loadFactor

table:是一個Entry[]數據類型,而Entry實際是一個單鏈表

count:Hashtable的大小,即Hashtable中保存的鍵值對數量

threshold:Hashtable的閾值,用于判斷是否需要調整Hashtable的容量,threshold = 容量負載因子,threshold=11*0.75 取整即8

loadFactor:用來實現快速失敗機制的

?

構造函數

Hashtable有4個構造函數

//無參構造函數?默認Hashtable容量是11,默認負載因子是0.75

public?Hashtable()?{

????this(11,?0.75f);

}

//指定Hashtable容量,默認負載因子是0.75

public?Hashtable(int?initialCapacity)?{

????this(initialCapacity,?0.75f);

}

//指定Hashtable的容量和負載因子

public?Hashtable(int?initialCapacity,?float?loadFactor)?{

????if?(initialCapacity?<?0)

????????throw?new?IllegalArgumentException("Illegal?Capacity:?"+

???????????????????????????????????????????initialCapacity);

????if?(loadFactor?<=?0?||?Float.isNaN(loadFactor))

????????throw?new?IllegalArgumentException("Illegal?Load:?"+loadFactor);

????if?(initialCapacity==0)

????????initialCapacity?=?1;

????this.loadFactor?=?loadFactor;

????//new一個指定容量的Hashtable

????table?=?new?Entry<?,?>[initialCapacity];

????//閾值threshold=容量*負載因子

????threshold?=?(int)Math.min(initialCapacity?*?loadFactor,?MAX_ARRAY_SIZE?+?1);

}

//包含指定Map的構造函數

public?Hashtable(Map<??extends?K,???extends?V>?t)?{

????this(Math.max(2*t.size(),?11),?0.75f);

????putAll(t);

}

這里的Hashtable容量和HashMap的容量就有區別,Hashtable并不要求容量是2的冪次方,而HashMap要求容量是2的冪次方。負載因子則默認都是0.75。

put方法

put方法是同步的,即線程安全的,這點和HashMap不一樣,還有具體的put操作和HashMap也存在很大的差別,Hashtable插入的時候是插入到鏈表頭部,而HashMap是插入到鏈表尾部。

//synchronized同步鎖,所以Hashtable是線程安全的

public?synchronized?V?put(K?key,?V?value)?{

????//?Make?sure?the?value?is?not?null

????//如果值value為空,則拋出異常?至于為什么官方不允許為空,下面給出分析

????if?(value?==?null)?{

????????throw?new?NullPointerException();

????}

????//?Makes?sure?the?key?is?not?already?in?the?hashtable.

????Entry<?,?>?tab[]?=?table;

????//直接取key的hashCode()作為哈希地址,這與HashMap的取hashCode()之后再進行hash()的結果作為哈希地址?不一樣

????int?hash?=?key.hashCode();

????//數組下標=(哈希地址?&?0x7FFFFFFF)?%?Hashtable容量,這與HashMap的數組下標=哈希地址?&?(HashMap容量-1)計算數組下標方式不一樣,前者是取模運算,后者是位于運算,這也就是為什么HashMap的容量要是2的冪次方的原因,效率上后者的效率更高。

????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;

????@SuppressWarnings("unchecked")

????Entry<K,V>?entry?=?(Entry<K,V>)tab[index];

????//遍歷Entry鏈表,如果鏈表中存在key、哈希地址相同的節點,則將值更新,返回舊值

????for(;?entry?!=?null?;?entry?=?entry.next)?{

????????if?((entry.hash?==?hash)?&&?entry.key.equals(key))?{

????????????V?old?=?entry.value;

????????????entry.value?=?value;

????????????return?old;

????????}

????}

????//如果為新的節點,則調用addEntry()方法添加新的節點

????addEntry(hash,?key,?value,?index);

????//插入成功返回null

????return?null;

}

private?void?addEntry(int?hash,?K?key,?V?value,?int?index)?{

????modCount++;

????Entry<?,?>?tab[]?=?table;

????//如果當前鍵值對數量>=閾值,則執行rehash()方法擴容Hashtable的容量

????if?(count?>=?threshold)?{

????????//?Rehash?the?table?if?the?threshold?is?exceeded

????????rehash();

????????tab?=?table;

????????//獲取key的hashCode();

????????hash?=?key.hashCode();

????????//重新計算下標,因為Hashtable已經擴容了。

????????index?=?(hash?&?0x7FFFFFFF)?%?tab.length;

????}

????//?Creates?the?new?entry.

????@SuppressWarnings("unchecked")

????//獲取當前Entry鏈表的引用?復賦值給e

????Entry<K,V>?e?=?(Entry<K,V>)?tab[index];

????//創建新的Entry鏈表的?將新的節點插入到Entry鏈表的頭部,再指向之前的Entry,即在鏈表頭部插入節點,這個和HashMap在尾部插入不一樣。

????tab[index]?=?new?Entry<>(hash,?key,?value,?e);

????count++;

}

hashCode()為什么要& 0x7FFFFFFF呢?因為某些對象的hashCode()可能是負值,& 0x7FFFFFFF保證了進行%運算時候得到的下標是個正數

get方法

get方法也是同步的,和HashMap不一樣,即線程安全,具體的get操作和HashMap也有區別。

//同步

public?synchronized?V?get(Object?key)?{

????Entry<?,?>?tab[]?=?table;

????//和put方法一樣?都是直接獲取key的hashCode()作為哈希地址

????int?hash?=?key.hashCode();

????//和put方法一樣?通過(哈希地址?&?0x7FFFFFFF)與Hashtable容量做%運算?計算出下標

????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;

????//遍歷Entry鏈表,如果鏈表中存在key、哈希地址一樣的節點,則找到?返回該節點的值,否者返回null

????for?(Entry<?,?>?e?=?tab[index]?;?e?!=?null?;?e?=?e.next)?{

????????if?((e.hash?==?hash)?&&?e.key.equals(key))?{

????????????return?(V)e.value;

????????}

????}

????return?null;

}

remove方法

//同步

public?synchronized?V?remove(Object?key)?{

????Entry<?,?>?tab[]?=?table;

????int?hash?=?key.hashCode();

????int?index?=?(hash?&?0x7FFFFFFF)?%?tab.length;

????@SuppressWarnings("unchecked")

????Entry<K,V>?e?=?(Entry<K,V>)tab[index];

????//遍歷Entry鏈表,e為當前節點,prev為上一個節點

????for(Entry<K,V>?prev?=?null?;?e?!=?null?;?prev?=?e,?e?=?e.next)?{

????????//找到key、哈希地址一樣的節點

????????if?((e.hash?==?hash)?&&?e.key.equals(key))?{

????????????modCount++;

????????????//如果上一個節點不為空(即不是當前節點頭結點),將上一個節點的next指向當前節點的next,即將當前節點移除鏈表

????????????if?(prev?!=?null)?{

????????????????prev.next?=?e.next;

????????????}?else?{?//如果上一個節點為空,即當前節點為頭結點,將table數組保存的鏈表頭結點地址改成當前節點的下一個節點

????????????????tab[index]?=?e.next;

????????????}

????????????//Hashtable的鍵值對數量-1

????????????count--;

????????????//獲取被刪除節點的值?并且返回

????????????V?oldValue?=?e.value;

????????????e.value?=?null;

????????????return?oldValue;

????????}

????}

????return?null;

}

rehash方法

Hashtable的rehash方法和HashMap的resize方法一樣,是用來擴容哈希表的,但是擴容的實現又有區別。

protected?void?rehash()?{

????//獲取舊的Hashtable的容量

????int?oldCapacity?=?table.length;

????//獲取舊的Hashtable引用,為舊哈希表

????Entry<?,?>[]?oldMap?=?table;

????//?overflow-conscious?code

????//新的Hashtable容量=舊的Hashtable容量?*?2?+?1,這里和HashMap的擴容不一樣,HashMap是新的Hashtable容量=舊的Hashtable容量?*?2。

????int?newCapacity?=?(oldCapacity?<<?1)?+?1;

????//如果新的Hashtable容量大于允許的最大容量值(Integer的最大值?-?8)

????if?(newCapacity?-?MAX_ARRAY_SIZE?>?0)?{

????????//如果舊的容量等于允許的最大容量值則返回

????????if?(oldCapacity?==?MAX_ARRAY_SIZE)

????????????//?Keep?running?with?MAX_ARRAY_SIZE?buckets

????????????return;

????????//新的容量等于允許的最大容量值

????????newCapacity?=?MAX_ARRAY_SIZE;

????}

????//new一個新的Hashtable?容量為新的容量

????Entry<?,?>[]?newMap?=?new?Entry<?,?>[newCapacity];

????modCount++;

????//計算新的閾值

????threshold?=?(int)Math.min(newCapacity?*?loadFactor,?MAX_ARRAY_SIZE?+?1);

????table?=?newMap;

????//擴容后遷移Hashtable的Entry鏈表到正確的下標上

????for?(int?i?=?oldCapacity?;?i--?>?0?;)?{

????????for?(Entry<K,V>?old?=?(Entry<K,V>)oldMap[i]?;?old?!=?null?;?)?{

????????????Entry<K,V>?e?=?old;

????????????old?=?old.next;

????????????int?index?=?(e.hash?&?0x7FFFFFFF)?%?newCapacity;

????????????e.next?=?(Entry<K,V>)newMap[index];

????????????newMap[index]?=?e;

????????}

????}

}

接下來我們執行以下代碼,驗證以下數據遷移過程

Hashtable?hashtable?=?new?Hashtable();

for?(int?i?=?1;?i?<=?24;?i?++)?{

????hashtable.put(String.valueOf(i),?i);

}

for?(int?i?=?25;?i?<=?80;?i?++)?{

????hashtable.put(String.valueOf(i),?i);

}

new一個Hashtable,默認容量是11,負載因子是0.75

執行第一個for循環后,20保存在下標為0的Entry中,即(hash &0x7FFFFFFF) % 容量 -> (1598 &0x7FFFFFFF) % 11 = 0

?

執行第二個for循環后,變成了20保存在下標為70的Entry中,因為Hashtable擴容了4次,分別是從容量為默認的11->23->47->95->191,然后此時容量是191,所以(hash &0x7FFFFFFF) % 容量 -> (1598 &0x7FFFFFFF) % 191 = 70

?

HashMap和Hashtable區別

到這里我們分析了HashMap和Hashtable的原理,現在比較以下他們的區別。

不同點

繼承的類不一樣:HashMap繼承的AbstractMap抽象類,Hashtable繼承的Dictionay抽象類

應對多線程處理方式不一樣:HashMap是非線程安全的,Hashtable是線程安全的,所以Hashtable效率比較低

定位算法不一樣:HashMap通過key的hashCode()進行hash()得到哈希地址,數組下標=哈希地址 & (容量 - 1),采用的是與運算,所以容量需要是2的冪次方結果才和取模運算結果一樣。而Hashtable則是:數組下標=(key的hashCode() & 0x7FFFFFFF ) % 容量,采用的取模運算,所以容量沒要求

鍵值對規則不一樣:HashMap允許鍵值為null,而Hashtable不允許鍵值為null

哈希表擴容算法不一樣:HashMap的容量擴容按照原來的容量*2,而Hashtable的容量擴容按照原來的容量*2+1

容量(capacity)默認值不一樣:HashMap的容量默認值為16,而Hashtable的默認值是11

put方法實現不一樣:HashMap是將節點插入到鏈表的尾部,而Hashtable是將節點插入到鏈表的頭部

底層結構不一樣:HashMap采用了數組+鏈表+紅黑樹,而Hashtable采用數組+鏈表

為什么HashMap允許null鍵值呢,而Hashtable不允許null鍵值呢?這里還得先介紹一下什么是null,我們知道Java語言中有兩種類型,一種是基本類型還有一種是引用類型,其實還有一種特殊的類型就是null類型,它不代表一個對象(Object)也不是一個對象(Object),然后在HashMap和Hashtable對鍵的操作中使用到了Object類中的equals方法,所以如果在Hashtable中置鍵值為null的話就可想而知會報錯了,但是為什么HashMap可以呢?因為HashMap采用了特殊的方式,將null轉為了對象(Object),具體怎么轉的,這里就不深究了。

相同點

實現相同的接口:HashMap和Hashtable均實現了Map接口

負載因子(loadFactor)默認值一樣:HashMap和Hashtable的負載因子默認都是0.75

采用相同的方法處理哈希沖突:都是采用鏈地址法即拉鏈法處理哈希沖突

相同哈希地址可能分配到不同的鏈表,同一個鏈表內節點的哈希地址不一定相同:因為HashMap和Hashtable都會擴容,擴容后容量變化了,相同的哈希地址取到的數組下標也就不一樣。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容