JAVA容器-自問自答學HashMap

前言

這次我和大家一起學習HashMap，HashMap我們在工作中經常會使用，而且面試中也很頻繁會問到，因為它里面蘊含著很多知識點，可以很好的考察個人基礎。但一個這么重要的東西，我為什么沒有在一開始就去學習它呢，因為它是由多種基礎的數據結構和一些代碼設計思想組成的。我們要學習了這些基礎，再學習HashMap，這樣我們才能更好的去理解它。古人云：無欲速，無見小利。欲速則不達，見小利則大事不成。

HashMap其實就是ArrayList和LinkedList的數據結構加上hashCode和equals方法的思想設計出來的。沒有理解上述說的知識點的同學可以翻開我過往的文章記錄。

下面我就以面試問答的形式學習我們的——HashMap（源碼分析基于JDK8，輔以JDK7），問答內容只是對HashMap的一個總結歸納，因為現時已經有大牛把HashMap通俗易懂的剖析了一遍，我學習HashMap也是主要通過這篇文章學習的，強烈推薦：美團點評技術團隊的Java 8系列之重新認識HashMap

問答內容

1.

問：HashMap有用過嗎？您能給我說說他的主要用途嗎？

答：

有用過，我在平常工作中經常會用到HashMap這種數據結構，HashMap是基于Map接口實現的一種鍵-值對<key,value>的存儲結構，允許null值，同時非有序，非同步(即線程不安全)。HashMap的底層實現是數組 + 鏈表 + 紅黑樹（JDK1.8增加了紅黑樹部分）。它存儲和查找數據時，是根據鍵key的hashCode的值計算出具體的存儲位置。HashMap最多只允許一條記錄的鍵key為null，HashMap增刪改查等常規操作都有不錯的執行效率，是ArrayList和LinkedList等數據結構的一種折中實現。

示例代碼：

        // 創建一個HashMap，如果沒有指定初始大小，默認底層hash表數組的大小為16
        HashMap<String, String> hashMap = new HashMap<String, String>();
        // 往容器里面添加元素
        hashMap.put("小明", "好帥");
        hashMap.put("老王", "坑爹貨");
        hashMap.put("老鐵", "沒毛病");
        hashMap.put("掘金", "好地方");
        hashMap.put("王五", "別搞事");
        // 獲取key為小明的元素 好帥
        String element = hashMap.get("小明");
        // value : 好帥
        System.out.println(element);
        // 移除key為王五的元素
        String removeElement = hashMap.remove("王五");
        // value : 別搞事
        System.out.println(removeElement);
        // 修改key為小明的元素的值value 為 其實有點丑
        hashMap.replace("小明", "其實有點丑");
        // {老鐵=沒毛病, 小明=其實有點丑, 老王=坑爹貨, 掘金=好地方}
        System.out.println(hashMap);
        // 通過put方法也可以達到修改對應元素的值的效果
        hashMap.put("小明", "其實還可以啦,開玩笑的");
        // {老鐵=沒毛病, 小明=其實還可以啦,開玩笑的, 老王=坑爹貨, 掘金=好地方}
        System.out.println(hashMap);
        // 判斷key為老王的元素是否存在(捉奸老王)
        boolean isExist = hashMap.containsKey("老王");
        // true , 老王竟然來搞事
        System.out.println(isExist);
        // 判斷是否有 value = "坑爹貨" 的人
        boolean isHasSomeOne = hashMap.containsValue("坑爹貨");
        // true 老王是坑爹貨
        System.out.println(isHasSomeOne);
        // 查看這個容器里面還有幾個家伙 value : 4
        System.out.println(hashMap.size());

HashMap的底層實現是數組 + 鏈表 + 紅黑樹（JDK1.8增加了紅黑樹部分），核心組成元素有：

int size;用于記錄HashMap實際存儲元素的個數；
float loadFactor;負載因子（默認是0.75，此屬性后面詳細解釋）。
int threshold;下一次擴容時的閾值，達到閾值便會觸發擴容機制resize（閾值 threshold = 容器容量 capacity * 負載因子 load factor）。也就是說，在容器定義好容量之后，負載因子越大，所能容納的鍵值對元素個數就越多。
Node<K,V>[] table; 底層數組，充當哈希表的作用，用于存儲對應hash位置的元素Node<K,V>，此數組長度總是2的N次冪。（具體原因后面詳細解釋）

示例代碼：

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
·····

    /* ---------------- Fields -------------- */

    /**
     * 哈希表，在第一次使用到時進行初始化，重置大小是必要的操作，
     * 當分配容量時，長度總是2的N次冪。
     */
    transient Node<K,V>[] table;

    /**
     * 實際存儲的key - value 鍵值對 個數
     */
    transient int size;


    /**
     * 下一次擴容時的閾值 
     * (閾值 threshold = 容器容量 capacity * 負載因子 load factor).
     * @serial
     */
    int threshold;

    /**
     * 哈希表的負載因子
     *
     * @serial
     */
    final float loadFactor;

·····
}

其中Node<K,V>[] table;哈希表存儲的核心元素是Node<K,V>,Node<K,V>包含：

final int hash;元素的哈希值，決定元素存儲在Node<K,V>[] table;哈希表中的位置。由final修飾可知，當hash的值確定后，就不能再修改。
final K key; 鍵，由final修飾可知，當key的值確定后，就不能再修改。
V value; 值
Node<K,V> next; 記錄下一個元素結點(單鏈表結構，用于解決hash沖突)

示例代碼：


    /**
     * 定義HashMap存儲元素結點的底層實現
     */
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;//元素的哈希值 由final修飾可知，當hash的值確定后，就不能再修改
        final K key;// 鍵，由final修飾可知，當key的值確定后，就不能再修改
        V value; // 值
        Node<K,V> next; // 記錄下一個元素結點(單鏈表結構，用于解決hash沖突)

        
        /**
         * Node結點構造方法
         */
        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;//元素的哈希值
            this.key = key;// 鍵
            this.value = value; // 值
            this.next = next;// 記錄下一個元素結點
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        /**
         * 為Node重寫hashCode方法，值為：key的hashCode 異或 value的hashCode 
         * 運算作用就是將2個hashCode的二進制中，同一位置相同的值為0，不同的為1。
         */
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        /**
         * 修改某一元素的值
         */
        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        /**
         * 為Node重寫equals方法
         */
        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

hashMap內存結構圖 - 圖片來自于《美團點評技術團隊文章》

2.

問：您能說說HashMap常用操作的底層實現原理嗎？如存儲put(K key, V value)，查找get(Object key)，刪除remove(Object key)，修改replace(K key, V value)等操作。

答：

調用put(K key, V value)操作添加key-value鍵值對時，進行了如下操作：

判斷哈希表Node<K,V>[] table是否為空或者null，是則執行resize()方法進行擴容。
根據插入的鍵值key的hash值，通過(n - 1) & hash當前元素的hash值 & hash表長度 - 1（實際就是 hash值 % hash表長度）計算出存儲位置table[i]。如果存儲位置沒有元素存放，則將新增結點存儲在此位置table[i]。
如果存儲位置已經有鍵值對元素存在，則判斷該位置元素的hash值和key值是否和當前操作元素一致，一致則證明是修改value操作，覆蓋value即可。
當前存儲位置即有元素，又不和當前操作元素一致，則證明此位置table[i]已經發生了hash沖突，則通過判斷頭結點是否是treeNode，如果是treeNode則證明此位置的結構是紅黑樹，已紅黑樹的方式新增結點。
如果不是紅黑樹，則證明是單鏈表，將新增結點插入至鏈表的最后位置，隨后判斷當前鏈表長度是否大于等于 8，是則將當前存儲位置的鏈表轉化為紅黑樹。遍歷過程中如果發現key已經存在，則直接覆蓋value。
插入成功后，判斷當前存儲鍵值對的數量大于閾值threshold 是則擴容。

hashMap put方法執行流程圖- 圖片來自于《美團點評技術團隊文章》

示例代碼：

    /**
     * 添加key-value鍵值對
     *
     * @param key 鍵
     * @param value 值
     * @return 如果原本存在此key，則返回舊的value值，如果是新增的key-     
     *         value，則返回nulll
     */
    public V put(K key, V value) {
        //實際調用putVal方法進行添加 key-value 鍵值對操作
        return putVal(hash(key), key, value, false, true);
    }

    /**
     * 根據key 鍵 的 hashCode 通過 “擾動函數” 生成對應的 hash值
     * 經過此操作后，使每一個key對應的hash值生成的更均勻，
     * 減少元素之間的碰撞幾率（后面詳細說明）
     */
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }


    /**
     * 添加key-value鍵值對的實際調用方法（重點）
     *
     * @param hash key 鍵的hash值
     * @param key 鍵
     * @param value 值
     * @param onlyIfAbsent 此值如果是true, 則如果此key已存在value，則不執
     * 行修改操作 
     * @param evict 此值如果是false，哈希表是在初始化模式
     * @return 返回原本的舊值, 如果是新增，則返回null
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // 用于記錄當前的hash表
        Node<K,V>[] tab; 
        // 用于記錄當前的鏈表結點
        Node<K,V> p; 
        // n用于記錄hash表的長度，i用于記錄當前操作索引index
        int n, i;
        // 當前hash表為空
        if ((tab = table) == null || (n = tab.length) == 0)
            // 初始化hash表，并把初始化后的hash表長度值賦值給n
            n = (tab = resize()).length;
        // 1）通過 (n - 1) & hash 當前元素的hash值 & hash表長度 - 1
        // 2）確定當前元素的存儲位置，此運算等價于 當前元素的hash值 % hash表的長度
        // 3）計算出的存儲位置沒有元素存在
        if ((p = tab[i = (n - 1) & hash]) == null)
            // 4) 則新建一個Node結點，在該位置存儲此元素
            tab[i] = newNode(hash, key, value, null);
        else { // 當前存儲位置已經有元素存在了(不考慮是修改的情況的話，就代表發生hash沖突了)
            // 用于存放新增結點
            Node<K,V> e; 
            // 用于臨時存在某個key值
            K k;
            // 1)如果當前位置已存在元素的hash值和新增元素的hash值相等
            // 2)并且key也相等，則證明是同一個key元素，想執行修改value操作
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;// 將當前結點引用賦值給e
            else if (p instanceof TreeNode) // 如果當前結點是樹結點
                // 則證明當前位置的鏈表已變成紅黑樹結構，則已紅黑樹結點結構新增元素
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {// 排除上述情況，則證明已發生hash沖突，并hash沖突位置現時的結構是單鏈表結構
                for (int binCount = 0; ; ++binCount) {
                    //遍歷單鏈表，將新元素結點放置此鏈表的最后一位
                    if ((e = p.next) == null) {
                        // 將新元素結點放在此鏈表的最后一位
                        p.next = newNode(hash, key, value, null);
                        // 新增結點后，當前結點數量是否大于等于 閾值 8 
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 大于等于8則將鏈表轉換成紅黑樹
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 如果鏈表中已經存在對應的key，則覆蓋value
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // 已存在對應key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null) //如果允許修改，則修改value為新值
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        // 當前存儲鍵值對的數量 大于 閾值 是則擴容
        if (++size > threshold)
           // 重置hash大小，將舊hash表的數據逐一復制到新的hash表中（后面詳細講解）
            resize();
        afterNodeInsertion(evict);
        // 返回null，則證明是新增操作，而不是修改操作
        return null;
    }

調用get(Object key)操作根據鍵key查找對應的key-value鍵值對時，進行了如下操作：

先調用 hash(key)方法計算出 key 的 hash值
根據查找的鍵值key的hash值，通過(n - 1) & hash當前元素的hash值 & hash表長度 - 1（實際就是 hash值 % hash表長度）計算出存儲位置table[i]，判斷存儲位置是否有元素存在。

如果存儲位置有元素存放，則首先比較頭結點元素，如果頭結點的key的hash值和要獲取的key的hash值相等，并且頭結點的key本身和要獲取的 key 相等，則返回該位置的頭結點。
如果存儲位置沒有元素存放，則返回null。

如果存儲位置有元素存放，但是頭結點元素不是要查找的元素，則需要遍歷該位置進行查找。
先判斷頭結點是否是treeNode，如果是treeNode則證明此位置的結構是紅黑樹，以紅色樹的方式遍歷查找該結點，沒有則返回null。
如果不是紅黑樹，則證明是單鏈表。遍歷單鏈表，逐一比較鏈表結點，鏈表結點的key的hash值和要獲取的key的hash值相等，并且鏈表結點的key本身和要獲取的 key 相等，則返回該結點，遍歷結束仍未找到對應key的結點，則返回null。

示例代碼：


    /**
     * 返回指定 key 所映射的 value 值
     * 或者 返回 null 如果容器里不存在對應的key
     *
     * 更確切地講，如果此映射包含一個滿足 (key==null ? k==null :key.equals(k))
     * 的從 k 鍵到 v 值的映射關系，
     * 則此方法返回 v；否則返回 null。（最多只能有一個這樣的映射關系。）
     *
     * 返回 null 值并不一定 表明該映射不包含該鍵的映射關系；
     * 也可能該映射將該鍵顯示地映射為 null。可使用containsKey操作來區分這兩種情況。 
     *
     * @see #put(Object, Object)
     */
    public V get(Object key) {
        Node<K,V> e;
        // 1.先調用 hash(key)方法計算出 key 的 hash值
        // 2.隨后調用getNode方法獲取對應key所映射的value值
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }


    /**
     * 獲取哈希表結點的方法實現
     *
     * @param hash key 鍵的hash值
     * @param key 鍵
     * @return 返回對應的結點，如果結點不存在，則返回null
     */
    final Node<K,V> getNode(int hash, Object key) {
        // 用于記錄當前的hash表 
        Node<K,V>[] tab; 
        // first用于記錄對應hash位置的第一個結點，e充當工作結點的作用
        Node<K,V> first, e; 
        // n用于記錄hash表的長度
        int n; 
        // 用于臨時存放Key
        K k;
        // 通過 (n - 1) & hash 當前元素的hash值 & hash表長度 - 1
        // 判斷當前元素的存儲位置是否有元素存在 
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {//元素存在的情況
           // 如果頭結點的key的hash值 和 要獲取的key的hash值相等
           // 并且 頭結點的key本身 和要獲取的 key 相等
            if (first.hash == hash && // always check first node 總是檢查頭結點
                ((k = first.key) == key || (key != null && key.equals(k))))
                // 返回該位置的頭結點
                return first;
            if ((e = first.next) != null) {// 頭結點不相等
                if (first instanceof TreeNode) // 如果當前結點是樹結點
                    // 則證明當前位置的鏈表已變成紅黑樹結構
                    // 通過紅黑樹結點的方式獲取對應key結點
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {// 當前位置不是紅黑樹，則證明是單鏈表
                    // 遍歷單鏈表，逐一比較鏈表結點
                    // 鏈表結點的key的hash值 和 要獲取的key的hash值相等
                    // 并且 鏈表結點的key本身 和要獲取的 key 相等
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        // 找到對應的結點則返回
                        return e;
                } while ((e = e.next) != null);
            }
        }
        // 通過上述查找均無找到，則返回null
        return null;
    }

調用remove(Object key)操作根據鍵key刪除對應的key-value鍵值對時，進行了如下操作：

先調用 hash(key)方法計算出 key 的 hash值
根據查找的鍵值key的hash值，通過(n - 1) & hash當前元素的hash值 & hash表長度 - 1（實際就是 hash值 % hash表長度）計算出存儲位置table[i]，判斷存儲位置是否有元素存在。

如果存儲位置有元素存放，則首先比較頭結點元素，如果頭結點的key的hash值和要獲取的key的hash值相等，并且頭結點的key本身和要獲取的 key 相等，則該位置的頭結點即為要刪除的結點，記錄此結點至變量node中。
如果存儲位置沒有元素存放，則沒有找到對應要刪除的結點，則返回null。

如果存儲位置有元素存放，但是頭結點元素不是要刪除的元素，則需要遍歷該位置進行查找。
先判斷頭結點是否是treeNode，如果是treeNode則證明此位置的結構是紅黑樹，以紅色樹的方式遍歷查找并刪除該結點，沒有則返回null。
如果不是紅黑樹，則證明是單鏈表。遍歷單鏈表，逐一比較鏈表結點，鏈表結點的key的hash值和要獲取的key的hash值相等，并且鏈表結點的key本身和要獲取的 key 相等，則此為要刪除的結點，記錄此結點至變量node中，遍歷結束仍未找到對應key的結點，則返回null。
如果找到要刪除的結點node，則判斷是否需要比較value也是否一致，如果value值一致或者不需要比較value值，則執行刪除結點操作，刪除操作根據不同的情況與結構進行不同的處理。

如果當前結點是樹結點，則證明當前位置的鏈表已變成紅黑樹結構，通過紅黑樹結點的方式刪除對應結點。
如果不是紅黑樹，則證明是單鏈表。如果要刪除的是頭結點，則當前存儲位置table[i]的頭結點指向刪除結點的下一個結點。
如果要刪除的結點不是頭結點，則將要刪除的結點的后繼結點node.next賦值給要刪除結點的前驅結點的next域，即p.next = node.next;。

HashMap當前存儲鍵值對的數量 - 1，并返回刪除結點。

示例代碼：


    /**
     * 從此映射中移除指定鍵的映射關系（如果存在）。
     *
     * @param  key 其映射關系要從映射中移除的鍵
     * @return 與 key 關聯的舊值；如果 key 沒有任何映射關系，則返回 null。
     *        （返回 null 還可能表示該映射之前將 null 與 key 關聯。）
     */
    public V remove(Object key) {
        Node<K,V> e;
        // 1.先調用 hash(key)方法計算出 key 的 hash值
        // 2.隨后調用removeNode方法刪除對應key所映射的結點
        return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
    }


    /**
     * 刪除哈希表結點的方法實現
     *
     * @param hash 鍵的hash值
     * @param key 鍵
     * @param value 用于比較的value值，當matchValue 是 true時才有效, 否則忽略
     * @param matchValue 如果是 true 只有當value相等時才會移除
     * @param movable 如果是 false當執行移除操作時，不刪除其他結點
     * @return 返回刪除結點node，不存在則返回null
     */
    final Node<K,V> removeNode(int hash, Object key, Object value,
                               boolean matchValue, boolean movable) {
        // 用于記錄當前的hash表
        Node<K,V>[] tab; 
        // 用于記錄當前的鏈表結點
        Node<K,V> p; 
        // n用于記錄hash表的長度，index用于記錄當前操作索引index
        int n, index;
        // 通過 (n - 1) & hash 當前元素的hash值 & hash表長度 - 1
        // 判斷當前元素的存儲位置是否有元素存在 
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (p = tab[index = (n - 1) & hash]) != null) {// 元素存在的情況
            // node 用于記錄找到的結點，e為工作結點
            Node<K,V> node = null, e; 
            K k; V v;
           // 如果頭結點的key的hash值 和 要獲取的key的hash值相等
           // 并且 頭結點的key本身 和要獲取的 key 相等
           // 則證明此頭結點就是要刪除的結點
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                // 記錄要刪除的結點的引用地址至node中
                node = p;
            else if ((e = p.next) != null) {// 頭結點不相等
                if (p instanceof TreeNode)// 如果當前結點是樹結點
                    // 則證明當前位置的鏈表已變成紅黑樹結構
                    // 通過紅黑樹結點的方式獲取對應key結點
                    // 記錄要刪除的結點的引用地址至node中
                    node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                else {// 當前位置不是紅黑樹，則證明是單鏈表
                    do {
                        // 遍歷單鏈表，逐一比較鏈表結點
                        // 鏈表結點的key的hash值 和 要獲取的key的hash值相等
                        // 并且 鏈表結點的key本身 和要獲取的 key 相等
                        if (e.hash == hash &&
                            ((k = e.key) == key ||
                             (key != null && key.equals(k)))) {
                            // 找到則記錄要刪除的結點的引用地址至node中，中斷遍歷
                            node = e;
                            break;
                        }
                        p = e;
                    } while ((e = e.next) != null);
                }
            }
            // 如果找到要刪除的結點，則判斷是否需要比較value也是否一致
            if (node != null && (!matchValue || (v = node.value) == value ||
                                 (value != null && value.equals(v)))) {
                // value值一致或者不需要比較value值，則執行刪除結點操作
                if (node instanceof TreeNode) // 如果當前結點是樹結點
                    // 則證明當前位置的鏈表已變成紅黑樹結構
                    // 通過紅黑樹結點的方式刪除對應結點
                    ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                else if (node == p) // node 和 p相等，則證明刪除的是頭結點
                    // 當前存儲位置的頭結點指向刪除結點的下一個結點
                    tab[index] = node.next;
                else // 刪除的不是頭結點
                    // p是刪除結點node的前驅結點，p的next改為記錄要刪除結點node的后繼結點
                    p.next = node.next;
                ++modCount;
               // 當前存儲鍵值對的數量 - 1
                --size;
                afterNodeRemoval(node);
                // 返回刪除結點
                return node;
            }
        }
        // 不存在要刪除的結點，則返回null
        return null;
    }

調用replace(K key, V value)操作根據鍵key查找對應的key-value鍵值對，隨后替換對應的值value，進行了如下操作：

先調用 hash(key)方法計算出 key 的 hash值
隨后調用getNode方法獲取對應key所映射的value值。
記錄元素舊值，將新值賦值給元素，返回元素舊值，如果沒有找到元素，則返回null。

示例代碼：


    /**
     * 替換指定 key 所映射的 value 值
     *
     * @param key 對應要替換value值元素的key鍵
     * @param value 要替換對應元素的新value值
     * @return 返回原本的舊值，如果沒有找到key對應的元素，則返回null
     * @since 1.8 JDK1.8新增方法
     */
    public V replace(K key, V value) {
        Node<K,V> e;
        // 1.先調用 hash(key)方法計算出 key 的 hash值
        // 2.隨后調用getNode方法獲取對應key所映射的value值
        if ((e = getNode(hash(key), key)) != null) {// 如果找到對應的元素
            // 元素舊值
            V oldValue = e.value;
            // 將新值賦值給元素
            e.value = value;
            afterNodeAccess(e);
            // 返回元素舊值
            return oldValue;
        }
        // 沒有找到元素，則返回null
        return null;
    }

3.

問 1：您上面說，存放一個元素時，先計算它的hash值確定它的存儲位置，然后再把這個元素放到對應的位置上，那萬一這個位置上面已經有元素存在呢，新增的這個元素怎么辦？

問 2：hash沖突（或者叫hash碰撞）是什么？為什么會出現這種現象，如何解決hash沖突？

答：

hash沖突：當我們調用put(K key, V value)操作添加key-value鍵值對，這個key-value鍵值對存放在的位置是通過擾動函數(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16)計算鍵key的hash值。隨后將這個hash值 % 模上哈希表Node<K,V>[] table的長度得到具體的存放位置。所以put(K key, V value)多個元素，是有可能計算出相同的存放位置。此現象就是hash沖突或者叫hash碰撞。
例子如下：
元素 A 的hash值為 9，元素 B 的hash值為 17。哈希表Node<K,V>[] table的長度為8。則元素 A 的存放位置為9 % 8 = 1，元素 B 的存放位置為17 % 8 = 1。兩個元素的存放位置均為table[1]，發生了hash沖突。
hash沖突的避免：既然會發生hash沖突，我們就應該想辦法避免此現象的發生，解決這個問題最關鍵就是如果生成元素的hash值。Java是使用“擾動函數”生成元素的hash值。

示例代碼：

   /**
    * JDK 7 的 hash方法
    */
    final int hash(int h) {

        h ^= k.hashCode();

        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

   /**
    * JDK 8 的 hash方法
    */
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

Java7做了4次16位右位移異或混合，Java 8中這步已經簡化了，只做一次16位右位移異或混合，而不是四次，但原理是不變的。例子如下：

擾動函數執行例子 - 圖片來自于《知乎》

右位移16位，正好是32bit的一半，自己的高半區和低半區做異或，就是為了混合原始哈希碼的高位和低位，以此來加大低位的隨機性。而且混合后的低位摻雜了高位的部分特征，這樣高位的信息也被變相保留下來。

上述擾動函數的解釋參考自：JDK 源碼中 HashMap 的 hash 方法原理是什么？

hash沖突解決：解決hash沖突的方法有很多，常見的有：開發定址法，
再散列法，鏈地址法，公共溢出區法（詳細說明請查看我的文章JAVA基礎-自問自答學hashCode和equals）。HashMap是使用鏈地址法解決hash沖突的，當有沖突元素放進來時，會將此元素插入至此位置鏈表的最后一位，形成單鏈表。但是由于是單鏈表的緣故，每當通過hash % length找到該位置的元素時，均需要從頭遍歷鏈表，通過逐一比較hash值，找到對應元素。如果此位置元素過多，造成鏈表過長，遍歷時間會大大增加，最壞情況下的時間復雜度為O(N)，造成查找效率過低。所以當存在位置的鏈表長度大于等于 8 時，HashMap會將鏈表轉變為紅黑樹，紅黑樹最壞情況下的時間復雜度為O(logn)。以此提高查找效率。

4.

問：HashMap的容量為什么一定要是2的n次方？

答：

因為調用put(K key, V value)操作添加key-value鍵值對時，具體確定此元素的位置是通過 hash值 % 模上哈希表Node<K,V>[] table的長度 hash % length 計算的。但是"模"運算的消耗相對較大，通過位運算h & (length-1)也可以得到取模后的存放位置，而位運算的運行效率高，但只有length的長度是2的n次方時，h & (length-1) 才等價于 h % length。
而且當數組長度為2的n次冪的時候，不同的key算出的index相同的幾率較小，那么數據在數組上分布就比較均勻，也就是說碰撞的幾率小，相對的，查詢的時候就不用遍歷某個位置上的鏈表，這樣查詢效率也就較高了。

例子：

hash & (length-1)運算過程.jpg

上圖中，左邊兩組的數組長度是16（2的4次方），右邊兩組的數組長度是15。兩組的hash值均為8和9。
當數組長度是15時，當它們和1110進行&與運算（相同為1，不同為0）時，計算的結果都是1000，所以他們都會存放在相同的位置table[8]中，這樣就發生了hash沖突，那么查詢時就要遍歷鏈表，逐一比較hash值，降低了查詢的效率。
同時，我們可以發現，當數組長度為15的時候，hash值均會與14（1110）進行&與運算，那么最后一位永遠是0，而0001，0011，0101，1001，1011，0111，1101這幾個位置永遠都不能存放元素了，空間浪費相當大，更糟的是這種情況中，數組可以使用的位置比數組長度小了很多，這意味著進一步增加了碰撞的幾率，減慢了查詢的效率。

所以，HashMap的容量是2的n次方，有利于提高計算元素存放位置時的效率，也降低了hash沖突的幾率。因此，我們使用HashMap存儲大量數據的時候，最好先預先指定容器的大小為2的n次方，即使我們不指定為2的n次方，HashMap也會把容器的大小設置成最接近設置數的2的n次方，如，設置HashMap的大小為 7 ，則HashMap會將容器大小設置成最接近7的一個2的n次方數，此值為 8 。

上述回答參考自：深入理解HashMap

示例代碼：

    /**
     * 返回一個比指定數cap大的，并且大小是2的n次方的數
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

5.

問：HashMap的負載因子是什么，有什么作用？

答：負載因子表示哈希表空間的使用程度（或者說是哈希表空間的利用率）。

例子如下：
底層哈希表Node<K,V>[] table的容量大小capacity為 16，負載因子load factor為 0.75，則當存儲的元素個數size = capacity 16 * load factor 0.75等于 12 時，則會觸發HashMap的擴容機制，調用resize()方法進行擴容。
當負載因子越大，則HashMap的裝載程度就越高。也就是能容納更多的元素，元素多了，發生hash碰撞的幾率就會加大，從而鏈表就會拉長，此時的查詢效率就會降低。
當負載因子越小，則鏈表中的數據量就越稀疏，此時會對空間造成浪費，但是此時查詢效率高。
我們可以在創建HashMap 時根據實際需要適當地調整load factor 的值；如果程序比較關心空間開銷、內存比較緊張，可以適當地增加負載因子；如果程序比較關心時間開銷，內存比較寬裕則可以適當的減少負載因子。通常情況下，默認負載因子 (0.75) 在時間和空間成本上尋求一種折衷，程序員無需改變負載因子的值。
因此，如果我們在初始化HashMap時，就預估知道需要裝載key-value鍵值對的容量size，我們可以通過size / load factor 計算出我們需要初始化的容量大小initialCapacity，這樣就可以避免HashMap因為存放的元素達到閾值threshold而頻繁調用resize()方法進行擴容。從而保證了較好的性能。

6.

問：您能說說HashMap和HashTable的區別嗎？

答：HashMap和HashTable有如下區別：

1）容器整體結構：

HashMap的key和value都允許為null，HashMap遇到key為null的時候，調用putForNullKey方法進行處理，而對value沒有處理。
Hashtable的key和value都不允許為null。Hashtable遇到null，直接返回NullPointerException。

2）容量設定與擴容機制：

HashMap默認初始化容量為 16，并且容器容量一定是2的n次方，擴容時，是以原容量 2倍的方式進行擴容。
Hashtable默認初始化容量為 11，擴容時，是以原容量 2倍再加 1的方式進行擴容。即int newCapacity = (oldCapacity << 1) + 1;。

3）散列分布方式（計算存儲位置）：

HashMap是先將key鍵的hashCode經過擾動函數擾動后得到hash值，然后再利用 hash & (length - 1)的方式代替取模，得到元素的存儲位置。
Hashtable則是除留余數法進行計算存儲位置的（因為其默認容量也不是2的n次方。所以也無法用位運算替代模運算），int index = (hash & 0x7FFFFFFF) % tab.length;。
由于HashMap的容器容量一定是2的n次方，所以能使用hash & (length - 1)的方式代替取模的方式計算元素的位置提高運算效率，但Hashtable的容器容量不一定是2的n次方，所以不能使用此運算方式代替。

4）線程安全（最重要）：

HashMap 不是線程安全，如果想線程安全，可以通過調用synchronizedMap(Map<K,V> m)使其線程安全。但是使用時的運行效率會下降，所以建議使用ConcurrentHashMap容器以此達到線程安全。
Hashtable則是線程安全的，每個操作方法前都有synchronized修飾使其同步，但運行效率也不高，所以還是建議使用ConcurrentHashMap容器以此達到線程安全。

因此，Hashtable是一個遺留容器，如果我們不需要線程同步，則建議使用HashMap，如果需要線程同步，則建議使用ConcurrentHashMap。

此處不再對Hashtable的源碼進行逐一分析了，如果想深入了解的同學，可以參考此文章
Hashtable源碼剖析

7.

問：您說HashMap不是線程安全的，那如果多線程下，它是如何處理的？并且什么情況下會發生線程不安全的情況？

答：

HashMap不是線程安全的，如果多個線程同時對同一個HashMap更改數據的話，會導致數據不一致或者數據污染。如果出現線程不安全的操作時，HashMap會盡可能的拋出ConcurrentModificationException防止數據異常，當我們在對一個HashMap進行遍歷時，在遍歷期間，我們是不能對HashMap進行添加，刪除等更改數據的操作的，否則也會拋出ConcurrentModificationException異常，此為fail-fast（快速失敗）機制。從源碼上分析，我們在put,remove等更改HashMap數據時，都會導致modCount的改變，當expectedModCount != modCount時，則拋出ConcurrentModificationException。如果想要線程安全，可以考慮使用ConcurrentHashMap。
而且，在多線程下操作HashMap，由于存在擴容機制，當HashMap調用resize()進行自動擴容時，可能會導致死循環的發生。

由于時間關系，我暫不帶著大家一起去分析resize()方法導致死循環發生的現象造成原因了，遲點有空我會再補充上去，請見諒，大家可以參考如下文章：

Java 8系列之重新認識HashMap

談談HashMap線程不安全的體現

8.

問：我們在使用HashMap時，選取什么對象作為key鍵比較好，為什么？

答：

可變對象：指創建后自身狀態能改變的對象。換句話說，可變對象是該對象在創建后它的哈希值可能被改變。
我們在使用HashMap時，最好選擇不可變對象作為key。例如String，Integer等不可變類型作為key是非常明智的。
如果key對象是可變的，那么key的哈希值就可能改變。在HashMap中可變對象作為Key會造成數據丟失。因為我們再進行hash & (length - 1)取模運算計算位置查找對應元素時，位置可能已經發生改變，導致數據丟失。

詳細例子說明請參考：危險！在HashMap中將可變對象用作Key

總結

HashMap是基于Map接口實現的一種鍵-值對<key,value>的存儲結構，允許null值，同時非有序，非同步(即線程不安全)。HashMap的底層實現是數組 + 鏈表 + 紅黑樹（JDK1.8增加了紅黑樹部分）。
HashMap定位元素位置是通過鍵key經過擾動函數擾動后得到hash值，然后再通過hash & (length - 1)代替取模的方式進行元素定位的。
HashMap是使用鏈地址法解決hash沖突的，當有沖突元素放進來時，會將此元素插入至此位置鏈表的最后一位，形成單鏈表。當存在位置的鏈表長度大于等于 8 時，HashMap會將鏈表轉變為紅黑樹，以此提高查找效率。
HashMap的容量是2的n次方，有利于提高計算元素存放位置時的效率，也降低了hash沖突的幾率。因此，我們使用HashMap存儲大量數據的時候，最好先預先指定容器的大小為2的n次方，即使我們不指定為2的n次方，HashMap也會把容器的大小設置成最接近設置數的2的n次方，如，設置HashMap的大小為 7 ，則HashMap會將容器大小設置成最接近7的一個2的n次方數，此值為 8 。
HashMap的負載因子表示哈希表空間的使用程度（或者說是哈希表空間的利用率）。當負載因子越大，則HashMap的裝載程度就越高。也就是能容納更多的元素，元素多了，發生hash碰撞的幾率就會加大，從而鏈表就會拉長，此時的查詢效率就會降低。當負載因子越小，則鏈表中的數據量就越稀疏，此時會對空間造成浪費，但是此時查詢效率高。
HashMap不是線程安全的，Hashtable則是線程安全的。但Hashtable是一個遺留容器，如果我們不需要線程同步，則建議使用HashMap，如果需要線程同步，則建議使用ConcurrentHashMap。
在多線程下操作HashMap，由于存在擴容機制，當HashMap調用resize()進行自動擴容時，可能會導致死循環的發生。
我們在使用HashMap時，最好選擇不可變對象作為key。例如String，Integer等不可變類型作為key是非常明智的。

由于最近工作較忙，也有拖延癥發作的問題，所以文章遲遲未能完成發布，現時完成的文章其實對我而言，也不算太好，但還是打算先發出來讓大家看看，一起學習學習，看有什么不好的地方，我再慢慢改進，如果此文對你有幫助，請給個贊，謝謝大家。

參考文章

Java 8系列之重新認識HashMap
JDK 源碼中 HashMap 的 hash 方法原理是什么？
深入理解HashMap
HashMap負載因子
 Hashtable源碼剖析
 危險！在HashMap中將可變對象用作Key
談談HashMap線程不安全的體現

最后編輯于：2017.12.10 04:46:50

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,572評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,071評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,409評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,569評論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,360評論 6贊 404
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,895評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 42,979評論 3贊 440
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,123評論 0贊 286
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,643評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,559評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,742評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,250評論 5贊 356
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 43,981評論 3贊 346
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,363評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,622評論 1贊 280
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,354評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,707評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

JAVA容器-自問自答學HashMap

JAVA容器-自問自答學HashMap

前言

問答內容

1.

2.

3.

4.

5.

6.

7.

8.

總結

參考文章

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

JAVA容器-自問自答學HashMap

前言

問答內容

1.

2.

3.

4.

5.

6.

7.

8.

總結

參考文章

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频