HashMap源碼分析

HashMap采用key/value存儲結(jié)構(gòu),每個key對應(yīng)唯一的value,查詢和修改的速度都很快,能達(dá)到O(1)的平均時間復(fù)雜度。它是非線程安全的,且不保證元素存儲的順序;

image.png

HashMap繼承自AbstractMap,實現(xiàn)了Map接口,具有Map的所有功能。

image.png

在Java中,HashMap的實現(xiàn)采用了(數(shù)組 + 鏈表 + 紅黑樹)的復(fù)雜結(jié)構(gòu),數(shù)組的一個元素又稱作桶。

在添加元素時,會根據(jù)hash值算出元素在數(shù)組中的位置,如果該位置沒有元素,則直接把元素放置在此處,如果該位置有元素了,則把元素以鏈表的形式放置在鏈表的尾部。

當(dāng)一個鏈表的元素個數(shù)達(dá)到一定的數(shù)量(且數(shù)組的長度達(dá)到一定的長度)后,則把鏈表轉(zhuǎn)化為紅黑樹,從而提高效率。

數(shù)組的查詢效率為O(1),鏈表的查詢效率是O(k),紅黑樹的查詢效率是O(log k),k為桶中的元素個數(shù),所以當(dāng)元素數(shù)量非常多的時候,轉(zhuǎn)化為紅黑樹能極大地提高效率。

源碼

**
 * 默認(rèn)的初始容量為16
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

/**
 * 最大的容量為2的30次方
 */
static final int MAXIMUM_CAPACITY = 1 << 30;

/**
 * 默認(rèn)的裝載因子
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;

/**
 * 當(dāng)一個桶中的元素個數(shù)大于等于8時進(jìn)行樹化
 */
static final int TREEIFY_THRESHOLD = 8;

/**
 * 當(dāng)一個桶中的元素個數(shù)小于等于6時把樹轉(zhuǎn)化為鏈表
 */
static final int UNTREEIFY_THRESHOLD = 6;

/**
 * 當(dāng)桶的個數(shù)達(dá)到64的時候才進(jìn)行樹化
 */
static final int MIN_TREEIFY_CAPACITY = 64;

/**
 * 數(shù)組,又叫作桶(bucket)
 */
transient Node<K,V>[] table;

/**
 * 作為entrySet()的緩存
 */
transient Set<Map.Entry<K,V>> entrySet;

/**
 * 元素的數(shù)量
 */
transient int size;

/**
 * 修改次數(shù),用于在迭代的時候執(zhí)行快速失敗策略
 */
transient int modCount;

/**
 * 當(dāng)桶的使用數(shù)量達(dá)到多少時進(jìn)行擴(kuò)容,threshold = capacity * loadFactor
 */
int threshold;

/**
 * 裝載因子
 */
final float loadFactor;

Node內(nèi)部類
Node是一個典型的單鏈表節(jié)點,其中,hash用來存儲key計算得來的hash值。

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;
}

TreeNode內(nèi)部類
TreeNode是一個典型的樹型節(jié)點,其中,prev是鏈表中的節(jié)點,用于在刪除元素的時候可以快速找到它的前置節(jié)點。

// 位于HashMap中
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;  // red-black tree links
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;    // needed to unlink next upon deletion
    boolean red;
}

// 位于LinkedHashMap中,典型的雙向鏈表節(jié)點
static class Entry<K,V> extends HashMap.Node<K,V> {
    Entry<K,V> before, after;
    Entry(int hash, K key, V value, Node<K,V> next) {
        super(hash, key, value, next);
    }
}

HashMap()構(gòu)造方法

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

public HashMap(int initialCapacity, float loadFactor) {
    // 檢查傳入的初始容量是否合法
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    // 檢查裝載因子是否合法
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    // 計算擴(kuò)容門檻
    this.threshold = tableSizeFor(initialCapacity);
}

static final int tableSizeFor(int cap) {
    // 擴(kuò)容門檻為傳入的初始容量往上取最近的2的n次方
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

對n右移1位:001xx...xxx,再位或:011xx...xxx

對n右移2為:00011...xxx,再位或:01111...xxx

此時前面已經(jīng)有四個1了,再右移4位且位或可得8個1

同理,有8個1,右移8位肯定會讓后八位也為1。

綜上可得,該算法讓最高位的1后面的位全變?yōu)?。

最后再讓結(jié)果n+1,即得到了2的整數(shù)次冪的值了。

現(xiàn)在回來看看第一條語句:

int n = cap - 1;
  讓cap-1再賦值給n的目的是另找到的目標(biāo)值大于或等于原值。例如二進(jìn)制1000,十進(jìn)制數(shù)值為8。如果不對它減1而直接操作,將得到答案10000,即16。顯然不是結(jié)果。減1后二進(jìn)制為111,再進(jìn)行操作則會得到原來的數(shù)值1000,即8。

put(K key, V value)方法

public V put(K key, V value) {
    // 調(diào)用hash(key)計算出key的hash值
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    // 如果key為null,則hash值為0,否則調(diào)用key的hashCode()方法
    // 并讓高16位與整個hash異或,這樣做是為了使計算出的hash更分散
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K, V>[] tab;
    Node<K, V> p;
    int n, i;
    // 如果桶的數(shù)量為0,則初始化
    if ((tab = table) == null || (n = tab.length) == 0)
        // 調(diào)用resize()初始化
        n = (tab = resize()).length;
    // (n - 1) & hash 計算元素在哪個桶中
    // 如果這個桶中還沒有元素,則把這個元素放在桶中的第一個位置
    if ((p = tab[i = (n - 1) & hash]) == null)
        // 新建一個節(jié)點放在桶中
        tab[i] = newNode(hash, key, value, null);
    else {
        // 如果桶中已經(jīng)有元素存在了
        Node<K, V> e;
        K k;
        // 如果桶中第一個元素的key與待插入元素的key相同,保存到e中用于后續(xù)修改value值
        if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            // 如果第一個元素是樹節(jié)點,則調(diào)用樹節(jié)點的putTreeVal插入元素
            e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
        else {
            // 遍歷這個桶對應(yīng)的鏈表,binCount用于存儲鏈表中元素的個數(shù)
            for (int binCount = 0; ; ++binCount) {
                // 如果鏈表遍歷完了都沒有找到相同key的元素,說明該key對應(yīng)的元素不存在,則在鏈表最后插入一個新節(jié)點
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 如果插入新節(jié)點后鏈表長度大于8,則判斷是否需要樹化,因為第一個元素沒有加到binCount中,所以這里-1
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 如果待插入的key在鏈表中找到了,則退出循環(huán)
                if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // 如果找到了對應(yīng)key的元素
        if (e != null) { // existing mapping for key
            // 記錄下舊值
            V oldValue = e.value;
            // 判斷是否需要替換舊值
            if (!onlyIfAbsent || oldValue == null)
                // 替換舊值為新值
                e.value = value;
            // 在節(jié)點被訪問后做點什么事,在LinkedHashMap中用到
            afterNodeAccess(e);
            // 返回舊值
            return oldValue;
        }
    }
    // 到這里了說明沒有找到元素
    // 修改次數(shù)加1
    ++modCount;
    // 元素數(shù)量加1,判斷是否需要擴(kuò)容
    if (++size > threshold)
        // 擴(kuò)容
        resize();
    // 在節(jié)點插入后做點什么事,在LinkedHashMap中用到
    afterNodeInsertion(evict);
    // 沒找到元素返回null
    return null;
}

為什么這樣計算hash

我們知道上面代碼里的key.hashCode()函數(shù)調(diào)用的是key鍵值類型自帶的哈希函數(shù),返回int型散列值。都知道上面代碼里的key.hashCode()函數(shù)調(diào)用的是key鍵值類型自帶的哈希函數(shù),返回int型散列值。只要哈希函數(shù)映射得比較均勻松散,一般應(yīng)用是很難出現(xiàn)碰撞的。但問題是一個40億長度的數(shù)組,內(nèi)存是放不下的。HashMap擴(kuò)容之前的數(shù)組初始大小才16。所以這個散列值是不能直接拿來用的。用之前還要先做對數(shù)組的長度取模運(yùn)算,得到的余數(shù)才能用來訪問數(shù)組下標(biāo)。源碼中模運(yùn)算是在這個indexFor( )函數(shù)里完成的。

bucketIndex = indexFor(hash, table.length);

static int indexFor(int h, int length) {
        return h & (length-1);
}

順便說一下,這也正好解釋了為什么HashMap的數(shù)組長度要取2的整次冪,因為這樣(數(shù)組長度-1)正好相當(dāng)于一個“低位掩碼”?!芭c”操作的結(jié)果就是散列值的高位全部歸零,只保留低位值.因為這樣(數(shù)組長度-1)正好相當(dāng)于一個“低位掩碼”?!芭c”操作的結(jié)果就是散列值的高位全部歸零,只保留低位值。
只保留低位值,用來做數(shù)組下標(biāo)訪問。以初始長度16為例,16-1=15。2進(jìn)制表示是00000000 00000000 00001111。和某散列值做“與”操作如下,結(jié)果就是截取了最低的四位值。

        10100101 11000100 00100101
&   00000000 00000000 00001111
    00000000 00000000 00000101    //高位全部歸零,只保留末四位

但這時候問題就來了,這樣就算我的散列值分布再松散,要是只取最后幾位的話,碰撞也會很嚴(yán)重。但這時候問題就來了,這樣就算我的散列值分布再松散,要是只取最后幾位的話,碰撞也會很嚴(yán)重。這時候“擾動函數(shù)”的價值就體現(xiàn)出來了

image.png

右位移16位,正好是32bit的一半,自己的高半?yún)^(qū)和低半?yún)^(qū)做異或,就是為了混合原始哈希碼的高位和低位,以此來加大低位的隨機(jī)性。而且混合后的低位摻雜了高位的部分特征,這樣高位的信息也被變相保留下來。
舉個例子
我們創(chuàng)建一個hashmap,其entry數(shù)組為默認(rèn)大小16?,F(xiàn)在有一個key、value的pair需要存儲到hashmap里,該key的hashcode是0ABC0000(8個16進(jìn)制數(shù),共32位),如果不經(jīng)過hash函數(shù)處理這個hashcode,這個pair過會兒將會被存放在entry數(shù)組中下標(biāo)為0處。下標(biāo)=ABCD0000 & (16-1) = 0

然后我們又要存儲另外一個pair,其key的hashcode是0DEF0000,得到數(shù)組下標(biāo)依然是0。想必你已經(jīng)看出來了,這是個實現(xiàn)得很差的hash算法,因為hashcode的1位全集中在前16位了,導(dǎo)致算出來的數(shù)組下標(biāo)一直是0。于是,明明key相差很大的pair,卻存放在了同一個鏈表里,導(dǎo)致以后查詢起來比較慢。
hash函數(shù)的通過若干次的移位、異或操作,把hashcode的“1位”變得“松散”,比如,經(jīng)過hash函數(shù)處理后,0ABC0000變?yōu)锳02188B,0DEF0000變?yōu)镈2AFC70,他們的數(shù)組下標(biāo)不再是清一色的0了。

resize()方法

final Node<K, V>[] resize() {
    // 舊數(shù)組
    Node<K, V>[] oldTab = table;
    // 舊容量
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 舊擴(kuò)容門檻
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            // 如果舊容量達(dá)到了最大容量,則不再進(jìn)行擴(kuò)容
            threshold = Integer.MAX_VALUE;
            return oldTab;
        } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 如果舊容量的兩倍小于最大容量并且舊容量大于默認(rèn)初始容量(16),則容量擴(kuò)大為兩部,擴(kuò)容門檻也擴(kuò)大為兩倍
            newThr = oldThr << 1; // double threshold
    } else if (oldThr > 0) // initial capacity was placed in threshold
        // 使用非默認(rèn)構(gòu)造方法創(chuàng)建的map,第一次插入元素會走到這里
        // 如果舊容量為0且舊擴(kuò)容門檻大于0,則把新容量賦值為舊門檻
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        // 調(diào)用默認(rèn)構(gòu)造方法創(chuàng)建的map,第一次插入元素會走到這里
        // 如果舊容量舊擴(kuò)容門檻都是0,說明還未初始化過,則初始化容量為默認(rèn)容量,擴(kuò)容門檻為默認(rèn)容量*默認(rèn)裝載因子
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    if (newThr == 0) {
        // 如果新擴(kuò)容門檻為0,則計算為容量*裝載因子,但不能超過最大容量
        float ft = (float) newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
                (int) ft : Integer.MAX_VALUE);
    }
    // 賦值擴(kuò)容門檻為新門檻
    threshold = newThr;
    // 新建一個新容量的數(shù)組
    @SuppressWarnings({"rawtypes", "unchecked"})
    Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
    // 把桶賦值為新數(shù)組
    table = newTab;
    // 如果舊數(shù)組不為空,則搬移元素
    if (oldTab != null) {
        // 遍歷舊數(shù)組
        for (int j = 0; j < oldCap; ++j) {
            Node<K, V> e;
            // 如果桶中第一個元素不為空,賦值給e
            if ((e = oldTab[j]) != null) {
                // 清空舊桶,便于GC回收  
                oldTab[j] = null;
                // 如果這個桶中只有一個元素,則計算它在新桶中的位置并把它搬移到新桶中
                // 因為每次都擴(kuò)容兩倍,所以這里的第一個元素搬移到新桶的時候新桶肯定還沒有元素
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    // 如果第一個元素是樹節(jié)點,則把這顆樹打散成兩顆樹插入到新桶中去
                    ((TreeNode<K, V>) e).split(this, newTab, j, oldCap);
                else { // preserve order
                    // 如果這個鏈表不止一個元素且不是一顆樹
                    // 則分化成兩個鏈表插入到新的桶中去
                    // 比如,假如原來容量為4,3、7、11、15這四個元素都在三號桶中
                    // 現(xiàn)在擴(kuò)容到8,則3和11還是在三號桶,7和15要搬移到七號桶中去
                    // 也就是分化成了兩個鏈表
                    Node<K, V> loHead = null, loTail = null;
                    Node<K, V> hiHead = null, hiTail = null;
                    Node<K, V> next;
                    do {
                        next = e.next;
                        // (e.hash & oldCap) == 0的元素放在低位鏈表中
                        // 比如,3 & 4 == 0
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        } else {
                            // (e.hash & oldCap) != 0的元素放在高位鏈表中
                            // 比如,7 & 4 != 0
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 遍歷完成分化成兩個鏈表了
                    // 低位鏈表在新桶中的位置與舊桶一樣(即3和11還在三號桶中)
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 高位鏈表在新桶中的位置正好是原來的位置加上舊容量(即7和15搬移到七號桶了)
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}
(1)如果使用是默認(rèn)構(gòu)造方法,則第一次插入元素時初始化為默認(rèn)值,容量為16,擴(kuò)容門檻為12;

(2)如果使用的是非默認(rèn)構(gòu)造方法,則第一次插入元素時初始化容量等于擴(kuò)容門檻,擴(kuò)容門檻在構(gòu)造方法里等于傳入容量向上最近的2的n次方;

(3)如果舊容量大于0,則新容量等于舊容量的2倍,但不超過最大容量2的30次方,新擴(kuò)容門檻為舊擴(kuò)容門檻的2倍;

(4)創(chuàng)建一個新容量的桶;

(5)搬移元素,原鏈表分化成兩個鏈表,低位鏈表存儲在原來桶的位置,高位鏈表搬移到原來桶的位置加舊容量的位置;

擴(kuò)容容量都是原來的兩倍,所以紅黑樹和鏈表都是一分為2!

TreeNode.putTreeVal(...)方法

final TreeNode<K, V> putTreeVal(HashMap<K, V> map, Node<K, V>[] tab,
                                int h, K k, V v) {
    Class<?> kc = null;
    // 標(biāo)記是否找到這個key的節(jié)點
    boolean searched = false;
    // 找到樹的根節(jié)點
    TreeNode<K, V> root = (parent != null) ? root() : this;
    // 從樹的根節(jié)點開始遍歷
    for (TreeNode<K, V> p = root; ; ) {
        // dir=direction,標(biāo)記是在左邊還是右邊
        // ph=p.hash,當(dāng)前節(jié)點的hash值
        int dir, ph;
        // pk=p.key,當(dāng)前節(jié)點的key值
        K pk;
        if ((ph = p.hash) > h) {
            // 當(dāng)前hash比目標(biāo)hash大,說明在左邊
            dir = -1;
        }
        else if (ph < h)
            // 當(dāng)前hash比目標(biāo)hash小,說明在右邊
            dir = 1;
        else if ((pk = p.key) == k || (k != null && k.equals(pk)))
            // 兩者h(yuǎn)ash相同且key相等,說明找到了節(jié)點,直接返回該節(jié)點
            // 回到putVal()中判斷是否需要修改其value值
            return p;
        else if ((kc == null &&
                // 如果k是Comparable的子類則返回其真實的類,否則返回null
                (kc = comparableClassFor(k)) == null) ||
                // 如果k和pk不是同樣的類型則返回0,否則返回兩者比較的結(jié)果
                (dir = compareComparables(kc, k, pk)) == 0) {
            // 這個條件表示兩者h(yuǎn)ash相同但是其中一個不是Comparable類型或者兩者類型不同
            // 比如key是Object類型,這時可以傳String也可以傳Integer,兩者h(yuǎn)ash值可能相同
            // 在紅黑樹中把同樣hash值的元素存儲在同一顆子樹,這里相當(dāng)于找到了這顆子樹的頂點
            // 從這個頂點分別遍歷其左右子樹去尋找有沒有跟待插入的key相同的元素
            if (!searched) {
                TreeNode<K, V> q, ch;
                searched = true;
                // 遍歷左右子樹找到了直接返回
                if (((ch = p.left) != null &&
                        (q = ch.find(h, k, kc)) != null) ||
                        ((ch = p.right) != null &&
                                (q = ch.find(h, k, kc)) != null))
                    return q;
            }
            // 如果兩者類型相同,再根據(jù)它們的內(nèi)存地址計算hash值進(jìn)行比較
            dir = tieBreakOrder(k, pk);
        }

        TreeNode<K, V> xp = p;
        if ((p = (dir <= 0) ? p.left : p.right) == null) {
            // 如果最后確實沒找到對應(yīng)key的元素,則新建一個節(jié)點
            Node<K, V> xpn = xp.next;
            TreeNode<K, V> x = map.newTreeNode(h, k, v, xpn);
            if (dir <= 0)
                xp.left = x;
            else
                xp.right = x;
            xp.next = x;
            x.parent = x.prev = xp;
            if (xpn != null)
                ((TreeNode<K, V>) xpn).prev = x;
            // 插入樹節(jié)點后平衡
            // 把root節(jié)點移動到鏈表的第一個節(jié)點
            moveRootToFront(tab, balanceInsertion(root, x));
            return null;
        }
    }
}
(1)尋找根節(jié)點;

(2)從根節(jié)點開始查找;

(3)比較hash值及key值,如果都相同,直接返回,在putVal()方法中決定是否要替換value值;

(4)根據(jù)hash值及key值確定在樹的左子樹還是右子樹查找,找到了直接返回;

(5)如果最后沒有找到則在樹的相應(yīng)位置插入元素,并做平衡;

treeifyBin()方法
如果插入元素后鏈表的長度大于等于8則判斷是否需要樹化。

final void treeifyBin(Node<K, V>[] tab, int hash) {
    int n, index;
    Node<K, V> e;
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
        // 如果桶數(shù)量小于64,直接擴(kuò)容而不用樹化
        // 因為擴(kuò)容之后,鏈表會分化成兩個鏈表,達(dá)到減少元素的作用
        // 當(dāng)然也不一定,比如容量為4,里面存的全是除以4余數(shù)等于3的元素
        // 這樣即使擴(kuò)容也無法減少鏈表的長度
        resize();
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        TreeNode<K, V> hd = null, tl = null;
        // 把所有節(jié)點換成樹節(jié)點
        do {
            TreeNode<K, V> p = replacementTreeNode(e, null);
            if (tl == null)
                hd = p;
            else {
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        // 如果進(jìn)入過上面的循環(huán),則從頭節(jié)點開始樹化
        if ((tab[index] = hd) != null)
            hd.treeify(tab);
    }
}

TreeNode.treeify()方法
真正樹化的方法。

final void treeify(Node<K, V>[] tab) {
    TreeNode<K, V> root = null;
    for (TreeNode<K, V> x = this, next; x != null; x = next) {
        next = (TreeNode<K, V>) x.next;
        x.left = x.right = null;
        // 第一個元素作為根節(jié)點且為黑節(jié)點,其它元素依次插入到樹中再做平衡
        if (root == null) {
            x.parent = null;
            x.red = false;
            root = x;
        } else {
            K k = x.key;
            int h = x.hash;
            Class<?> kc = null;
            // 從根節(jié)點查找元素插入的位置
            for (TreeNode<K, V> p = root; ; ) {
                int dir, ph;
                K pk = p.key;
                if ((ph = p.hash) > h)
                    dir = -1;
                else if (ph < h)
                    dir = 1;
                else if ((kc == null &&
                        (kc = comparableClassFor(k)) == null) ||
                        (dir = compareComparables(kc, k, pk)) == 0)
                    dir = tieBreakOrder(k, pk);

                // 如果最后沒找到元素,則插入
                TreeNode<K, V> xp = p;
                if ((p = (dir <= 0) ? p.left : p.right) == null) {
                    x.parent = xp;
                    if (dir <= 0)
                        xp.left = x;
                    else
                        xp.right = x;
                    // 插入后平衡,默認(rèn)插入的是紅節(jié)點,在balanceInsertion()方法里
                    root = balanceInsertion(root, x);
                    break;
                }
            }
        }
    }
    // 把根節(jié)點移動到鏈表的頭節(jié)點,因為經(jīng)過平衡之后原來的第一個元素不一定是根節(jié)點了
    moveRootToFront(tab, root);
}
(1)從鏈表的第一個元素開始遍歷;

(2)將第一個元素作為根節(jié)點;

(3)其它元素依次插入到紅黑樹中,再做平衡;

(4)將根節(jié)點移到鏈表第一元素的位置(因為平衡的時候根節(jié)點會改變);

get(Object key)方法

public V get(Object key) {
    Node<K, V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K, V> getNode(int hash, Object key) {
    Node<K, V>[] tab;
    Node<K, V> first, e;
    int n;
    K k;
    // 如果桶的數(shù)量大于0并且待查找的key所在的桶的第一個元素不為空
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
        // 檢查第一個元素是不是要查的元素,如果是直接返回
        if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            // 如果第一個元素是樹節(jié)點,則按樹的方式查找
            if (first instanceof TreeNode)
                return ((TreeNode<K, V>) first).getTreeNode(hash, key);

            // 否則就遍歷整個鏈表查找該元素
            do {
                if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}
  (1)計算key的hash值;

(2)找到key所在的桶及其第一個元素;

(3)如果第一個元素的key等于待查找的key,直接返回;

(4)如果第一個元素是樹節(jié)點就按樹的方式來查找,否則按鏈表方式查找;

TreeNode.getTreeNode(int h, Object k)方法

final TreeNode<K, V> getTreeNode(int h, Object k) {
    // 從樹的根節(jié)點開始查找
    return ((parent != null) ? root() : this).find(h, k, null);
}

final TreeNode<K, V> find(int h, Object k, Class<?> kc) {
    TreeNode<K, V> p = this;
    do {
        int ph, dir;
        K pk;
        TreeNode<K, V> pl = p.left, pr = p.right, q;
        if ((ph = p.hash) > h)
            // 左子樹
            p = pl;
        else if (ph < h)
            // 右子樹
            p = pr;
        else if ((pk = p.key) == k || (k != null && k.equals(pk)))
            // 找到了直接返回
            return p;
        else if (pl == null)
            // hash相同但key不同,左子樹為空查右子樹
            p = pr;
        else if (pr == null)
            // 右子樹為空查左子樹
            p = pl;
        else if ((kc != null ||
                (kc = comparableClassFor(k)) != null) &&
                (dir = compareComparables(kc, k, pk)) != 0)
            // 通過compare方法比較key值的大小決定使用左子樹還是右子樹
            p = (dir < 0) ? pl : pr;
        else if ((q = pr.find(h, k, kc)) != null)
            // 如果以上條件都不通過,則嘗試在右子樹查找
            return q;
        else
            // 都沒找到就在左子樹查找
            p = pl;
    } while (p != null);
    return null;
}

經(jīng)典二叉查找樹的查找過程,先根據(jù)hash值比較,再根據(jù)key值比較決定是查左子樹還是右子樹。

remove(Object key)方法

public V remove(Object key) {
    Node<K, V> e;
    return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
}

final Node<K, V> removeNode(int hash, Object key, Object value,
                            boolean matchValue, boolean movable) {
    Node<K, V>[] tab;
    Node<K, V> p;
    int n, index;
    // 如果桶的數(shù)量大于0且待刪除的元素所在的桶的第一個元素不為空
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (p = tab[index = (n - 1) & hash]) != null) {
        Node<K, V> node = null, e;
        K k;
        V v;
        if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
            // 如果第一個元素正好就是要找的元素,賦值給node變量后續(xù)刪除使用
            node = p;
        else if ((e = p.next) != null) {
            if (p instanceof TreeNode)
                // 如果第一個元素是樹節(jié)點,則以樹的方式查找節(jié)點
                node = ((TreeNode<K, V>) p).getTreeNode(hash, key);
            else {
                // 否則遍歷整個鏈表查找元素
                do {
                    if (e.hash == hash &&
                            ((k = e.key) == key ||
                                    (key != null && key.equals(k)))) {
                        node = e;
                        break;
                    }
                    p = e;
                } while ((e = e.next) != null);
            }
        }
        // 如果找到了元素,則看參數(shù)是否需要匹配value值,如果不需要匹配直接刪除,如果需要匹配則看value值是否與傳入的value相等
        if (node != null && (!matchValue || (v = node.value) == value ||
                (value != null && value.equals(v)))) {
            if (node instanceof TreeNode)
                // 如果是樹節(jié)點,調(diào)用樹的刪除方法(以node調(diào)用的,是刪除自己)
                ((TreeNode<K, V>) node).removeTreeNode(this, tab, movable);
            else if (node == p)
                // 如果待刪除的元素是第一個元素,則把第二個元素移到第一的位置
                tab[index] = node.next;
            else
                // 否則刪除node節(jié)點
                p.next = node.next;
            ++modCount;
            --size;
            // 刪除節(jié)點后置處理
            afterNodeRemoval(node);
            return node;
        }
    }
    return null;
}
(1)先查找元素所在的節(jié)點;

(2)如果找到的節(jié)點是樹節(jié)點,則按樹的移除節(jié)點處理;

(3)如果找到的節(jié)點是桶中的第一個節(jié)點,則把第二個節(jié)點移到第一的位置;

(4)否則按鏈表刪除節(jié)點處理;

(5)修改size,調(diào)用移除節(jié)點后置處理等;

總結(jié)

(1)HashMap是一種散列表,采用(數(shù)組 + 鏈表 + 紅黑樹)的存儲結(jié)構(gòu);

(2)HashMap的默認(rèn)初始容量為16(1<<4),默認(rèn)裝載因子為0.75f,容量總是2的n次方;

(3)HashMap擴(kuò)容時每次容量變?yōu)樵瓉淼膬杀叮?
(4)當(dāng)桶的數(shù)量小于64時不會進(jìn)行樹化,只會擴(kuò)容;

(5)當(dāng)桶的數(shù)量大于64且單個桶中元素的數(shù)量大于8時,進(jìn)行樹化;

(6)當(dāng)單個桶中元素數(shù)量小于6時,進(jìn)行反樹化;

(7)HashMap是非線程安全的容器;

以上是java8 hashmap的實現(xiàn),相對jdk1.7主要是加入了紅黑樹,紅黑樹的數(shù)據(jù)結(jié)構(gòu)相對復(fù)雜,這里為了簡單期間,我們回顧下hashmap1.7版本的實現(xiàn):

HashMap實現(xiàn)了Map接口,繼承AbstractMap。其中Map接口定義了鍵映射到值的規(guī)則,而AbstractMap類提供 Map 接口的骨干實現(xiàn),以最大限度地減少實現(xiàn)此接口所需的工作,其實AbstractMap類已經(jīng)實現(xiàn)了Map

public class HashMap<K,V>
    extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable

HashMap提供了三個構(gòu)造函數(shù):

HashMap():構(gòu)造一個具有默認(rèn)初始容量 (16) 和默認(rèn)加載因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity):構(gòu)造一個帶指定初始容量和默認(rèn)加載因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity, float loadFactor):構(gòu)造一個帶指定初始容量和加載因子的空 HashMap。

在這里提到了兩個參數(shù):初始容量,加載因子。這兩個參數(shù)是影響HashMap性能的重要參數(shù),其中容量表示哈希表中桶的數(shù)量,初始容量是創(chuàng)建哈希表時的容量,加載因子是哈希表在其容量自動增加之前可以達(dá)到多滿的一種尺度,它衡量的是一個散列表的空間的使用程度,負(fù)載因子越大表示散列表的裝填程度越高,反之愈小。對于使用鏈表法的散列表來說,查找一個元素的平均時間是O(1+a),因此如果負(fù)載因子越大,對空間的利用更充分,然而后果是查找效率的降低;如果負(fù)載因子太小,那么散列表的數(shù)據(jù)將過于稀疏,對空間造成嚴(yán)重浪費。系統(tǒng)默認(rèn)負(fù)載因子為0.75,一般情況下我們是無需修改的。

數(shù)據(jù)結(jié)構(gòu)

HashMap是一種支持快速存取的數(shù)據(jù)結(jié)構(gòu),要了解它的性能必須要了解它的數(shù)據(jù)結(jié)構(gòu)。


image.png

從上圖我們可以看出HashMap底層實現(xiàn)還是數(shù)組,只是數(shù)組的每一項都是一條鏈。其中參數(shù)initialCapacity就代表了該數(shù)組的長度。下面為HashMap構(gòu)造函數(shù)的源碼:

public HashMap(int initialCapacity, float loadFactor) {
        //初始容量不能<0
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: "
                    + initialCapacity);
        //初始容量不能 > 最大容量值,HashMap的最大容量值為2^30
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        //負(fù)載因子不能 < 0
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: "
                    + loadFactor);

        // 計算出大于 initialCapacity 的最小的 2 的 n 次方值。
        int capacity = 1;
        while (capacity < initialCapacity)
            capacity <<= 1;

        this.loadFactor = loadFactor;
        //設(shè)置HashMap的容量極限,當(dāng)HashMap的容量達(dá)到該極限時就會進(jìn)行擴(kuò)容操作
        threshold = (int) (capacity * loadFactor);
        //初始化table數(shù)組
        table = new Entry[capacity];
        init();
    }

從源碼中可以看出,每次新建一個HashMap時,都會初始化一個table數(shù)組。table數(shù)組的元素為Entry節(jié)點。(java8并不會在構(gòu)造函數(shù)初始化table數(shù)組)

static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        final int hash;

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry<K,V> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
        .......
    }

其中Entry為HashMap的內(nèi)部類,它包含了鍵key、值value、下一個節(jié)點next,以及hash值,這是非常重要的,正是由于Entry才構(gòu)成了table數(shù)組的項為鏈表。

、存儲實現(xiàn):put(key,vlaue)

public V put(K key, V value) {
        //當(dāng)key為null,調(diào)用putForNullKey方法,保存null與table第一個位置中,這是HashMap允許為null的原因
        if (key == null)
            return putForNullKey(value);
        //計算key的hash值
        int hash = hash(key.hashCode());                  ------(1)
        //計算key hash 值在 table 數(shù)組中的位置
        int i = indexFor(hash, table.length);             ------(2)
        //從i出開始迭代 e,找到 key 保存的位置
        for (Entry<K, V> e = table[i]; e != null; e = e.next) {
            Object k;
            //判斷該條鏈上是否有hash值相同的(key相同)
            //若存在相同,則直接覆蓋value,返回舊value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;    //舊值 = 新值
                e.value = value;
                e.recordAccess(this);
                return oldValue;     //返回舊值
            }
        }
        //修改次數(shù)增加1
        modCount++;
        //將key、value添加至i位置處
        addEntry(hash, key, value, i);
        return null;
    }

通過源碼我們可以清晰看到HashMap保存數(shù)據(jù)的過程為:首先判斷key是否為null,若為null,則直接調(diào)用putForNullKey方法。若不為空則先計算key的hash值,然后根據(jù)hash值搜索在table數(shù)組中的索引位置,如果table數(shù)組在該位置處有元素,則通過比較是否存在相同的key,若存在則覆蓋原來key的value,否則將該元素保存在鏈頭(最先保存的元素放在鏈尾java8是后加入的放在鏈尾)。若table在該處沒有元素,則直接保存.

我們知道對于HashMap的table而言,數(shù)據(jù)分布需要均勻(最好每項都只有一個元素,這樣就可以直接找到),不能太緊也不能太松,太緊會導(dǎo)致查詢速度慢,太松則浪費空間。計算hash值后,怎么才能保證table元素分布均與呢?我們會想到取模,但是由于取模的消耗較大,HashMap是這樣處理的:調(diào)用indexFor方法。

static int indexFor(int h, int length) {
        return h & (length-1);
    }

HashMap的底層數(shù)組長度總是2的n次方,在構(gòu)造函數(shù)中存在:capacity <<= 1;這樣做總是能夠保證HashMap的底層數(shù)組長度為2的n次方。當(dāng)length為2的n次方時,h&(length – 1)就相當(dāng)于對length取模,而且速度比直接取??斓枚?,這是HashMap在速度上的一個優(yōu)化。

h&(length – 1),這句話除了上面的取模運(yùn)算外還有一個非常重要的責(zé)任:均勻分布table數(shù)據(jù)和充分利用空間。

這里我們假設(shè)length為16(2^n)和15,h為5、6、7。


image.png

當(dāng)n=15時,6和7的結(jié)果一樣,這樣表示他們在table存儲的位置是相同的,也就是產(chǎn)生了碰撞,6、7就會在一個位置形成鏈表,這樣就會導(dǎo)致查詢速度降低。誠然這里只分析三個數(shù)字不是很多,那么我們就看0-15。

image.png

從上面的圖表中我們看到總共發(fā)生了8此碰撞,同時發(fā)現(xiàn)浪費的空間非常大,有1、3、5、7、9、11、13、15處沒有記錄,也就是沒有存放數(shù)據(jù)。這是因為他們在與14進(jìn)行&運(yùn)算時,得到的結(jié)果最后一位永遠(yuǎn)都是0,即0001、0011、0101、0111、1001、1011、1101、1111位置處是不可能存儲數(shù)據(jù)的,空間減少,進(jìn)一步增加碰撞幾率,這樣就會導(dǎo)致查詢速度慢。而當(dāng)length = 16時,length – 1 = 15 即1111,那么進(jìn)行低位&運(yùn)算時,值總是與原來hash值相同,而進(jìn)行高位運(yùn)算時,其值等于其低位值。所以說當(dāng)length = 2^n時,不同的hash值發(fā)生碰撞的概率比較小,這樣就會使得數(shù)據(jù)在table數(shù)組中分布較均勻,查詢速度也較快。

我們再來復(fù)習(xí)put的流程:當(dāng)我們想一個HashMap中添加一對key-value時,系統(tǒng)首先會計算key的hash值,然后根據(jù)hash值確認(rèn)在table中存儲的位置。若該位置沒有元素,則直接插入。否則迭代該處元素鏈表并依此比較其key的hash值。如果兩個hash值相等且key值相等(e.hash == hash && ((k = e.key) == key || key.equals(k))),則用新的Entry的value覆蓋原來節(jié)點的value。如果兩個hash值相等但key值不等 ,則將該節(jié)點插入該鏈表的鏈頭。具體的實現(xiàn)過程見addEntry方法

void addEntry(int hash, K key, V value, int bucketIndex) {
        //獲取bucketIndex處的Entry
        Entry<K, V> e = table[bucketIndex];
        //將新創(chuàng)建的 Entry 放入 bucketIndex 索引處,并讓新的 Entry 指向原來的 Entry
        table[bucketIndex] = new Entry<K, V>(hash, key, value, e);
        //若HashMap中元素的個數(shù)超過極限了,則容量擴(kuò)大兩倍
        if (size++ >= threshold)
            resize(2 * table.length);
    }

隨著HashMap中元素的數(shù)量越來越多,發(fā)生碰撞的概率就越來越大,所產(chǎn)生的鏈表長度就會越來越長,這樣勢必會影響HashMap的速度,為了保證HashMap的效率,系統(tǒng)必須要在某個臨界點進(jìn)行擴(kuò)容處理。該臨界點在當(dāng)HashMap中元素的數(shù)量等于table數(shù)組長度*加載因子。但是擴(kuò)容是一個非常耗時的過程,因為它需要重新計算這些數(shù)據(jù)在新table數(shù)組中的位置并進(jìn)行復(fù)制處理。所以如果我們已經(jīng)預(yù)知HashMap中元素的個數(shù),那么預(yù)設(shè)元素的個數(shù)能夠有效的提高HashMap的性能。

讀取實現(xiàn):get(key)

相對于HashMap的存而言,取就顯得比較簡單了。通過key的hash值找到在table數(shù)組中的索引處的Entry,然后返回該key對應(yīng)的value即可。

public V get(Object key) {
        // 若為null,調(diào)用getForNullKey方法返回相對應(yīng)的value
        if (key == null)
            return getForNullKey();
        // 根據(jù)該 key 的 hashCode 值計算它的 hash 碼  
        int hash = hash(key.hashCode());
        // 取出 table 數(shù)組中指定索引處的值
        for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
            Object k;
            //若搜索的key與查找的key相同,則返回相對應(yīng)的value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

HashMap在存儲過程中并沒有將key,value分開來存儲,而是當(dāng)做一個整體key-value來處理的,這個整體就是Entry對象。同時value也只相當(dāng)于key的附屬而已。在存儲的過程中,系統(tǒng)根據(jù)key的hashcode來決定Entry在table數(shù)組中的存儲位置,在取的過程中同樣根據(jù)key的hashcode取出相對應(yīng)的Entry對象。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 一、HashMap概述 HashMap基于哈希表的Map接口的實現(xiàn)。此實現(xiàn)提供所有可選的映射操作,并允許使用nul...
    小陳阿飛閱讀 674評論 0 2
  • HashMap HashMap概述 HashMap基于哈希表的 Map 接口的實現(xiàn)。此實現(xiàn)提供所有可選的映射操作,...
    史路比閱讀 323評論 0 6
  • public class HashMap extends AbstractMap implements Map, ...
    阿桃_28e7閱讀 340評論 0 0
  • 移步數(shù)據(jù)結(jié)構(gòu)--容器匯總(java & Android)由于 HashMap 底層涉及到太多方面,一篇文章總是不能...
    凱玲之戀閱讀 864評論 0 5
  • 最近一直特別忙,好不容易閑下來了。準(zhǔn)備把HashMap的知識總結(jié)一下,很久以前看過HashMap源碼。一直想把集...
    鵬_鵬閱讀 584評論 0 3

友情鏈接更多精彩內(nèi)容