ConcurrentHashMap源碼解析

本文分析的 ConcurrentHashMap 是基于 jdk1.8 的版本

JDK1.7 和 Jdk1.8 版本的變化
ConcurrentHashMap 和 HashMap 的實現(xiàn)原理是差不多的,但是因為 ConcurrentHashMap
需要支持并發(fā)操作,所以在實現(xiàn)上要比 hashmap 稍微復(fù)雜一些。
在 JDK1.7 的 實 現(xiàn) 上 , ConrruentHashMap 由一個個 Segment 組 成 , 簡 單 來 說 ,ConcurrentHashMap 是一個 Segment 數(shù)組,它通過繼承 ReentrantLock 來進(jìn)行加鎖,通過每次鎖住一個 segment 來保證每個 segment 內(nèi)的操作的線程安全性從而實現(xiàn)全局線程安全。
整個結(jié)構(gòu)圖如下


image.png

當(dāng)每個操作分布在不同的 segment 上的時候,默認(rèn)情況下,理論上可以同時支持 16 個線程的并發(fā)寫入。

相比于 1.7 版本,它做了兩個改進(jìn):

  1. 取消了 segment 分段設(shè)計,直接使用 Node 數(shù)組來保存數(shù)據(jù),并且采用 Node 數(shù)組元素作為鎖來實現(xiàn)每一行數(shù)據(jù)進(jìn)行加鎖來進(jìn)一步減少并發(fā)沖突的概率
  2. 將原本數(shù)組+單向鏈表的數(shù)據(jù)結(jié)構(gòu)變更為了數(shù)組+單向鏈表+紅黑樹的結(jié)構(gòu)。為什么要引入紅黑樹呢?在正常情況下,key hash 之后如果能夠很均勻的分散在數(shù)組中,那么 table 數(shù)組中的每個鏈表的長度主要為 0 或者 1.但是實際情況下,還是會存在一些鏈表長度過長的情況。如果還采用單向鏈表方式,那么查詢某個節(jié)點的時間復(fù)雜度就變?yōu)?O(n); 因此對于超過 8 的鏈表,JDK1.8 采用了紅黑樹的結(jié)構(gòu),那么查詢的時間復(fù)雜度就會降低到O(logN),可以提升查找的性能;


    image.png

這個結(jié)構(gòu)和 JDK1.8 版本中的 Hashmap 的實現(xiàn)結(jié)構(gòu)基本一致,但是為了保證線程安全性,oncurrentHashMap 的實現(xiàn)會稍微復(fù)雜一下。接下來我們從源碼層面來了解一下它的原理

下面會主要會分析put方法,并且按照四個階段去分析

  • 第一階段
    數(shù)組初始化方法 initTable()
    用來返回節(jié)點數(shù)組的指定位置的節(jié)點的原子操作的方法 tabAt()
  • 第二階段
    map的元素計數(shù)方法 addCount()
    擴(kuò)容和數(shù)據(jù)遷移方法 transfer()
  • 第三階段
    多線程并發(fā)協(xié)助擴(kuò)容方法 helpTransfer()
  • 第四階段
    分析被添加的節(jié)點的位置已經(jīng)存在節(jié)點的時候,做的一系列操作,如加入鏈表,或者覆蓋已有數(shù)據(jù)、或者超過節(jié)點8會轉(zhuǎn)換紅黑樹 treeifyBin()等操作

put 方法第一階段

 public V put(K key, V value) {
    return putVal(key, value, false);
 }
    final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode()); //計算 hash 值
        int binCount = 0; //用來記錄鏈表的長度
        for (Node<K, V>[] tab = table; ; ) { //這里其實就是自旋操作,當(dāng)出現(xiàn)線程競爭時不斷自旋
            Node<K, V> f;
            int n, i, fh;
            if (tab == null || (n = tab.length) == 0)//如果數(shù)組為空,則進(jìn)行數(shù)組初始化
                tab = initTable(); //初始化數(shù)組
                //通過 hash 值對應(yīng)的數(shù)組下標(biāo)得到第一個節(jié)點;
                //以 volatile 讀的方式來讀取 table 數(shù)組中的元素,保證每次拿到的數(shù)據(jù)都是最新的
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                //如果該下標(biāo)返回的節(jié)點為空,則直接通過 cas 將新的值封裝成 node 插入即可;
                //如果 cas 失敗,說明存在競爭,則進(jìn)入下一次循環(huán)
                if (casTabAt(tab, i, null,
                        new Node<K, V>(hash, key, value, null)))
                    break; // no lock when adding to empty bin
            }
            ...//先不看這些代碼
        }
        //將當(dāng)前 ConcurrentHashMap 的元素數(shù)量加 1,有可能觸發(fā) transfer 操作(擴(kuò)容)
        addCount(1L, binCount);
        return null;
    }

假如在上面這段代碼中存在兩個線程,在不加鎖的情況下:線程 A 成功執(zhí)行 casTabAt 操作后,隨后的線程 B 可以通過 tabAt 方法立刻看到 table[i]的改變。原因如下:線程 A 的casTabAt 操作,具有 volatile 讀寫相同的內(nèi)存語義,根據(jù) volatile 的 happens-before 規(guī)則:線程 A 的 casTabAt 操作,一定對線程 B 的 tabAt 操作可見(在下面的tabAt代碼分析中會解釋)

我們來看初始化數(shù)組 initTable方法

    private final Node<K, V>[] initTable() {
        Node<K, V>[] tab;
        int sc;
        while ((tab = table) == null || tab.length == 0) {
            if ((sc = sizeCtl) < 0)//被其他線程搶占了初始化的操作,則直接讓出自己的 CPU時間片
                Thread.yield(); // lost initialization race; just spin
            //通過 cas 操作,將 sizeCtl 替換為-1,標(biāo)識當(dāng)前線程搶占到了初始化資格
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if ((tab = table) == null || tab.length == 0) {
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;//默認(rèn)初始容量為16
                        @SuppressWarnings("unchecked")
                        //初始化數(shù)組,長度為 16,或者初始化在構(gòu)造 ConcurrentHashMap 的時候傳入的長度
                        Node<K, V>[] nt = (Node<K, V>[]) new Node<?, ?>[n];
                        table = tab = nt;//將這個數(shù)組賦值給 table
                        sc = n - (n >>> 2); //計算下次擴(kuò)容的大小,實際就是當(dāng)前容量的0.75倍,這里使用了右移來計算
                    }
                } finally {
                    sizeCtl = sc; //設(shè)置 sizeCtl 為 sc, 如果默認(rèn)是 16 的話,那么 sc=16*0.75=12
                }
                break;
            }
        }
        return tab;
    }

數(shù)組初始化方法,這個方法比較簡單,就是初始化一個合適大小的數(shù)組
sizeCtl 這個要單獨(dú)說一下,如果沒搞懂這個屬性的意義,可能會被搞暈,這個標(biāo)志是在 Node 數(shù)組初始化或者擴(kuò)容的時候的一個控制位標(biāo)識,負(fù)數(shù)代表正在進(jìn)行初始化或者擴(kuò)容操作 ,總共三種含義:

  • -1 代表正在初始化
  • -N 代表有 N-1 有二個線程正在進(jìn)行擴(kuò)容操作,這里不是簡單的理解成 n 個線程,sizeCtl 就是-N,這塊后續(xù)在講擴(kuò)容的時候會說明
  • 0 標(biāo)識 Node 數(shù)組還沒有被初始化,正數(shù)代表初始化或者下一次擴(kuò)容的大小

再回來看tabAt 方法

 @SuppressWarnings("unchecked")
    static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
        return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
    }

該方法獲取對象中offset偏移地址對應(yīng)的對象field的值。實際上這段代碼的含義等價于tab[i], 但是為什么不直接使用 tab[i]來計算呢?
getObjectVolatile,一旦看到 volatile 關(guān)鍵字,就表示可見性。因為對 volatile 寫操作happen-before 于 volatile 讀操作,因此其他線程對 table 的修改均(casTabAt 操作)對 get 讀取可見;
雖然 table 數(shù)組本身是增加了 volatile 屬性,但是“volatile 的數(shù)組只針對數(shù)組的引用具有volatile 的語義,而不是它的元素”。 所以如果有其他線程對這個數(shù)組的元素進(jìn)行寫操作,那么當(dāng)前線程來讀的時候不一定能讀到最新的值。
出于性能考慮,Doug Lea 直接通過 Unsafe 類來對 table 進(jìn)行操作。

put 方法第二階段

在putVal方法執(zhí)行完成以后,會通過addCount來增加ConcurrentHashMap中的元素個數(shù),并且還會可能觸發(fā)擴(kuò)容操作。這里會有兩個非常經(jīng)典的設(shè)計:

  1. 高并發(fā)下的擴(kuò)容
  2. 如何保證 addCount 的數(shù)據(jù)安全性以及性能
//將當(dāng)前 ConcurrentHashMap 的元素數(shù)量加 1,有可能觸發(fā) transfer 操作(擴(kuò)容)
 addCount(1L, binCount);
 return null;

在 putVal 最后調(diào)用 addCount 的時候,傳遞了兩個參數(shù),分別是 1 和 binCount(鏈表長度),看看 addCount 方法里面做了什么操作
x 表示這次需要在表中增加的元素個數(shù),check 參數(shù)表示是否需要進(jìn)行擴(kuò)容檢查,大于等于 0都需要進(jìn)行檢查

private final void addCount(long x, int check) {
        CounterCell[] as;
        long b, s;
        /* 判斷 counterCells 是否為空,
         *  1. 如果為空,就通過 cas 操作嘗試修改 baseCount 變量,對這個變量進(jìn)行原子累加操作
         *     (做這個操作的意義是:如果在沒有競爭的情況下,仍然采用 baseCount 來記錄元素個數(shù))
         *  2. 如果 cas 失敗說明存在競爭,這個時候不能再采用 baseCount 來累加,而是通過 CounterCell 來記錄
         */
        if ((as = counterCells) != null ||
                !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a;
            long v;
            int m;
            boolean uncontended = true;//是否沖突標(biāo)識,默認(rèn)為沒有沖突
            /* 這里有幾個判斷
             *   1. 計數(shù)表為空則直接調(diào)用 fullAddCount
             *   2. 從計數(shù)表中隨機(jī)取出一個數(shù)組的位置為空,直接調(diào)用 fullAddCount
             *   3. 通過 CAS 修改 CounterCell 隨機(jī)位置的值,如果修改失敗說明出現(xiàn)并發(fā)情況(這里又
             *      用到了一種巧妙的方法),調(diào)用 fullAndCount
             *      Random 在線程并發(fā)的時候會有性能問題以及可能會產(chǎn)生相同的隨機(jī)數(shù),
             *      ThreadLocalRandom.getProbe 可以解決這個問題,并且性能要比 Random 高
             */
            if (as == null || (m = as.length - 1) < 0 ||
                    (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                    !(uncontended =
                            U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);//執(zhí)行 fullAddCount 方法
                return;
            }
            if (check <= 1)//鏈表長度小于等于 1,不需要考慮擴(kuò)容
                return;
            s = sumCount();//統(tǒng)計 ConcurrentHashMap 元素個數(shù)
        }
        ...
    }

CounterCells 解釋

ConcurrentHashMap 是采用 CounterCell 數(shù)組來記錄元素個數(shù)的,像一般的集合記錄集合大小,直接定義一個 size 的成員變量即可,當(dāng)出現(xiàn)改變的時候只要更新這個變量就行。為什么ConcurrentHashMap 要用這種形式來處理呢?

問題還是處在并發(fā)上,ConcurrentHashMap 是并發(fā)集合,如果用一個成員變量來統(tǒng)計元素個數(shù)的話,為了保證并發(fā)情況下共享變量的的難全興,勢必會需要通過加鎖或者自旋來實現(xiàn),如果競爭比較激烈的情況下,size 的設(shè)置上會出現(xiàn)比較大的沖突反而影響了性能,所以在ConcurrentHashMap 采用了分片的方法來記錄大小,具體什么意思,我們來分析下

  private transient volatile int cellsBusy;// 標(biāo)識當(dāng)前 cell 數(shù)組是否在初始化或擴(kuò)容中的CAS 標(biāo)志位

    private transient volatile CounterCell[] counterCells;// counterCells 數(shù)組,總數(shù)值的分值分別存在每個 cell 中

    @sun.misc.Contended
    static final class CounterCell {
        volatile long value;

        CounterCell(long x) {
            value = x;
        }
    }

    //看到這段代碼就能夠明白了,CounterCell 數(shù)組的每個元素,都存儲一個元素個數(shù),
    //而實際我們調(diào)用size 方法就是通過這個循環(huán)累加來得到的
    //又是一個設(shè)計精華,大家可以借鑒; 有了這個前提,再會過去看 addCount 這個方法,就容易理解一些了
    final long sumCount() {
        CounterCell[] as = counterCells;
        CounterCell a;
        long sum = baseCount;
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }

我們繼續(xù)跟進(jìn)fullAddCount代碼分析
fullAddCount 主要是用來初始化 CounterCell,來記錄元素個數(shù),里面包含擴(kuò)容CounterCell,初始化等操作

 private final void fullAddCount(long x, boolean wasUncontended) {
        int h;
        //獲取當(dāng)前線程的 probe 的值,如果值為 0,則初始化當(dāng)前線程的 probe 的值,probe 就是隨機(jī)數(shù)
        if ((h = ThreadLocalRandom.getProbe()) == 0) {
            ThreadLocalRandom.localInit(); // force initialization
            h = ThreadLocalRandom.getProbe();
            wasUncontended = true; // 由于重新生成了 probe,未沖突標(biāo)志位設(shè)置為 true
        }
        boolean collide = false; // True if last slot nonempty
        for (; ; ) {//自旋
            CounterCell[] as;
            CounterCell a;
            int n;
            long v;
            //說明 counterCells 已經(jīng)被初始化過了,我們先跳過這個代碼,先看初始化代碼(在下面的else if中)
            if ((as = counterCells) != null && (n = as.length) > 0) {
                if ((a = as[(n - 1) & h]) == null) {// 通過該值與當(dāng)前線程 probe 求與,獲得 cells 的下標(biāo)元素,和 hash 表獲取索引是一樣的
                    if (cellsBusy == 0) { //cellsBusy=0 表示 counterCells 不在初始化或者擴(kuò)容狀態(tài)下
                        CounterCell r = new CounterCell(x); //構(gòu)造一個 CounterCell 的值, 傳入元素個數(shù)
                        if (cellsBusy == 0 &&//通過 cas 設(shè)置 cellsBusy 標(biāo)識,防止其他線程來 對 counterCells 并發(fā)處理
                                U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                            boolean created = false;
                            try { // Recheck under lock
                                CounterCell[] rs;
                                int m, j;
                                //將初始化的 r 對象的元素個數(shù)放在對應(yīng)下標(biāo)的位置
                                if ((rs = counterCells) != null &&
                                        (m = rs.length) > 0 &&
                                        rs[j = (m - 1) & h] == null) {
                                    rs[j] = r;
                                    created = true;
                                }
                            } finally {//恢復(fù)標(biāo)志位
                                cellsBusy = 0;
                            }
                            if (created)//創(chuàng)建成功,退出循環(huán)
                                break;
                            continue;//說明指定 cells 下標(biāo)位置的數(shù)據(jù)不為空,則進(jìn)行下一次循環(huán)
                        }
                    }
                    collide = false;
                }
                //說明在 addCount 方法中 cas 失敗了,并且獲取 probe 的值不為空
                else if (!wasUncontended) // CAS already known to fail
                    wasUncontended = true; //設(shè)置為未沖突標(biāo)識,進(jìn)入下一次自旋
                //由于指定下標(biāo)位置的 cell 值不為空,則直接通過 cas 進(jìn)行原子累加,如果成功,則直接退出
                else if (U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))//
                    break;
                //如果已經(jīng)有其他線程建立了新的 counterCells 或者 CounterCells 大于 CPU 核心數(shù)(很巧妙,線程的并發(fā)數(shù)不會超過 cpu 核心數(shù))
                else if (counterCells != as || n >= NCPU)
                    collide = false; //設(shè)置當(dāng)前線程的循環(huán)失敗不進(jìn)行擴(kuò)容
                else if (!collide)//恢復(fù) collide 狀態(tài),標(biāo)識下次循環(huán)會進(jìn)行擴(kuò)容
                    collide = true;
                //擴(kuò)容CounterCell,進(jìn)入這個步驟,說明 CounterCell 數(shù)組容量不夠,線程競爭較大,所以先設(shè)置一個標(biāo)識表示為正在擴(kuò)容
                else if (cellsBusy == 0 &&
                        U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                    try {
                        if (counterCells == as) {// Expand table unless stale
                            //擴(kuò)容一倍 2 變成 4,這個擴(kuò)容比較簡單
                            CounterCell[] rs = new CounterCell[n << 1];
                            for (int i = 0; i < n; ++i)
                                rs[i] = as[i];
                            counterCells = rs;
                        }
                    } finally {
                        cellsBusy = 0;//恢復(fù)標(biāo)識
                    }
                    collide = false;
                    continue;//繼續(xù)下一次自旋
                }
                h = ThreadLocalRandom.advanceProbe(h);//更新隨機(jī)數(shù)的值
            }
            //先看這里的初始化代碼,再回到上面看其他的if判斷
            // 初始化 CounterCells 數(shù)組
            //cellsBusy=0 表示沒有在做初始化,通過 cas 更新 cellsbusy 的值標(biāo)注當(dāng)前線程正在做初始化操作
            else if (cellsBusy == 0 && counterCells == as &&
                    U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                boolean init = false;
                try { // Initialize table
                    if (counterCells == as) {
                        CounterCell[] rs = new CounterCell[2]; //初始化容量為 2
                        rs[h & 1] = new CounterCell(x);//將 x 也就是元素的個數(shù)放在指定的數(shù)組下標(biāo)位置
                        counterCells = rs;//賦值給 counterCells
                        init = true;//設(shè)置初始化完成標(biāo)識
                    }
                } finally {
                    cellsBusy = 0;//恢復(fù)標(biāo)識
                }
                if (init)
                    break;
            }
            //競爭激烈,其它線程占據(jù) cell 數(shù)組,直接累加在 base 變量中
            else if (U.compareAndSwapLong(this, BASECOUNT, v = baseCount, v + x))
                break; // Fall back on using base
        }
    }

transfer 擴(kuò)容階段

我們從上面得知addCount干了2件事, 除了做增加ConcurrentHashMap中的元素個數(shù),還做了對數(shù)據(jù)的擴(kuò)容功能

  private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
           //增加ConcurrentHashMap中的元素個數(shù)邏輯
        }
        if (check >= 0) {
            //數(shù)據(jù)擴(kuò)容
        }
    }

判斷是否需要擴(kuò)容,也就是當(dāng)更新后的鍵值對總數(shù) baseCount >= 閾值 sizeCtl 時,進(jìn)行rehash,這里面會有兩個邏輯。

  1. 如果當(dāng)前正在處于擴(kuò)容階段,則當(dāng)前線程會加入并且協(xié)助擴(kuò)容
  2. 如果當(dāng)前沒有在擴(kuò)容,則直接觸發(fā)擴(kuò)容操作
      if (check >= 0) {//如果 binCount>=0,標(biāo)識需要檢查擴(kuò)容
            Node<K, V>[] tab, nt;
            int n, sc;
            //s 標(biāo)識集合大小,如果集合大小大于或等于擴(kuò)容閾值(默認(rèn)值的 0.75)
            //并且 table 不為空并且 table 的長度小于最大容量
            while (s >= (long) (sc = sizeCtl) && (tab = table) != null &&
                    (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);//這里是生成一個唯一的擴(kuò)容戳,等會下面會分析這個方法
                if (sc < 0) {//sc<0,也就是 sizeCtl<0,說明已經(jīng)有別的線程正在擴(kuò)容了

                    /* 這 5 個條件只要有一個條件為 true,說明當(dāng)前線程不能幫助進(jìn)行此次的擴(kuò)容, 直接跳出循環(huán)
                     *       sc >>> RESIZE_STAMP_SHIFT!=rs 表示比較高 RESIZE_STAMP_BITS 位生成戳和 rs 是否相等,相同
                             sc=rs+1 表示擴(kuò)容結(jié)束
                     *       sc==rs+MAX_RESIZERS 表示幫助線程線程已經(jīng)達(dá)到最大值了
                     *       nt=nextTable -> 表示擴(kuò)容已經(jīng)結(jié)束
                     *       transferIndex<=0 表示所有的 transfer 任務(wù)都被領(lǐng)取完了,沒有剩余的hash 桶來給自己自己好這個線程來做 transfer
                     */
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                            sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                            transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))//當(dāng)前線程嘗試幫助此次擴(kuò)容,如果成功,則調(diào)用 transfer
                        transfer(tab, nt);
                }
                // 如果當(dāng)前沒有在擴(kuò)容,那么 rs 肯定是一個正數(shù),通過 rs<<RESIZE_STAMP_SHIFT 將 sc 設(shè)置 為一個負(fù)數(shù),+2 表示有一個線程在執(zhí)行擴(kuò)容
                else if (U.compareAndSwapInt(this, SIZECTL, sc, (rs <<
                        RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();// 重新計數(shù),判斷是否需要開啟下一輪擴(kuò)容
            }
        }

resizeStamp

這塊邏輯要理解起來,也有一點復(fù)雜。
resizeStamp 用來生成一個和擴(kuò)容有關(guān)的擴(kuò)容戳,具體有什么作用呢?我們基于它的實現(xiàn)來做一個分析

static final int resizeStamp(int n) {
 return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}

Integer.numberOfLeadingZeros 這個方法是返回?zé)o符號整數(shù) n 最高位非 0 位前面的 0 的個
數(shù)
比如 10 的二進(jìn)制是 0000 0000 0000 0000 0000 0000 0000 1010
那么這個方法返回的值就是 28
根據(jù) resizeStamp 的運(yùn)算邏輯,我們來推演一下,假如 n=16,那么 resizeStamp(16)=32796
轉(zhuǎn)化為二進(jìn)制是
[0000 0000 0000 0000 1000 0000 0001 1100]
接著再來看,當(dāng)?shù)谝粋€線程嘗試進(jìn)行擴(kuò)容的時候,會執(zhí)行下面這段代碼

U.compareAndSwapInt(this, SIZECTL, sc, (rs << RESIZE_STAMP_SHIFT) + 2)

rs 左移 16 位,相當(dāng)于原本的二進(jìn)制低位變成了高位
1000 0000 0001 1100 0000 0000 0000 0000
然后再+2 = 1000 0000 0001 1100 0000 0000 0000 0000 + 10=
1000 0000 0001 1100 0000 0000 0000 0010

高 16 位代表擴(kuò)容的標(biāo)記、低 16 位代表并行擴(kuò)容的線程數(shù)


image.png

? 這樣來存儲有什么好處呢?

    1. 首先在 CHM 中是支持并發(fā)擴(kuò)容的,也就是說如果當(dāng)前的數(shù)組需要進(jìn)行擴(kuò)容操作,可以由多個線程來共同負(fù)責(zé),這塊后續(xù)會單獨(dú)講
    1. 可以保證每次擴(kuò)容都生成唯一的生成戳,每次新的擴(kuò)容,都有一個不同的 n,這個生成戳就是根據(jù) n 來計算出來的一個數(shù)字,n 不同,這個數(shù)字也不同

? 第一個線程嘗試擴(kuò)容的時候,為什么是+2
因為 1 表示初始化,2 表示一個線程在執(zhí)行擴(kuò)容,而且對 sizeCtl 的操作都是基于位運(yùn)算的,所以不會關(guān)心它本身的數(shù)值是多少,只關(guān)心它在二進(jìn)制上的數(shù)值,而 sc + 1 會在低 16 位上加 1。

transfer

擴(kuò)容是 ConcurrentHashMap 的精華之一,擴(kuò)容操作的核心在于數(shù)據(jù)的轉(zhuǎn)移,在單線程環(huán)境下數(shù)據(jù)的轉(zhuǎn)移很簡單,無非就是把舊數(shù)組中的數(shù)據(jù)遷移到新的數(shù)組。但是這在多線程環(huán)境下,在擴(kuò)容的時候其他線程也可能正在添加元素,這時又觸發(fā)了擴(kuò)容怎么辦?可能大家想到的第一個解決方案是加互斥鎖,把轉(zhuǎn)移過程鎖住,雖然是可行的解決方案,但是會帶來較大的性能開銷。因為互斥鎖會導(dǎo)致所有訪問臨界區(qū)的線程陷入到阻塞狀態(tài),持有鎖的線程耗時越長,其他競爭線程就會一直被阻塞,導(dǎo)致吞吐量較低。而且還可能導(dǎo)致死鎖。

而 ConcurrentHashMap 并沒有直接加鎖,而是采用 CAS 實現(xiàn)無鎖的并發(fā)同步策略,最精華
的部分是它可以利用多線程來進(jìn)行協(xié)同擴(kuò)容

簡單來說,它把 Node 數(shù)組當(dāng)作多個線程之間共享的任務(wù)隊列,然后通過維護(hù)一個指針來劃分每個線程鎖負(fù)責(zé)的區(qū)間,每個線程通過區(qū)間逆向遍歷來實現(xiàn)擴(kuò)容,一個已經(jīng)遷移完的bucket 會被替換一個 ForwardingNode 節(jié)點,標(biāo)記當(dāng)前 bucket 已經(jīng)被其他線程遷移完了。

接下來分析一下它的源碼實現(xiàn)
1、fwd:這個類是個標(biāo)識類,用于指向新表用的,其他線程遇到這個類會主動跳過這個類,因為這個類要么就是擴(kuò)容遷移正在進(jìn)行,要么就是已經(jīng)完成擴(kuò)容遷移,也就是這個類要保證線程安全,再進(jìn)行操作。
2、advance:這個變量是用于提示代碼是否進(jìn)行推進(jìn)處理,也就是當(dāng)前桶處理完,處理下一個桶的標(biāo)識
3、finishing:這個變量用于提示擴(kuò)容是否結(jié)束用的

 private final void transfer(Node<K, V>[] tab, Node<K, V>[] nextTab) {
        int n = tab.length, stride;
        //將 (n>>>3 相當(dāng)于 n/8) 然后除以 CPU 核心數(shù)。如果得到的結(jié)果小于 16,那么就使用 16
        // 這里的目的是讓每個 CPU 處理的桶一樣多,避免出現(xiàn)轉(zhuǎn)移任務(wù)不均勻的現(xiàn)象,如果桶較少的話,
        //默認(rèn)一個 CPU(一個線程)處理 16 個桶,也就是長度為 16 的時候,擴(kuò)容的時候只會有一個線程來擴(kuò)容
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        //nextTab 未初始化,nextTab 是用來擴(kuò)容的 node 數(shù)組
        if (nextTab == null) { // initiating
            try {
                @SuppressWarnings("unchecked")
                //新建一個 n<<1 原始 table 大小的 nextTab,也就是 32
                        Node<K, V>[] nt = (Node<K, V>[]) new Node<?, ?>[n << 1];
                nextTab = nt;//賦值給 nextTab
            } catch (Throwable ex) { // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE; //擴(kuò)容失敗,sizeCtl 使用 int 的最大值
                return;
            }
            nextTable = nextTab; //更新成員變量
            transferIndex = n;//更新轉(zhuǎn)移下標(biāo),表示轉(zhuǎn)移時的下標(biāo)
        }
        int nextn = nextTab.length;//新的 tab 的長度
        //創(chuàng)建一個 fwd 節(jié)點,表示一個正在被遷移的 Node,并且它的 hash 值為-1(MOVED),
        //也就是前面我們在講 putval 方法的時候,會有一個判斷 MOVED 的邏輯。它的作用是用來占位,
        //表示原數(shù)組中位置 i 處的節(jié)點完成遷移以后,就會在 i 位置設(shè)置一個 fwd 來告訴其他線程這個位置已經(jīng)處理過了
        ForwardingNode<K, V> fwd = new ForwardingNode<K, V>(nextTab);
        // 首次推進(jìn)為 true,如果等于 true,說明需要再次推進(jìn)一個下標(biāo)(i--),反之,如果是false,
        // 那么就不能推進(jìn)下標(biāo),需要將當(dāng)前的下標(biāo)處理完畢才能繼續(xù)推進(jìn)
        boolean advance = true;
        //判斷是否已經(jīng)擴(kuò)容完成,完成就 return,退出循環(huán)
        boolean finishing = false; // to ensure sweep before committing nextTab
        //通過 for 自循環(huán)處理每個槽位中的鏈表元素,默認(rèn) advace 為真,通過 CAS 設(shè)置
        //transferIndex 屬性值,并初始化 i 和 bound 值,i 指當(dāng)前處理的槽位序號,
        //bound 指需要處理的槽位邊界,先處理槽位 15 的節(jié)點;
        for (int i = 0, bound = 0; ; ) {
            // 這個循環(huán)使用 CAS 不斷嘗試為當(dāng)前線程分配任務(wù)
            // 直到分配成功或任務(wù)隊列已經(jīng)被全部分配完畢
            // 如果當(dāng)前線程已經(jīng)被分配過 bucket 區(qū)域
            // 那么會通過--i 指向下一個待處理 bucket 然后退出該循環(huán)
            Node<K, V> f;
            int fh;
            while (advance) {
                int nextIndex, nextBound;
                //--i 表示下一個待處理的 bucket,如果它>=bound,表示當(dāng)前線程已經(jīng)分配過bucket 區(qū)域
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {//表示所有 bucket 已經(jīng)被分配完畢
                    i = -1;
                    advance = false;
                }
                //通過 cas 來修改 TRANSFERINDEX,為當(dāng)前線程分配任務(wù),處理的節(jié)點區(qū)間為(nextBound,nextIndex)->(0,15)
                else if (U.compareAndSwapInt
                        (this, TRANSFERINDEX, nextIndex,
                                nextBound = (nextIndex > stride ?
                                        nextIndex - stride : 0))) {
                    bound = nextBound;//0
                    i = nextIndex - 1;//15
                    advance = false;
                }
            }
            //i<0 說明已經(jīng)遍歷完舊的數(shù)組,也就是當(dāng)前線程已經(jīng)處理完所有負(fù)責(zé)的 bucket
            if (i < 0 || i >= n || i + n >= nextn) {
                int sc;
                if (finishing) {//如果完成了擴(kuò)容
                    nextTable = null;//刪除成員變量
                    table = nextTab;//更新 table 數(shù)組
                    sizeCtl = (n << 1) - (n >>> 1);//更新閾值(32*0.75=24)
                    return;
                }
                // sizeCtl 在遷移前會設(shè)置為 (rs << RESIZE_STAMP_SHIFT) + 2
                // 然后,每增加一個線程參與遷移就會將 sizeCtl 加 1,
                // 這里使用 CAS 操作對 sizeCtl 的低 16 位進(jìn)行減 1,代表做完了屬于自己的任務(wù)
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                 /* 第一個擴(kuò)容的線程,執(zhí)行 transfer 方法之前,會設(shè)置 sizeCtl = (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2)
                    后續(xù)幫其擴(kuò)容的線程,執(zhí)行 transfer 方法之前,會設(shè)置 sizeCtl = sizeCtl+1
                    每一個退出 transfer 的方法的線程,退出之前,會設(shè)置 sizeCtl = sizeCtl-1
                    那么最后一個線程退出時:必然有
                    sc == (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2),即 (sc - 2) == resizeStamp(n) << RESIZE_STAMP_SHIFT
                    如果 sc - 2 不等于標(biāo)識符左移 16 位。如果他們相等了,說明沒有線程在幫助他們擴(kuò)容了。也就是說,擴(kuò)容結(jié)束了。
                    */
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    // 如果相等,擴(kuò)容結(jié)束了,更新 finising 變量
                    finishing = advance = true;
                    // 再次循環(huán)檢查一下整張表
                    i = n; // recheck before commit
                }
            }
            // 如果位置 i 處是空的,沒有任何節(jié)點,那么放入剛剛初始化的 ForwardingNode ”空節(jié)點“
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
                //表示該位置已經(jīng)完成了遷移,也就是如果線程 A 已經(jīng)處理過這個節(jié)點,那么線程 B 處理這個節(jié)點時,hash 值一定為 MOVED
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else{//這里是數(shù)據(jù)遷移的代碼,目前先省略,接下來會詳細(xì)分析
                synchronized (f) {//對數(shù)組該節(jié)點位置加鎖,開始處理數(shù)組該位置的遷移工作
                    if (tabAt(tab, i) == f) {
                          ...
                    }
                }
            }
        }
    }

ConcurrentHashMap 支持并發(fā)擴(kuò)容,實現(xiàn)方式是,把 Node 數(shù)組進(jìn)行拆分,讓每個線程處理自己的區(qū)域,假設(shè) table 數(shù)組總長度是 64,默認(rèn)情況下,那么每個線程可以分到 16 個 bucket。
然后每個線程處理的范圍,按照倒序來做遷移
通過 for 自循環(huán)處理每個槽位中的鏈表元素,默認(rèn) advace 為真,通過 CAS 設(shè)置 transferIndex屬性值,并初始化 i 和 bound 值,i 指當(dāng)前處理的槽位序號,bound 指需要處理的槽位邊界,先處理槽位 31 的節(jié)點; (bound,i) =(16,31) 從 31 的位置往前推動。


image.png

假設(shè)這個時候 ThreadA 在進(jìn)行 transfer,那么邏輯圖表示如下


image.png

在當(dāng)前假設(shè)條件下,槽位 15 中沒有節(jié)點,則通過 CAS 插入在第二步中初始化的ForwardingNode 節(jié)點,用于告訴其它線程該槽位已經(jīng)處理過了;


image.png

sizeCtl 擴(kuò)容退出機(jī)制

在擴(kuò)容操作 transfer 的第 2414 行,代碼如下

if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
   if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)

每存在一個線程執(zhí)行完擴(kuò)容操作,就通過 cas 執(zhí)行 sc-1。
接著判斷(sc-2) !=resizeStamp(n) << RESIZE_STAMP_SHIFT ; 如果相等,表示當(dāng)前為整個擴(kuò)容操作的 最后一個線程,那么意味著整個擴(kuò)容操作就結(jié)束了;如果不想等,說明還得繼續(xù)這么做的目的,一方面是防止不同擴(kuò)容之間出現(xiàn)相同的 sizeCtl,另外一方面,還可以避免sizeCtl 的 ABA 問題導(dǎo)致的擴(kuò)容重疊的情況

數(shù)據(jù)遷移階段的實現(xiàn)分析

通過分配好遷移的區(qū)間之后,開始對數(shù)據(jù)進(jìn)行遷移。

                 synchronized (f) {//對數(shù)組該節(jié)點位置加鎖,開始處理數(shù)組該位置的遷移工作
                    if (tabAt(tab, i) == f) {//再做一次校驗
                        Node<K, V> ln, hn;//ln 表示低位, hn 表示高位;接下來這段代碼的作用是把鏈表拆分成兩部分,0 在低位,1 在高位
                        if (fh >= 0) {//下面部分代碼原理點擊這里
                            int runBit = fh & n;
                            Node<K, V> lastRun = f;
                            //遍歷當(dāng)前 bucket 的鏈表,目的是盡量重用 Node 鏈表尾部的一部分
                            for (Node<K, V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) { //如果最后更新的 runBit 是 0,設(shè)置低位節(jié)點
                                ln = lastRun;
                                hn = null;
                            } else {//否則,設(shè)置高位節(jié)點
                                hn = lastRun;
                                ln = null;
                            }
                            //構(gòu)造高位以及低位的鏈表
                            for (Node<K, V> p = f; p != lastRun; p = p.next) {
                                int ph = p.hash;
                                K pk = p.key;
                                V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K, V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K, V>(ph, pk, pv, hn);
                            }
                            setTabAt(nextTab, i, ln);//將低位的鏈表放在 i 位置也就是不動
                            setTabAt(nextTab, i + n, hn);//將高位鏈表放在 i+n 位置
                            setTabAt(tab, i, fwd); // 把舊 table 的 hash 桶中放置轉(zhuǎn)發(fā)節(jié)點,表明此 hash 桶已經(jīng)被處理
                            advance = true;
                        }
                        //紅黑樹的擴(kuò)容部分暫時忽略
                    }
                }

高低位原理分析

ConcurrentHashMap 在做鏈表遷移時,會用高低位來實現(xiàn),這里有兩個問題要分析一下

  1. 如何實現(xiàn)高低位鏈表的區(qū)分
    假如我們有這樣一個隊列


    image.png

第 14 個槽位插入新節(jié)點之后,鏈表元素個數(shù)已經(jīng)達(dá)到了 8,且數(shù)組長度為 16,優(yōu)先通過擴(kuò)容來緩解鏈表過長的問題,擴(kuò)容這塊的圖解稍后再分析,先分析高低位擴(kuò)容的原理

假如當(dāng)前線程正在處理槽位為 14 的節(jié)點,它是一個鏈表結(jié)構(gòu),在代碼中,首先定義兩個變量節(jié)點 ln 和 hn,實際就是 lowNode 和 HighNode,分別保存 hash 值的第 x 位為 0 和不等于0 的節(jié)點

通過 fn&n 可以把這個鏈表中的元素分為兩類,A 類是 hash 值的第 X 位為 0,B 類是 hash 值的第 x 位為不等于 0(至于為什么要這么區(qū)分,稍后分析),并且通過 lastRun 記錄最后要處理的節(jié)點。最終要達(dá)到的目的是,A 類的鏈表保持位置不動,B 類的鏈表為 14+16(擴(kuò)容增加的長度)=30

我們把 14 槽位的鏈表單獨(dú)伶出來,我們用藍(lán)色表示 fn&n=0 的節(jié)點,假如鏈表的分類是這樣


image.png
        for (Node<K,V> p = f.next; p != null; p = p.next) {
            int b = p.hash & n;
            if (b != runBit) {
                runBit = b;
                lastRun = p;
            }
        }

通過上面這段代碼遍歷,會記錄 runBit 以及 lastRun,按照上面這個結(jié)構(gòu),那么 runBit 應(yīng)該是藍(lán)色節(jié)點,lastRun 應(yīng)該是第 6 個節(jié)點
接著,再通過這段代碼進(jìn)行遍歷,生成 ln 鏈以及 hn 鏈

        for (Node<K,V> p = f; p != lastRun; p = p.next) {
            int ph = p.hash; K pk = p.key; V pv = p.val;
            if ((ph & n) == 0)
                ln = new Node<K,V>(ph, pk, pv, ln);
            else
                hn = new Node<K,V>(ph, pk, pv, hn);
        }
image.png

接著,通過 CAS 操作,把 hn 鏈放在 i+n 也就是 14+16 的位置,ln 鏈保持原來的位置不動。
并且設(shè)置當(dāng)前節(jié)點為 fwd,表示已經(jīng)被當(dāng)前線程遷移完了

setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
setTabAt(tab, i, fwd);

遷移完成以后的數(shù)據(jù)分布如下


image.png

為什么要做高低位的劃分

要想了解這么設(shè)計的目的,我們需要從 ConcurrentHashMap 的根據(jù)下標(biāo)獲取對象的算法來看,在 putVal 方法中 1018 行


image.png

通過(n-1) & hash 來獲得在 table 中的數(shù)組下標(biāo)來獲取節(jié)點數(shù)據(jù),【&運(yùn)算是二進(jìn)制運(yùn)算符,1 & 1=1,其他都為 0】

假設(shè)我們的 table 長度是 16, 二進(jìn)制是【0001 0000】,減一以后的二進(jìn)制是 【0000 1111】
假如某個 key 的 hash 值=9,對應(yīng)的二進(jìn)制是【0000 1001】,那么按照(n-1) & hash 的算法
0000 1111 & 0000 1001 =0000 1001 , 運(yùn)算結(jié)果是 9
當(dāng)我們擴(kuò)容以后,16 變成了 32,那么(n-1)的二進(jìn)制是 【0001 1111】
仍然以 hash 值=9 的二進(jìn)制計算為例
0001 1111 & 0000 1001 =0000 1001 ,運(yùn)算結(jié)果仍然是 9

我們換一個數(shù)字,假如某個 key 的 hash 值是 20,對應(yīng)的二進(jìn)制是【0001 0100】,仍然按照(n-1) & hash 算法,分別在 16 為長度和 32 位長度下的計算結(jié)果
16 位: 0000 1111 & 0001 0100=0000 0100
32 位: 0001 1111 & 0001 0100 =0001 0100
從結(jié)果來看,同樣一個 hash 值,在擴(kuò)容前和擴(kuò)容之后,得到的下標(biāo)位置是不一樣的,這種情況當(dāng)然是不允許出現(xiàn)的,所以在擴(kuò)容的時候就需要考慮,而使用高低位的遷移方式,就是解決這個問題.
大家可以看到,16 位的結(jié)果到 32 位的結(jié)果,正好增加了 16.
比如 20 & 15=4 、20 & 31=20 ; 4-20 =16
比如 60 & 15=12 、60 & 31=28; 12-28=16
所以對于高位,直接增加擴(kuò)容的長度,當(dāng)下次 hash 獲取數(shù)組位置的時候,可以直接定位到對應(yīng)的位置。
這個地方又是一個很巧妙的設(shè)計,直接通過高低位分類以后,就使得不需要在每次擴(kuò)容的時候來重新計算 hash,極大提升了效率。

擴(kuò)容結(jié)束以后的退出機(jī)制

如果線程擴(kuò)容結(jié)束,那么需要退出,就會執(zhí)行 transfer 方法的如下代碼

           //i<0 說明已經(jīng)遍歷完舊的數(shù)組,也就是當(dāng)前線程已經(jīng)處理完所有負(fù)責(zé)的 bucket
            if (i < 0 || i >= n || i + n >= nextn) {
                int sc;
                if (finishing) {//如果完成了擴(kuò)容
                    nextTable = null;//刪除成員變量
                    table = nextTab;//更新 table 數(shù)組
                    sizeCtl = (n << 1) - (n >>> 1);//更新閾值(32*0.75=24)
                    return;
                }
                // sizeCtl 在遷移前會設(shè)置為 (rs << RESIZE_STAMP_SHIFT) + 2
                // 然后,每增加一個線程參與遷移就會將 sizeCtl 加 1,
                // 這里使用 CAS 操作對 sizeCtl 的低 16 位進(jìn)行減 1,代表做完了屬于自己的任務(wù)
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                 /* 第一個擴(kuò)容的線程,執(zhí)行 transfer 方法之前,會設(shè)置 sizeCtl = (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2)
                    后續(xù)幫其擴(kuò)容的線程,執(zhí)行 transfer 方法之前,會設(shè)置 sizeCtl = sizeCtl+1
                    每一個退出 transfer 的方法的線程,退出之前,會設(shè)置 sizeCtl = sizeCtl-1
                    那么最后一個線程退出時:必然有
                    sc == (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2),即 (sc - 2) == resizeStamp(n) << RESIZE_STAMP_SHIFT
                    如果 sc - 2 不等于標(biāo)識符左移 16 位。如果他們相等了,說明沒有線程在幫助他們擴(kuò)容了。也就是說,擴(kuò)容結(jié)束了。
                    */
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    // 如果相等,擴(kuò)容結(jié)束了,更新 finising 變量
                    finishing = advance = true;
                    // 再次循環(huán)檢查一下整張表
                    i = n; // recheck before commit
                }
            }

put 方法第三階段

如果對應(yīng)的節(jié)點存在,判斷這個節(jié)點的 hash 是不是等于 MOVED(-1),說明當(dāng)前節(jié)點是ForwardingNode 節(jié)點,
意味著有其他線程正在進(jìn)行擴(kuò)容,那么當(dāng)前現(xiàn)在直接幫助它進(jìn)行擴(kuò)容,因此調(diào)用 helpTransfer方法

else if ((fh = f.hash) == MOVED)
 tab = helpTransfer(tab, f);

helpTransfer

從名字上來看,代表當(dāng)前是去協(xié)助擴(kuò)容

       final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
            Node<K,V>[] nextTab; int sc;
            // 判斷此時是否仍然在執(zhí)行擴(kuò)容,nextTab=null 的時候說明擴(kuò)容已經(jīng)結(jié)束了
            if (tab != null && (f instanceof ForwardingNode) &&
                    (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
                int rs = resizeStamp(tab.length);//生成擴(kuò)容戳
                while (nextTab == nextTable && table == tab &&
                        (sc = sizeCtl) < 0) {//說明擴(kuò)容還未完成的情況下不斷循環(huán)來嘗試將當(dāng)前線程加入到擴(kuò)容操作中
                    //下面部分的整個代碼表示擴(kuò)容結(jié)束,直接退出循環(huán)
                    //transferIndex<=0 表示所有的 Node 都已經(jīng)分配了線程
                    //sc=rs+MAX_RESIZERS 表示擴(kuò)容線程數(shù)達(dá)到最大擴(kuò)容線程數(shù)
                    //sc >>> RESIZE_STAMP_SHIFT !=rs, 如果在同一輪擴(kuò)容中,那么 sc 無符號
                    //右移比較高位和 rs 的值,那么應(yīng)該是相等的。如果不相等,說明擴(kuò)容結(jié)束了
                    //sc==rs+1 表示擴(kuò)容結(jié)束
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                            sc == rs + MAX_RESIZERS || transferIndex <= 0)
                        break;//跳出循環(huán)
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {//在低 16 位上增加擴(kuò)容線程數(shù)
                        transfer(tab, nextTab);//幫助擴(kuò)容
                        break;
                    }
                }
                return nextTab;
            }
            return table;//返回新的數(shù)組
        }

put 方法第四階段

  final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (ConcurrentHashMap.Node<K, V>[] tab = table; ; ) {
            ConcurrentHashMap.Node<K, V> f;
            int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();//put 方法第一階段
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                        new ConcurrentHashMap.Node<K, V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            } else if ((fh = f.hash) == MOVED)//put 方法第三階段
                tab = helpTransfer(tab, f);
            else { //put 方法第四階段,進(jìn)入到這個分支,說明 f 是當(dāng)前 nodes 數(shù)組對應(yīng)位置節(jié)點的頭節(jié)點,并且不為空
                V oldVal = null;
                synchronized (f) { //給對應(yīng)的頭結(jié)點加鎖
                    if (tabAt(tab, i) == f) {//再次判斷對應(yīng)下標(biāo)位置是否為 f 節(jié)點
                        if (fh >= 0) { //頭結(jié)點的 hash 值大于 0,說明是鏈表
                            binCount = 1; //用來記錄鏈表的長度
                            for (Node<K, V> e = f; ; ++binCount) {//遍歷鏈表
                                K ek;
                                //如果發(fā)現(xiàn)相同的 key,則判斷是否需要進(jìn)行值的覆蓋
                                if (e.hash == hash &&
                                        ((ek = e.key) == key ||
                                                (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent) //默認(rèn)情況下,直接覆蓋舊的值
                                        e.val = value;
                                    break;
                                }
                                //一直遍歷到鏈表的最末端,直接把新的值加入到鏈表的最后面
                                Node<K, V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K, V>(hash, key,
                                            value, null);
                                    break;
                                }
                            }
                        }
                        //如果當(dāng)前的 f 節(jié)點是一顆紅黑樹
                        else if (f instanceof TreeBin) {
                            Node<K, V> p;
                            binCount = 2;
                            //則調(diào)用紅黑樹的插入方法插入新的值
                            if ((p = ((TreeBin<K, V>) f).putTreeVal(hash, key,
                                    value)) != null) {
                                oldVal = p.val; //同樣,如果值已經(jīng)存在,則直接替換
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {//說明上面在做鏈表操作
                    //如果鏈表長度已經(jīng)達(dá)到臨界值 8 就需要把鏈表轉(zhuǎn)換為樹結(jié)構(gòu)
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)//如果 val 是被替換的,則返回替換之前的值
                        return oldVal;
                    break;
                }
            }
            //put 方法第二階段
            addCount(1L, binCount);
            return null;
        }
    }

這個第四階段方法的主要作用是,如果被添加的節(jié)點的位置已經(jīng)存在節(jié)點的時候,需要以鏈表的方式加入到節(jié)點中
如果當(dāng)前節(jié)點已經(jīng)是一顆紅黑樹,那么就會按照紅黑樹的規(guī)則將當(dāng)前節(jié)點加入到紅黑樹中

               if (binCount != 0) {//說明上面在做鏈表操作
                    //如果鏈表長度已經(jīng)達(dá)到臨界值 8 就需要把鏈表轉(zhuǎn)換為樹結(jié)構(gòu)
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)//如果 val 是被替換的,則返回替換之前的值
                        return oldVal;
                    break;
                }

其中上面這段代碼是判斷鏈表的長度是否已經(jīng)達(dá)到臨界值 8. 如果達(dá)到了臨界值,這個時候會根據(jù)當(dāng)前數(shù)組的長度
來決定是擴(kuò)容還是將鏈表轉(zhuǎn)化為紅黑樹。也就是說如果當(dāng)前數(shù)組的長度小于 64,就會先擴(kuò)容。
否則,會把當(dāng)前鏈表轉(zhuǎn)化為紅黑樹

treeifyBin

在 putVal 的最后部分,有一個判斷,如果鏈表長度大于 8,那么就會觸發(fā)擴(kuò)容或者紅黑樹的轉(zhuǎn)化操作。

    private final void treeifyBin(Node<K,V>[] tab, int index) {
        Node<K,V> b; int n, sc;
        if (tab != null) {
            if ((n = tab.length) < MIN_TREEIFY_CAPACITY) //tab 的長度是不是小于 64,如果是,則執(zhí)行擴(kuò)容
            tryPresize(n << 1); 
            else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {//否則,將當(dāng)前鏈表轉(zhuǎn)化為紅黑樹結(jié)構(gòu)存儲
                synchronized (b) {// 將鏈表轉(zhuǎn)換成紅黑樹
                    if (tabAt(tab, index) == b) {
                        TreeNode<K,V> hd = null, tl = null;
                        for (Node<K,V> e = b; e != null; e = e.next) {
                            TreeNode<K,V> p =
                                    new TreeNode<K,V>(e.hash, e.key, e.val,
                                            null, null);
                            if ((p.prev = tl) == null)
                                hd = p;
                            else
                                tl.next = p;
                            tl = p;
                        }
                        setTabAt(tab, index, new TreeBin<K,V>(hd));
                    }
                }
            }
        }
    }

tryPresize

tryPresize 里面部分代碼和 addCount 的部分代碼類似,看起來會稍微簡單一些

 private final void tryPresize(int size) {
        //對 size 進(jìn) 行修復(fù) ,主 要目 的是防 止傳 入的 值不是 一個 2 次冪的 整數(shù) ,然 后通過tableSizeFor 來講入?yún)⑥D(zhuǎn)化為離該整數(shù)最近的 2 次冪
        int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
                tableSizeFor(size + (size >>> 1) + 1);
        int sc;
        while ((sc = sizeCtl) >= 0) {
            Node<K, V>[] tab = table;
            int n;
            //下面這段代碼和 initTable 是一樣的,如果 table 沒有初始化,則開始初始化
            if (tab == null || (n = tab.length) == 0) {
                n = (sc > c) ? sc : c;
                if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                    try {
                        if (table == tab) {
                            @SuppressWarnings("unchecked")
                            Node<K, V>[] nt = (Node<K, V>[]) new Node<?, ?>[n];
                            table = nt;
                            sc = n - (n >>> 2);//0.75
                        }
                    } finally {
                        sizeCtl = sc;
                    }
                }
            }
            else if (c <= sc || n >= MAXIMUM_CAPACITY)
                break;
            else if (tab == table) {//這段代碼和 addCount 后部分代碼是一樣的,做輔助擴(kuò)容操作
                int rs = resizeStamp(n);
                if (sc < 0) {
                    Node<K, V>[] nt;
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                            sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                            transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                } else if (U.compareAndSwapInt(this, SIZECTL, sc,
                        (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
            }
        }
    }

get方法

get方法畢竟簡單,就不詳細(xì)分析了

/*
     * 相比put方法,get就很單純了,支持并發(fā)操作,
     * 當(dāng)key為null的時候回拋出NullPointerException的異常
     * get操作通過首先計算key的hash值來確定該元素放在數(shù)組的哪個位置
     * 然后遍歷該位置的所有節(jié)點
     * 如果不存在的話返回null
     */
    public V get(Object key) {
        Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
        int h = spread(key.hashCode());
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {
            if ((eh = e.hash) == h) {
                if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                    return e.val;
            }
            else if (eh < 0)
                return (p = e.find(h, key)) != null ? p.val : null;
            while ((e = e.next) != null) {
                if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                    return e.val;
            }
        }
        return null;
    }

——學(xué)自咕泡學(xué)院

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容