HashMap解析

來源聲明:本文是整理微信公眾號(hào)[程序員小灰]的漫畫系列文章

什么是HashMap

HashMap是一個(gè)用于存儲(chǔ)Key-Value鍵值對(duì)的集合,每一個(gè)鍵值對(duì)也叫做Entry。這些鍵值對(duì)(Entry)分散存儲(chǔ)在一個(gè)數(shù)組中,這個(gè)數(shù)組就是HashMap的主干。

HashMap數(shù)組每一個(gè)元素的初始值都是Null。

image.png

對(duì)于HashMap,我們最常使用的是兩個(gè)方法:Get和Put。

1.Put方法的原理

例如,調(diào)用hashMap.put("apple", 0),插入一個(gè)Key為“apple”的元素。這時(shí)候我們需要利用一個(gè)哈希函數(shù)來確定Entry的插入位置(index):

index = Hash("apple")

假定最后計(jì)算出的index是2,那么結(jié)果如下:

image.png

但是,因?yàn)镠ashMap的長度是有限的,當(dāng)插入的Entry越來越多時(shí),再完美的Hash函數(shù)也難免會(huì)出現(xiàn)index沖突的情況。比如下面這樣:

image.png

這時(shí)候怎么辦呢?我們可以利用鏈表來解決。

HashMap數(shù)組的每一個(gè)元素不止是一個(gè)Entry對(duì)象,也是一個(gè)鏈表的頭結(jié)點(diǎn)。每一個(gè)Entry對(duì)象通過Next指針指向它打的下一個(gè)Entry節(jié)點(diǎn)。當(dāng)新來的Entry映射到?jīng)_突的數(shù)組位置時(shí),只需要插入到對(duì)應(yīng)的鏈表即可:

image.png

需要注意的是,新來的Entry節(jié)點(diǎn)插入鏈表時(shí),使用的是“頭插法”。之所以用“頭插法”,是因?yàn)镠ashMap的發(fā)明者認(rèn)為,后插入的Entry被查找的可能性更大。

2.Get方法的原理

使用Get方法根據(jù)Key來查找Value的時(shí)候,發(fā)生了什么呢?

首先會(huì)把輸入的Key做一次Hash映射,得到對(duì)應(yīng)的index:

index = Hash("apple")

由于剛才所說的Hash沖突,同一個(gè)位置有可能匹配到多個(gè)Entry,這時(shí)候就需要順著對(duì)應(yīng)鏈表的頭節(jié)點(diǎn),一個(gè)一個(gè)向下來查找。假設(shè)我們要查找的Key是“apple”:

image.png

第一步,我們查看的是頭節(jié)點(diǎn)Entry6,Entry6的Key是banana,顯然不是我們要找的結(jié)果。

第二步,我們查看的是Next節(jié)點(diǎn)Entry1,Entry1的Key是apple,正是我們要找的結(jié)果。

擴(kuò)展

1、Hashmap的初始長度?為什么這么定

HashMap的默認(rèn)初始長度是16,并且每次自動(dòng)擴(kuò)展或是手動(dòng)初始化時(shí),長度必須是2的冪。

之所以選擇16,是為了服務(wù)于從Key映射到index的Hash算法,實(shí)現(xiàn)一個(gè)盡量均勻分布的Hash函數(shù)。

上面提到,從Key映射到HashMap數(shù)組的對(duì)應(yīng)位置,會(huì)用到一個(gè)Hash函數(shù):

index = Hash("apple")

如何實(shí)現(xiàn)一個(gè)盡量均勻分布的Hash函數(shù)呢?我們通過利用Key的HashCode值來做某種運(yùn)算,HashMap的發(fā)明者采用了位運(yùn)算的方式。

如何進(jìn)行位運(yùn)算呢?有如下的公式(Length是HashMap的長度):

index = HashCode(Key) & (Length - 1)

舉例,以值為“book”的Key來演示整個(gè)過程:

1、計(jì)算book的hashcode,結(jié)果為十進(jìn)制的3029737,二進(jìn)制的101110001110101110 1001。

2、假定HashMap長度是默認(rèn)的16,計(jì)算Length-1的結(jié)果為十進(jìn)制的15,二進(jìn)制的1111。

3、把以上兩個(gè)結(jié)果做 與運(yùn)算,101110001110101110 1001 & 1111 = 1001,十進(jìn)制是9,所以 index=9。

可以說,Hash算法最終得到的index結(jié)果,完全取決于Key的HashCode值的最后幾位。

為什么HashMap初始長度采用16呢?我們可以對(duì)比長度是10的情況。

重復(fù)剛才的運(yùn)算步驟:

image.png

單獨(dú)看這個(gè)結(jié)果,表面上并沒有問題。我們?cè)賮韲L試一個(gè)新的HashCode 101110001110101110 1011:

image.png

我們?cè)贀Q一個(gè)HashCode 101110001110101110 1111試試:

image.png

對(duì)比結(jié)果可以看到,雖然HashCode的倒數(shù)第二位、第三位從0變成了1,但是運(yùn)算的結(jié)果都是1001。也就是說,當(dāng)HashMap長度為10的時(shí)候,有些index結(jié)果的出現(xiàn)幾率會(huì)更大,而有些index結(jié)果永遠(yuǎn)不會(huì)出現(xiàn)(比如0111)。

這樣,顯然不符合Hash算法均勻分布的原則。

反觀長度16或其他2的冪,Length-1的值是所有二進(jìn)制全為1,這種情況下,index的結(jié)果等同于HashCode后幾位的值。只要輸入的HashCode本身分布均勻,Hash算法的結(jié)果就是均勻的。

2、高并發(fā)下的HashMap

(1) Hashmap在插入元素過多的時(shí)候需要進(jìn)行Resize,Resize的條件是

HashMap.size >= Capacity * LoadFactor

其中,Capacity是HashMap的當(dāng)前長度,HashMap的長度是2的冪。
LoadFactor是HashMap負(fù)載因子,默認(rèn)值為0.75f。

(2) HaspMap的Resize包含兩個(gè)步驟:

一是擴(kuò)容。創(chuàng)建一個(gè)新的Entry空數(shù)組,長度是原數(shù)組的2倍。

二是ReHash,遍歷原Entry數(shù)組,把所有的Entry重新Hash到新數(shù)組。

需要注意的是,ReHash在并發(fā)的情況下可能形成鏈表環(huán)。

參考

漫畫:什么是HashMap?

漫畫:高并發(fā)下的HashMap

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 前言 上篇文章講解了JDK1.7中的HashMap源碼, 主要采用數(shù)組+鏈表來實(shí)現(xiàn), 根據(jù)元素的hash計(jì)算出來的...
    海之韻Baby閱讀 444評(píng)論 0 0
  • Java集合:HashMap源碼剖析 一、HashMap概述 二、HashMap的數(shù)據(jù)結(jié)構(gòu) 三、HashMap源碼...
    記住時(shí)光閱讀 775評(píng)論 2 1
  • HashMap 可以算是 Java 中最常用的幾個(gè)集合類之一。這一篇文章將在代碼層面上詳細(xì)解釋 HashMap 的...
    王聰帥閱讀 823評(píng)論 0 1
  • 我原來這么多毛??!自己卻是不肯承認(rèn)的。也絕不會(huì)去改的。 我愛睡覺。一到雙休,不管外面瓢潑大雨還是艷陽高照,拉上窗簾...
    碎碎妖閱讀 405評(píng)論 2 5
  • “叮!奴隸,本客棧有臨時(shí)任務(wù)需要你去完成!” “客棧我能說不去嗎?”王元?jiǎng)偘盐顼堊龊茫郎?zhǔn)備叫慕容秋端菜。 “...
    西土瓦大神閱讀 144評(píng)論 0 3

友情鏈接更多精彩內(nèi)容