HashMap采用key/value存儲結(jié)構(gòu),每個key對應(yīng)唯一的value,查詢和修改的速度都很快,能達(dá)到O(1)的平均時間復(fù)雜度。它是非線程安全的,且不保證元素存儲的順序;

HashMap繼承自AbstractMap,實現(xiàn)了Map接口,具有Map的所有功能。

在Java中,HashMap的實現(xiàn)采用了(數(shù)組 + 鏈表 + 紅黑樹)的復(fù)雜結(jié)構(gòu),數(shù)組的一個元素又稱作桶。
在添加元素時,會根據(jù)hash值算出元素在數(shù)組中的位置,如果該位置沒有元素,則直接把元素放置在此處,如果該位置有元素了,則把元素以鏈表的形式放置在鏈表的尾部。
當(dāng)一個鏈表的元素個數(shù)達(dá)到一定的數(shù)量(且數(shù)組的長度達(dá)到一定的長度)后,則把鏈表轉(zhuǎn)化為紅黑樹,從而提高效率。
數(shù)組的查詢效率為O(1),鏈表的查詢效率是O(k),紅黑樹的查詢效率是O(log k),k為桶中的元素個數(shù),所以當(dāng)元素數(shù)量非常多的時候,轉(zhuǎn)化為紅黑樹能極大地提高效率。
源碼
**
* 默認(rèn)的初始容量為16
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
/**
* 最大的容量為2的30次方
*/
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
* 默認(rèn)的裝載因子
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* 當(dāng)一個桶中的元素個數(shù)大于等于8時進(jìn)行樹化
*/
static final int TREEIFY_THRESHOLD = 8;
/**
* 當(dāng)一個桶中的元素個數(shù)小于等于6時把樹轉(zhuǎn)化為鏈表
*/
static final int UNTREEIFY_THRESHOLD = 6;
/**
* 當(dāng)桶的個數(shù)達(dá)到64的時候才進(jìn)行樹化
*/
static final int MIN_TREEIFY_CAPACITY = 64;
/**
* 數(shù)組,又叫作桶(bucket)
*/
transient Node<K,V>[] table;
/**
* 作為entrySet()的緩存
*/
transient Set<Map.Entry<K,V>> entrySet;
/**
* 元素的數(shù)量
*/
transient int size;
/**
* 修改次數(shù),用于在迭代的時候執(zhí)行快速失敗策略
*/
transient int modCount;
/**
* 當(dāng)桶的使用數(shù)量達(dá)到多少時進(jìn)行擴(kuò)容,threshold = capacity * loadFactor
*/
int threshold;
/**
* 裝載因子
*/
final float loadFactor;
Node內(nèi)部類
Node是一個典型的單鏈表節(jié)點,其中,hash用來存儲key計算得來的hash值。
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
}
TreeNode內(nèi)部類
TreeNode是一個典型的樹型節(jié)點,其中,prev是鏈表中的節(jié)點,用于在刪除元素的時候可以快速找到它的前置節(jié)點。
// 位于HashMap中
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K,V> parent; // red-black tree links
TreeNode<K,V> left;
TreeNode<K,V> right;
TreeNode<K,V> prev; // needed to unlink next upon deletion
boolean red;
}
// 位于LinkedHashMap中,典型的雙向鏈表節(jié)點
static class Entry<K,V> extends HashMap.Node<K,V> {
Entry<K,V> before, after;
Entry(int hash, K key, V value, Node<K,V> next) {
super(hash, key, value, next);
}
}
HashMap()構(gòu)造方法
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public HashMap(int initialCapacity, float loadFactor) {
// 檢查傳入的初始容量是否合法
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
// 檢查裝載因子是否合法
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
// 計算擴(kuò)容門檻
this.threshold = tableSizeFor(initialCapacity);
}
static final int tableSizeFor(int cap) {
// 擴(kuò)容門檻為傳入的初始容量往上取最近的2的n次方
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
對n右移1位:001xx...xxx,再位或:011xx...xxx
對n右移2為:00011...xxx,再位或:01111...xxx
此時前面已經(jīng)有四個1了,再右移4位且位或可得8個1
同理,有8個1,右移8位肯定會讓后八位也為1。
綜上可得,該算法讓最高位的1后面的位全變?yōu)?。
最后再讓結(jié)果n+1,即得到了2的整數(shù)次冪的值了。
現(xiàn)在回來看看第一條語句:
int n = cap - 1;
讓cap-1再賦值給n的目的是另找到的目標(biāo)值大于或等于原值。例如二進(jìn)制1000,十進(jìn)制數(shù)值為8。如果不對它減1而直接操作,將得到答案10000,即16。顯然不是結(jié)果。減1后二進(jìn)制為111,再進(jìn)行操作則會得到原來的數(shù)值1000,即8。
put(K key, V value)方法
public V put(K key, V value) {
// 調(diào)用hash(key)計算出key的hash值
return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
int h;
// 如果key為null,則hash值為0,否則調(diào)用key的hashCode()方法
// 并讓高16位與整個hash異或,這樣做是為了使計算出的hash更分散
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
// 如果桶的數(shù)量為0,則初始化
if ((tab = table) == null || (n = tab.length) == 0)
// 調(diào)用resize()初始化
n = (tab = resize()).length;
// (n - 1) & hash 計算元素在哪個桶中
// 如果這個桶中還沒有元素,則把這個元素放在桶中的第一個位置
if ((p = tab[i = (n - 1) & hash]) == null)
// 新建一個節(jié)點放在桶中
tab[i] = newNode(hash, key, value, null);
else {
// 如果桶中已經(jīng)有元素存在了
Node<K, V> e;
K k;
// 如果桶中第一個元素的key與待插入元素的key相同,保存到e中用于后續(xù)修改value值
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
// 如果第一個元素是樹節(jié)點,則調(diào)用樹節(jié)點的putTreeVal插入元素
e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
else {
// 遍歷這個桶對應(yīng)的鏈表,binCount用于存儲鏈表中元素的個數(shù)
for (int binCount = 0; ; ++binCount) {
// 如果鏈表遍歷完了都沒有找到相同key的元素,說明該key對應(yīng)的元素不存在,則在鏈表最后插入一個新節(jié)點
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 如果插入新節(jié)點后鏈表長度大于8,則判斷是否需要樹化,因為第一個元素沒有加到binCount中,所以這里-1
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 如果待插入的key在鏈表中找到了,則退出循環(huán)
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 如果找到了對應(yīng)key的元素
if (e != null) { // existing mapping for key
// 記錄下舊值
V oldValue = e.value;
// 判斷是否需要替換舊值
if (!onlyIfAbsent || oldValue == null)
// 替換舊值為新值
e.value = value;
// 在節(jié)點被訪問后做點什么事,在LinkedHashMap中用到
afterNodeAccess(e);
// 返回舊值
return oldValue;
}
}
// 到這里了說明沒有找到元素
// 修改次數(shù)加1
++modCount;
// 元素數(shù)量加1,判斷是否需要擴(kuò)容
if (++size > threshold)
// 擴(kuò)容
resize();
// 在節(jié)點插入后做點什么事,在LinkedHashMap中用到
afterNodeInsertion(evict);
// 沒找到元素返回null
return null;
}
為什么這樣計算hash
我們知道上面代碼里的key.hashCode()函數(shù)調(diào)用的是key鍵值類型自帶的哈希函數(shù),返回int型散列值。都知道上面代碼里的key.hashCode()函數(shù)調(diào)用的是key鍵值類型自帶的哈希函數(shù),返回int型散列值。只要哈希函數(shù)映射得比較均勻松散,一般應(yīng)用是很難出現(xiàn)碰撞的。但問題是一個40億長度的數(shù)組,內(nèi)存是放不下的。HashMap擴(kuò)容之前的數(shù)組初始大小才16。所以這個散列值是不能直接拿來用的。用之前還要先做對數(shù)組的長度取模運(yùn)算,得到的余數(shù)才能用來訪問數(shù)組下標(biāo)。源碼中模運(yùn)算是在這個indexFor( )函數(shù)里完成的。
bucketIndex = indexFor(hash, table.length);
static int indexFor(int h, int length) {
return h & (length-1);
}
順便說一下,這也正好解釋了為什么HashMap的數(shù)組長度要取2的整次冪,因為這樣(數(shù)組長度-1)正好相當(dāng)于一個“低位掩碼”?!芭c”操作的結(jié)果就是散列值的高位全部歸零,只保留低位值.因為這樣(數(shù)組長度-1)正好相當(dāng)于一個“低位掩碼”?!芭c”操作的結(jié)果就是散列值的高位全部歸零,只保留低位值。
只保留低位值,用來做數(shù)組下標(biāo)訪問。以初始長度16為例,16-1=15。2進(jìn)制表示是00000000 00000000 00001111。和某散列值做“與”操作如下,結(jié)果就是截取了最低的四位值。
10100101 11000100 00100101
& 00000000 00000000 00001111
00000000 00000000 00000101 //高位全部歸零,只保留末四位
但這時候問題就來了,這樣就算我的散列值分布再松散,要是只取最后幾位的話,碰撞也會很嚴(yán)重。但這時候問題就來了,這樣就算我的散列值分布再松散,要是只取最后幾位的話,碰撞也會很嚴(yán)重。這時候“擾動函數(shù)”的價值就體現(xiàn)出來了

右位移16位,正好是32bit的一半,自己的高半?yún)^(qū)和低半?yún)^(qū)做異或,就是為了混合原始哈希碼的高位和低位,以此來加大低位的隨機(jī)性。而且混合后的低位摻雜了高位的部分特征,這樣高位的信息也被變相保留下來。
舉個例子
我們創(chuàng)建一個hashmap,其entry數(shù)組為默認(rèn)大小16?,F(xiàn)在有一個key、value的pair需要存儲到hashmap里,該key的hashcode是0ABC0000(8個16進(jìn)制數(shù),共32位),如果不經(jīng)過hash函數(shù)處理這個hashcode,這個pair過會兒將會被存放在entry數(shù)組中下標(biāo)為0處。下標(biāo)=ABCD0000 & (16-1) = 0
然后我們又要存儲另外一個pair,其key的hashcode是0DEF0000,得到數(shù)組下標(biāo)依然是0。想必你已經(jīng)看出來了,這是個實現(xiàn)得很差的hash算法,因為hashcode的1位全集中在前16位了,導(dǎo)致算出來的數(shù)組下標(biāo)一直是0。于是,明明key相差很大的pair,卻存放在了同一個鏈表里,導(dǎo)致以后查詢起來比較慢。
hash函數(shù)的通過若干次的移位、異或操作,把hashcode的“1位”變得“松散”,比如,經(jīng)過hash函數(shù)處理后,0ABC0000變?yōu)锳02188B,0DEF0000變?yōu)镈2AFC70,他們的數(shù)組下標(biāo)不再是清一色的0了。
resize()方法
final Node<K, V>[] resize() {
// 舊數(shù)組
Node<K, V>[] oldTab = table;
// 舊容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 舊擴(kuò)容門檻
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
// 如果舊容量達(dá)到了最大容量,則不再進(jìn)行擴(kuò)容
threshold = Integer.MAX_VALUE;
return oldTab;
} else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 如果舊容量的兩倍小于最大容量并且舊容量大于默認(rèn)初始容量(16),則容量擴(kuò)大為兩部,擴(kuò)容門檻也擴(kuò)大為兩倍
newThr = oldThr << 1; // double threshold
} else if (oldThr > 0) // initial capacity was placed in threshold
// 使用非默認(rèn)構(gòu)造方法創(chuàng)建的map,第一次插入元素會走到這里
// 如果舊容量為0且舊擴(kuò)容門檻大于0,則把新容量賦值為舊門檻
newCap = oldThr;
else { // zero initial threshold signifies using defaults
// 調(diào)用默認(rèn)構(gòu)造方法創(chuàng)建的map,第一次插入元素會走到這里
// 如果舊容量舊擴(kuò)容門檻都是0,說明還未初始化過,則初始化容量為默認(rèn)容量,擴(kuò)容門檻為默認(rèn)容量*默認(rèn)裝載因子
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
// 如果新擴(kuò)容門檻為0,則計算為容量*裝載因子,但不能超過最大容量
float ft = (float) newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
(int) ft : Integer.MAX_VALUE);
}
// 賦值擴(kuò)容門檻為新門檻
threshold = newThr;
// 新建一個新容量的數(shù)組
@SuppressWarnings({"rawtypes", "unchecked"})
Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
// 把桶賦值為新數(shù)組
table = newTab;
// 如果舊數(shù)組不為空,則搬移元素
if (oldTab != null) {
// 遍歷舊數(shù)組
for (int j = 0; j < oldCap; ++j) {
Node<K, V> e;
// 如果桶中第一個元素不為空,賦值給e
if ((e = oldTab[j]) != null) {
// 清空舊桶,便于GC回收
oldTab[j] = null;
// 如果這個桶中只有一個元素,則計算它在新桶中的位置并把它搬移到新桶中
// 因為每次都擴(kuò)容兩倍,所以這里的第一個元素搬移到新桶的時候新桶肯定還沒有元素
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
// 如果第一個元素是樹節(jié)點,則把這顆樹打散成兩顆樹插入到新桶中去
((TreeNode<K, V>) e).split(this, newTab, j, oldCap);
else { // preserve order
// 如果這個鏈表不止一個元素且不是一顆樹
// 則分化成兩個鏈表插入到新的桶中去
// 比如,假如原來容量為4,3、7、11、15這四個元素都在三號桶中
// 現(xiàn)在擴(kuò)容到8,則3和11還是在三號桶,7和15要搬移到七號桶中去
// 也就是分化成了兩個鏈表
Node<K, V> loHead = null, loTail = null;
Node<K, V> hiHead = null, hiTail = null;
Node<K, V> next;
do {
next = e.next;
// (e.hash & oldCap) == 0的元素放在低位鏈表中
// 比如,3 & 4 == 0
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
} else {
// (e.hash & oldCap) != 0的元素放在高位鏈表中
// 比如,7 & 4 != 0
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
// 遍歷完成分化成兩個鏈表了
// 低位鏈表在新桶中的位置與舊桶一樣(即3和11還在三號桶中)
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
// 高位鏈表在新桶中的位置正好是原來的位置加上舊容量(即7和15搬移到七號桶了)
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
(1)如果使用是默認(rèn)構(gòu)造方法,則第一次插入元素時初始化為默認(rèn)值,容量為16,擴(kuò)容門檻為12;
(2)如果使用的是非默認(rèn)構(gòu)造方法,則第一次插入元素時初始化容量等于擴(kuò)容門檻,擴(kuò)容門檻在構(gòu)造方法里等于傳入容量向上最近的2的n次方;
(3)如果舊容量大于0,則新容量等于舊容量的2倍,但不超過最大容量2的30次方,新擴(kuò)容門檻為舊擴(kuò)容門檻的2倍;
(4)創(chuàng)建一個新容量的桶;
(5)搬移元素,原鏈表分化成兩個鏈表,低位鏈表存儲在原來桶的位置,高位鏈表搬移到原來桶的位置加舊容量的位置;
擴(kuò)容容量都是原來的兩倍,所以紅黑樹和鏈表都是一分為2!
TreeNode.putTreeVal(...)方法
final TreeNode<K, V> putTreeVal(HashMap<K, V> map, Node<K, V>[] tab,
int h, K k, V v) {
Class<?> kc = null;
// 標(biāo)記是否找到這個key的節(jié)點
boolean searched = false;
// 找到樹的根節(jié)點
TreeNode<K, V> root = (parent != null) ? root() : this;
// 從樹的根節(jié)點開始遍歷
for (TreeNode<K, V> p = root; ; ) {
// dir=direction,標(biāo)記是在左邊還是右邊
// ph=p.hash,當(dāng)前節(jié)點的hash值
int dir, ph;
// pk=p.key,當(dāng)前節(jié)點的key值
K pk;
if ((ph = p.hash) > h) {
// 當(dāng)前hash比目標(biāo)hash大,說明在左邊
dir = -1;
}
else if (ph < h)
// 當(dāng)前hash比目標(biāo)hash小,說明在右邊
dir = 1;
else if ((pk = p.key) == k || (k != null && k.equals(pk)))
// 兩者h(yuǎn)ash相同且key相等,說明找到了節(jié)點,直接返回該節(jié)點
// 回到putVal()中判斷是否需要修改其value值
return p;
else if ((kc == null &&
// 如果k是Comparable的子類則返回其真實的類,否則返回null
(kc = comparableClassFor(k)) == null) ||
// 如果k和pk不是同樣的類型則返回0,否則返回兩者比較的結(jié)果
(dir = compareComparables(kc, k, pk)) == 0) {
// 這個條件表示兩者h(yuǎn)ash相同但是其中一個不是Comparable類型或者兩者類型不同
// 比如key是Object類型,這時可以傳String也可以傳Integer,兩者h(yuǎn)ash值可能相同
// 在紅黑樹中把同樣hash值的元素存儲在同一顆子樹,這里相當(dāng)于找到了這顆子樹的頂點
// 從這個頂點分別遍歷其左右子樹去尋找有沒有跟待插入的key相同的元素
if (!searched) {
TreeNode<K, V> q, ch;
searched = true;
// 遍歷左右子樹找到了直接返回
if (((ch = p.left) != null &&
(q = ch.find(h, k, kc)) != null) ||
((ch = p.right) != null &&
(q = ch.find(h, k, kc)) != null))
return q;
}
// 如果兩者類型相同,再根據(jù)它們的內(nèi)存地址計算hash值進(jìn)行比較
dir = tieBreakOrder(k, pk);
}
TreeNode<K, V> xp = p;
if ((p = (dir <= 0) ? p.left : p.right) == null) {
// 如果最后確實沒找到對應(yīng)key的元素,則新建一個節(jié)點
Node<K, V> xpn = xp.next;
TreeNode<K, V> x = map.newTreeNode(h, k, v, xpn);
if (dir <= 0)
xp.left = x;
else
xp.right = x;
xp.next = x;
x.parent = x.prev = xp;
if (xpn != null)
((TreeNode<K, V>) xpn).prev = x;
// 插入樹節(jié)點后平衡
// 把root節(jié)點移動到鏈表的第一個節(jié)點
moveRootToFront(tab, balanceInsertion(root, x));
return null;
}
}
}
(1)尋找根節(jié)點;
(2)從根節(jié)點開始查找;
(3)比較hash值及key值,如果都相同,直接返回,在putVal()方法中決定是否要替換value值;
(4)根據(jù)hash值及key值確定在樹的左子樹還是右子樹查找,找到了直接返回;
(5)如果最后沒有找到則在樹的相應(yīng)位置插入元素,并做平衡;
treeifyBin()方法
如果插入元素后鏈表的長度大于等于8則判斷是否需要樹化。
final void treeifyBin(Node<K, V>[] tab, int hash) {
int n, index;
Node<K, V> e;
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
// 如果桶數(shù)量小于64,直接擴(kuò)容而不用樹化
// 因為擴(kuò)容之后,鏈表會分化成兩個鏈表,達(dá)到減少元素的作用
// 當(dāng)然也不一定,比如容量為4,里面存的全是除以4余數(shù)等于3的元素
// 這樣即使擴(kuò)容也無法減少鏈表的長度
resize();
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K, V> hd = null, tl = null;
// 把所有節(jié)點換成樹節(jié)點
do {
TreeNode<K, V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
// 如果進(jìn)入過上面的循環(huán),則從頭節(jié)點開始樹化
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}
TreeNode.treeify()方法
真正樹化的方法。
final void treeify(Node<K, V>[] tab) {
TreeNode<K, V> root = null;
for (TreeNode<K, V> x = this, next; x != null; x = next) {
next = (TreeNode<K, V>) x.next;
x.left = x.right = null;
// 第一個元素作為根節(jié)點且為黑節(jié)點,其它元素依次插入到樹中再做平衡
if (root == null) {
x.parent = null;
x.red = false;
root = x;
} else {
K k = x.key;
int h = x.hash;
Class<?> kc = null;
// 從根節(jié)點查找元素插入的位置
for (TreeNode<K, V> p = root; ; ) {
int dir, ph;
K pk = p.key;
if ((ph = p.hash) > h)
dir = -1;
else if (ph < h)
dir = 1;
else if ((kc == null &&
(kc = comparableClassFor(k)) == null) ||
(dir = compareComparables(kc, k, pk)) == 0)
dir = tieBreakOrder(k, pk);
// 如果最后沒找到元素,則插入
TreeNode<K, V> xp = p;
if ((p = (dir <= 0) ? p.left : p.right) == null) {
x.parent = xp;
if (dir <= 0)
xp.left = x;
else
xp.right = x;
// 插入后平衡,默認(rèn)插入的是紅節(jié)點,在balanceInsertion()方法里
root = balanceInsertion(root, x);
break;
}
}
}
}
// 把根節(jié)點移動到鏈表的頭節(jié)點,因為經(jīng)過平衡之后原來的第一個元素不一定是根節(jié)點了
moveRootToFront(tab, root);
}
(1)從鏈表的第一個元素開始遍歷;
(2)將第一個元素作為根節(jié)點;
(3)其它元素依次插入到紅黑樹中,再做平衡;
(4)將根節(jié)點移到鏈表第一元素的位置(因為平衡的時候根節(jié)點會改變);
get(Object key)方法
public V get(Object key) {
Node<K, V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K, V> getNode(int hash, Object key) {
Node<K, V>[] tab;
Node<K, V> first, e;
int n;
K k;
// 如果桶的數(shù)量大于0并且待查找的key所在的桶的第一個元素不為空
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 檢查第一個元素是不是要查的元素,如果是直接返回
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
// 如果第一個元素是樹節(jié)點,則按樹的方式查找
if (first instanceof TreeNode)
return ((TreeNode<K, V>) first).getTreeNode(hash, key);
// 否則就遍歷整個鏈表查找該元素
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
(1)計算key的hash值;
(2)找到key所在的桶及其第一個元素;
(3)如果第一個元素的key等于待查找的key,直接返回;
(4)如果第一個元素是樹節(jié)點就按樹的方式來查找,否則按鏈表方式查找;
TreeNode.getTreeNode(int h, Object k)方法
final TreeNode<K, V> getTreeNode(int h, Object k) {
// 從樹的根節(jié)點開始查找
return ((parent != null) ? root() : this).find(h, k, null);
}
final TreeNode<K, V> find(int h, Object k, Class<?> kc) {
TreeNode<K, V> p = this;
do {
int ph, dir;
K pk;
TreeNode<K, V> pl = p.left, pr = p.right, q;
if ((ph = p.hash) > h)
// 左子樹
p = pl;
else if (ph < h)
// 右子樹
p = pr;
else if ((pk = p.key) == k || (k != null && k.equals(pk)))
// 找到了直接返回
return p;
else if (pl == null)
// hash相同但key不同,左子樹為空查右子樹
p = pr;
else if (pr == null)
// 右子樹為空查左子樹
p = pl;
else if ((kc != null ||
(kc = comparableClassFor(k)) != null) &&
(dir = compareComparables(kc, k, pk)) != 0)
// 通過compare方法比較key值的大小決定使用左子樹還是右子樹
p = (dir < 0) ? pl : pr;
else if ((q = pr.find(h, k, kc)) != null)
// 如果以上條件都不通過,則嘗試在右子樹查找
return q;
else
// 都沒找到就在左子樹查找
p = pl;
} while (p != null);
return null;
}
經(jīng)典二叉查找樹的查找過程,先根據(jù)hash值比較,再根據(jù)key值比較決定是查左子樹還是右子樹。
remove(Object key)方法
public V remove(Object key) {
Node<K, V> e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node<K, V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node<K, V>[] tab;
Node<K, V> p;
int n, index;
// 如果桶的數(shù)量大于0且待刪除的元素所在的桶的第一個元素不為空
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
Node<K, V> node = null, e;
K k;
V v;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// 如果第一個元素正好就是要找的元素,賦值給node變量后續(xù)刪除使用
node = p;
else if ((e = p.next) != null) {
if (p instanceof TreeNode)
// 如果第一個元素是樹節(jié)點,則以樹的方式查找節(jié)點
node = ((TreeNode<K, V>) p).getTreeNode(hash, key);
else {
// 否則遍歷整個鏈表查找元素
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
// 如果找到了元素,則看參數(shù)是否需要匹配value值,如果不需要匹配直接刪除,如果需要匹配則看value值是否與傳入的value相等
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
if (node instanceof TreeNode)
// 如果是樹節(jié)點,調(diào)用樹的刪除方法(以node調(diào)用的,是刪除自己)
((TreeNode<K, V>) node).removeTreeNode(this, tab, movable);
else if (node == p)
// 如果待刪除的元素是第一個元素,則把第二個元素移到第一的位置
tab[index] = node.next;
else
// 否則刪除node節(jié)點
p.next = node.next;
++modCount;
--size;
// 刪除節(jié)點后置處理
afterNodeRemoval(node);
return node;
}
}
return null;
}
(1)先查找元素所在的節(jié)點;
(2)如果找到的節(jié)點是樹節(jié)點,則按樹的移除節(jié)點處理;
(3)如果找到的節(jié)點是桶中的第一個節(jié)點,則把第二個節(jié)點移到第一的位置;
(4)否則按鏈表刪除節(jié)點處理;
(5)修改size,調(diào)用移除節(jié)點后置處理等;
總結(jié)
(1)HashMap是一種散列表,采用(數(shù)組 + 鏈表 + 紅黑樹)的存儲結(jié)構(gòu);
(2)HashMap的默認(rèn)初始容量為16(1<<4),默認(rèn)裝載因子為0.75f,容量總是2的n次方;
(3)HashMap擴(kuò)容時每次容量變?yōu)樵瓉淼膬杀叮?
(4)當(dāng)桶的數(shù)量小于64時不會進(jìn)行樹化,只會擴(kuò)容;
(5)當(dāng)桶的數(shù)量大于64且單個桶中元素的數(shù)量大于8時,進(jìn)行樹化;
(6)當(dāng)單個桶中元素數(shù)量小于6時,進(jìn)行反樹化;
(7)HashMap是非線程安全的容器;
以上是java8 hashmap的實現(xiàn),相對jdk1.7主要是加入了紅黑樹,紅黑樹的數(shù)據(jù)結(jié)構(gòu)相對復(fù)雜,這里為了簡單期間,我們回顧下hashmap1.7版本的實現(xiàn):
HashMap實現(xiàn)了Map接口,繼承AbstractMap。其中Map接口定義了鍵映射到值的規(guī)則,而AbstractMap類提供 Map 接口的骨干實現(xiàn),以最大限度地減少實現(xiàn)此接口所需的工作,其實AbstractMap類已經(jīng)實現(xiàn)了Map
public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
HashMap提供了三個構(gòu)造函數(shù):
HashMap():構(gòu)造一個具有默認(rèn)初始容量 (16) 和默認(rèn)加載因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity):構(gòu)造一個帶指定初始容量和默認(rèn)加載因子 (0.75) 的空 HashMap。
HashMap(int initialCapacity, float loadFactor):構(gòu)造一個帶指定初始容量和加載因子的空 HashMap。
在這里提到了兩個參數(shù):初始容量,加載因子。這兩個參數(shù)是影響HashMap性能的重要參數(shù),其中容量表示哈希表中桶的數(shù)量,初始容量是創(chuàng)建哈希表時的容量,加載因子是哈希表在其容量自動增加之前可以達(dá)到多滿的一種尺度,它衡量的是一個散列表的空間的使用程度,負(fù)載因子越大表示散列表的裝填程度越高,反之愈小。對于使用鏈表法的散列表來說,查找一個元素的平均時間是O(1+a),因此如果負(fù)載因子越大,對空間的利用更充分,然而后果是查找效率的降低;如果負(fù)載因子太小,那么散列表的數(shù)據(jù)將過于稀疏,對空間造成嚴(yán)重浪費。系統(tǒng)默認(rèn)負(fù)載因子為0.75,一般情況下我們是無需修改的。
數(shù)據(jù)結(jié)構(gòu)
HashMap是一種支持快速存取的數(shù)據(jù)結(jié)構(gòu),要了解它的性能必須要了解它的數(shù)據(jù)結(jié)構(gòu)。

從上圖我們可以看出HashMap底層實現(xiàn)還是數(shù)組,只是數(shù)組的每一項都是一條鏈。其中參數(shù)initialCapacity就代表了該數(shù)組的長度。下面為HashMap構(gòu)造函數(shù)的源碼:
public HashMap(int initialCapacity, float loadFactor) {
//初始容量不能<0
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: "
+ initialCapacity);
//初始容量不能 > 最大容量值,HashMap的最大容量值為2^30
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
//負(fù)載因子不能 < 0
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: "
+ loadFactor);
// 計算出大于 initialCapacity 的最小的 2 的 n 次方值。
int capacity = 1;
while (capacity < initialCapacity)
capacity <<= 1;
this.loadFactor = loadFactor;
//設(shè)置HashMap的容量極限,當(dāng)HashMap的容量達(dá)到該極限時就會進(jìn)行擴(kuò)容操作
threshold = (int) (capacity * loadFactor);
//初始化table數(shù)組
table = new Entry[capacity];
init();
}
從源碼中可以看出,每次新建一個HashMap時,都會初始化一個table數(shù)組。table數(shù)組的元素為Entry節(jié)點。(java8并不會在構(gòu)造函數(shù)初始化table數(shù)組)
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;
/**
* Creates new entry.
*/
Entry(int h, K k, V v, Entry<K,V> n) {
value = v;
next = n;
key = k;
hash = h;
}
.......
}
其中Entry為HashMap的內(nèi)部類,它包含了鍵key、值value、下一個節(jié)點next,以及hash值,這是非常重要的,正是由于Entry才構(gòu)成了table數(shù)組的項為鏈表。
、存儲實現(xiàn):put(key,vlaue)
public V put(K key, V value) {
//當(dāng)key為null,調(diào)用putForNullKey方法,保存null與table第一個位置中,這是HashMap允許為null的原因
if (key == null)
return putForNullKey(value);
//計算key的hash值
int hash = hash(key.hashCode()); ------(1)
//計算key hash 值在 table 數(shù)組中的位置
int i = indexFor(hash, table.length); ------(2)
//從i出開始迭代 e,找到 key 保存的位置
for (Entry<K, V> e = table[i]; e != null; e = e.next) {
Object k;
//判斷該條鏈上是否有hash值相同的(key相同)
//若存在相同,則直接覆蓋value,返回舊value
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value; //舊值 = 新值
e.value = value;
e.recordAccess(this);
return oldValue; //返回舊值
}
}
//修改次數(shù)增加1
modCount++;
//將key、value添加至i位置處
addEntry(hash, key, value, i);
return null;
}
通過源碼我們可以清晰看到HashMap保存數(shù)據(jù)的過程為:首先判斷key是否為null,若為null,則直接調(diào)用putForNullKey方法。若不為空則先計算key的hash值,然后根據(jù)hash值搜索在table數(shù)組中的索引位置,如果table數(shù)組在該位置處有元素,則通過比較是否存在相同的key,若存在則覆蓋原來key的value,否則將該元素保存在鏈頭(最先保存的元素放在鏈尾java8是后加入的放在鏈尾)。若table在該處沒有元素,則直接保存.
我們知道對于HashMap的table而言,數(shù)據(jù)分布需要均勻(最好每項都只有一個元素,這樣就可以直接找到),不能太緊也不能太松,太緊會導(dǎo)致查詢速度慢,太松則浪費空間。計算hash值后,怎么才能保證table元素分布均與呢?我們會想到取模,但是由于取模的消耗較大,HashMap是這樣處理的:調(diào)用indexFor方法。
static int indexFor(int h, int length) {
return h & (length-1);
}
HashMap的底層數(shù)組長度總是2的n次方,在構(gòu)造函數(shù)中存在:capacity <<= 1;這樣做總是能夠保證HashMap的底層數(shù)組長度為2的n次方。當(dāng)length為2的n次方時,h&(length – 1)就相當(dāng)于對length取模,而且速度比直接取??斓枚?,這是HashMap在速度上的一個優(yōu)化。
h&(length – 1),這句話除了上面的取模運(yùn)算外還有一個非常重要的責(zé)任:均勻分布table數(shù)據(jù)和充分利用空間。
這里我們假設(shè)length為16(2^n)和15,h為5、6、7。

當(dāng)n=15時,6和7的結(jié)果一樣,這樣表示他們在table存儲的位置是相同的,也就是產(chǎn)生了碰撞,6、7就會在一個位置形成鏈表,這樣就會導(dǎo)致查詢速度降低。誠然這里只分析三個數(shù)字不是很多,那么我們就看0-15。

從上面的圖表中我們看到總共發(fā)生了8此碰撞,同時發(fā)現(xiàn)浪費的空間非常大,有1、3、5、7、9、11、13、15處沒有記錄,也就是沒有存放數(shù)據(jù)。這是因為他們在與14進(jìn)行&運(yùn)算時,得到的結(jié)果最后一位永遠(yuǎn)都是0,即0001、0011、0101、0111、1001、1011、1101、1111位置處是不可能存儲數(shù)據(jù)的,空間減少,進(jìn)一步增加碰撞幾率,這樣就會導(dǎo)致查詢速度慢。而當(dāng)length = 16時,length – 1 = 15 即1111,那么進(jìn)行低位&運(yùn)算時,值總是與原來hash值相同,而進(jìn)行高位運(yùn)算時,其值等于其低位值。所以說當(dāng)length = 2^n時,不同的hash值發(fā)生碰撞的概率比較小,這樣就會使得數(shù)據(jù)在table數(shù)組中分布較均勻,查詢速度也較快。
我們再來復(fù)習(xí)put的流程:當(dāng)我們想一個HashMap中添加一對key-value時,系統(tǒng)首先會計算key的hash值,然后根據(jù)hash值確認(rèn)在table中存儲的位置。若該位置沒有元素,則直接插入。否則迭代該處元素鏈表并依此比較其key的hash值。如果兩個hash值相等且key值相等(e.hash == hash && ((k = e.key) == key || key.equals(k))),則用新的Entry的value覆蓋原來節(jié)點的value。如果兩個hash值相等但key值不等 ,則將該節(jié)點插入該鏈表的鏈頭。具體的實現(xiàn)過程見addEntry方法
void addEntry(int hash, K key, V value, int bucketIndex) {
//獲取bucketIndex處的Entry
Entry<K, V> e = table[bucketIndex];
//將新創(chuàng)建的 Entry 放入 bucketIndex 索引處,并讓新的 Entry 指向原來的 Entry
table[bucketIndex] = new Entry<K, V>(hash, key, value, e);
//若HashMap中元素的個數(shù)超過極限了,則容量擴(kuò)大兩倍
if (size++ >= threshold)
resize(2 * table.length);
}
隨著HashMap中元素的數(shù)量越來越多,發(fā)生碰撞的概率就越來越大,所產(chǎn)生的鏈表長度就會越來越長,這樣勢必會影響HashMap的速度,為了保證HashMap的效率,系統(tǒng)必須要在某個臨界點進(jìn)行擴(kuò)容處理。該臨界點在當(dāng)HashMap中元素的數(shù)量等于table數(shù)組長度*加載因子。但是擴(kuò)容是一個非常耗時的過程,因為它需要重新計算這些數(shù)據(jù)在新table數(shù)組中的位置并進(jìn)行復(fù)制處理。所以如果我們已經(jīng)預(yù)知HashMap中元素的個數(shù),那么預(yù)設(shè)元素的個數(shù)能夠有效的提高HashMap的性能。
讀取實現(xiàn):get(key)
相對于HashMap的存而言,取就顯得比較簡單了。通過key的hash值找到在table數(shù)組中的索引處的Entry,然后返回該key對應(yīng)的value即可。
public V get(Object key) {
// 若為null,調(diào)用getForNullKey方法返回相對應(yīng)的value
if (key == null)
return getForNullKey();
// 根據(jù)該 key 的 hashCode 值計算它的 hash 碼
int hash = hash(key.hashCode());
// 取出 table 數(shù)組中指定索引處的值
for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
Object k;
//若搜索的key與查找的key相同,則返回相對應(yīng)的value
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
return null;
}
HashMap在存儲過程中并沒有將key,value分開來存儲,而是當(dāng)做一個整體key-value來處理的,這個整體就是Entry對象。同時value也只相當(dāng)于key的附屬而已。在存儲的過程中,系統(tǒng)根據(jù)key的hashcode來決定Entry在table數(shù)組中的存儲位置,在取的過程中同樣根據(jù)key的hashcode取出相對應(yīng)的Entry對象。