java.util.HashMap
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
本質(zhì)是一個Entry[]數(shù)組(哈希桶數(shù)組),用Key的哈希值對桶數(shù)組size取??傻玫綌?shù)組下標(biāo)。若數(shù)組下標(biāo)碰撞,進(jìn)化為鏈表或紅黑樹。
一.基本概念
基于Map接口實(shí)現(xiàn)、允許null鍵/值、非同步、不保證有序(插入的順序)、也不保證序不隨時間變化
- 每個結(jié)構(gòu)體包括:hash、key、next、value
- 容量Capacity:buckets的數(shù)目(hashmap能裝載的最大個數(shù))
- 負(fù)載因子Load factor:就是buckets填滿程度的最大比例
- 當(dāng)bucket填充的數(shù)目(即hashmap當(dāng)前元素個數(shù))大于capacity*load factor時就需要調(diào)整buckets的數(shù)目為當(dāng)前的2倍
1.1 結(jié)構(gòu)體
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
...
}
1.2 容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
static final int MAXIMUM_CAPACITY = 1 << 30;
static final float DEFAULT_LOAD_FACTOR = 0.75f;
二.put函數(shù)的實(shí)現(xiàn)
- 對key的hashCode()做hash,然后再計(jì)算index;
- 如果沒碰撞直接放到bucket里;碰撞則分3種情況
- 如果節(jié)點(diǎn)已經(jīng)存在就替換old value(保證key的唯一性)
- 如果碰撞了,以鏈表的形式存在buckets后;
- 如果碰撞導(dǎo)致鏈表過長(大于等于TREEIFY_THRESHOLD),就把鏈表轉(zhuǎn)換成紅黑樹;
- 放入節(jié)點(diǎn)后,判斷若bucket滿了(超過load factor*current capacity),就要resize
- 訪問或插入節(jié)點(diǎn)后的afterNodeAccess/afterNodeInsertion給LinkedHashMap繼承用的
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
//1.無碰撞直接放入
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//2.碰撞有3種情況
//2.1 key值存在,替換value
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//2.2 計(jì)算出的節(jié)點(diǎn)為樹,則控制樹
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//2.3 計(jì)算出的節(jié)點(diǎn)為鏈表,則控制鏈表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
三.get函數(shù)的實(shí)現(xiàn)
- bucket里的第一個節(jié)點(diǎn),直接命中;
- 如果有沖突,則通過key.equals(k)去查找對應(yīng)的entry
- 若為樹,則在樹中通過key.equals(k)查找,O(logn);
- 若為鏈表,則在鏈表中通過key.equals(k)查找,O(n)
四.hash函數(shù)實(shí)現(xiàn)
- 高16bit不變,低16bit和高16bit做了一個異或
- 從速度、功效、質(zhì)量考慮,在bucket的n比較小的時候,也能保證高低bit都參與到hash的計(jì)算中,同時不會有太大的開銷
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
因?yàn)閠able長度n為2的冪,故計(jì)算下標(biāo)的時候使用&位操作,而非%求余:
first = tab[(n - 1) & hash]
五.resize函數(shù)實(shí)現(xiàn)
- resize,即把bucket擴(kuò)充為2倍,然后把節(jié)點(diǎn)再放到新的bucket中
- 把節(jié)點(diǎn)放到新bucket時,不需要重新計(jì)算hash,只需看原來的hash值新增的那個bit是1還是0,是0的話索引沒變,是1的話索引變成原索引+oldCap
- 既省去重新計(jì)算hash值的時間,同時由于新增的1bit是0還是1可以認(rèn)為是隨機(jī)的,因此resize的過程,均勻的把之前的沖突的節(jié)點(diǎn)分散到新的bucket了
六.線程安全
HashMap線程不安全,多線程場景解決方案:
- Map m = Collections.synchronizeMap(hashMap)
- JDK1.5提供了ConcurrentHashMap
- Hashtable(已過時,不推薦)