【一天一道面試題】HashMap 奪命二十一問

1:HashMap 的數(shù)據(jù)結(jié)構(gòu)?

A:哈希表結(jié)構(gòu)(鏈表散列:數(shù)組+鏈表)實現(xiàn),結(jié)合數(shù)組和鏈表的優(yōu)點。當(dāng)鏈表長度超過 8 時,鏈表轉(zhuǎn)換為紅黑樹。

transient Node<K,V>[] table;

2:HashMap 的工作原理?

HashMap 底層是 hash 數(shù)組和單向鏈表實現(xiàn),數(shù)組中的每個元素都是鏈表,由 Node 內(nèi)部類(實現(xiàn) Map.Entry接口)實現(xiàn),HashMap 通過 put & get 方法存儲和獲取。

存儲對象時,將 K/V 鍵值傳給 put() 方法:

①、調(diào)用 hash(K) 方法計算 K 的 hash 值,然后結(jié)合數(shù)組長度,計算得數(shù)組下標(biāo);

②、調(diào)整數(shù)組大?。ó?dāng)容器中的元素個數(shù)大于 capacity * loadfactor 時,容器會進(jìn)行擴容resize 為 2n);

③、i.如果 K 的 hash 值在 HashMap 中不存在,則執(zhí)行插入,若存在,則發(fā)生碰撞;

ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 true,則更新鍵值對;

iii. 如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 false,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式)。

(JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法)(注意:當(dāng)碰撞導(dǎo)致鏈表大于 TREEIFY_THRESHOLD = 8 時,就把鏈表轉(zhuǎn)換成紅黑樹)

獲取對象時,將 K 傳給 get() 方法:①、調(diào)用 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在鏈表的數(shù)組下標(biāo);②、順序遍歷鏈表,equals()方法查找相同 Node 鏈表中 K 值對應(yīng)的 V 值。

hashCode 是定位的,存儲位置;equals是定性的,比較兩者是否相等。

3.當(dāng)兩個對象的 hashCode 相同會發(fā)生什么?

[因為 hashCode 相同,不一定就是相等的(equals方法比較),所以兩個對象所在數(shù)組的下標(biāo)相同,"碰撞"就此發(fā)生。又因為 HashMap 使用鏈表存儲對象,這個 Node 會存儲到鏈表中。為什么要重寫 hashcode 和 equals 方法?推薦看下。]

4.你知道 hash 的實現(xiàn)嗎?為什么要這樣實現(xiàn)?

JDK 1.8 中,是通過 hashCode() 的高 16 位異或低 16 位實現(xiàn)的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度,功效和質(zhì)量來考慮的,減少系統(tǒng)的開銷,也不會造成因為高位沒有參與下標(biāo)的計算,從而引起的碰撞。

5.為什么要用異或運算符?

保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變,整個 hash() 返回值就會改變。盡可能的減少碰撞。

6.HashMap 的 table 的容量如何確定?loadFactor 是什么?該容量如何變化?這種變化會帶來什么問題?

①、table 數(shù)組大小是由 capacity 這個參數(shù)確定的,默認(rèn)是16,也可以構(gòu)造時傳入,最大限制是1<<30;

②、loadFactor 是裝載因子,主要目的是用來確認(rèn)table 數(shù)組是否需要動態(tài)擴展,默認(rèn)值是0.75,比如table 數(shù)組大小為 16,裝載因子為 0.75 時,threshold 就是12,當(dāng) table 的實際大小超過 12 時,table就需要動態(tài)擴容;

③、擴容時,調(diào)用 resize() 方法,將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度,而不是 threshold)

④、如果數(shù)據(jù)很大的情況下,擴展時將會帶來性能的損失,在性能要求很高的地方,這種損失很可能很致命。

7.HashMap中put方法的過程?

答:“調(diào)用哈希函數(shù)獲取Key對應(yīng)的hash值,再計算其數(shù)組下標(biāo);

如果沒有出現(xiàn)哈希沖突,則直接放入數(shù)組;如果出現(xiàn)哈希沖突,則以鏈表的方式放在鏈表后面;

如果鏈表長度超過閥值( TREEIFY THRESHOLD==8),就把鏈表轉(zhuǎn)成紅黑樹,鏈表長度低于6,就把紅黑樹轉(zhuǎn)回鏈表;

如果結(jié)點的key已經(jīng)存在,則替換其value即可;

如果集合中的鍵值對大于12,調(diào)用resize方法進(jìn)行數(shù)組擴容。”

8.數(shù)組擴容的過程?

創(chuàng)建一個新的數(shù)組,其容量為舊數(shù)組的兩倍,并重新計算舊數(shù)組中結(jié)點的存儲位置。結(jié)點在新數(shù)組中的位置只有兩種,原下標(biāo)位置或原下標(biāo)+舊數(shù)組的大小。

9.拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹?

之所以選擇紅黑樹是為了解決二叉查找樹的缺陷,二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)(這就跟原來使用鏈表結(jié)構(gòu)一樣了,造成很深的問題),遍歷查找會非常慢。推薦:面試問紅黑樹,我臉都綠了。

而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋,右旋、變色這些操作來保持平衡,引入紅黑樹就是為了查找數(shù)據(jù)快,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹,但是為了保持“平衡”是需要付出代價的,但是該代價所損耗的資源要比遍歷線性鏈表要少,所以當(dāng)長度大于8的時候,會使用紅黑樹,如果鏈表長度很短的話,根本不需要引入紅黑樹,引入反而會慢。

10.說說你對紅黑樹的見解?

  • 每個節(jié)點非紅即黑
  • 根節(jié)點總是黑色的
  • 如果節(jié)點是紅色的,則它的子節(jié)點必須是黑色的(反之不一定)
  • 每個葉子節(jié)點都是黑色的空節(jié)點(NIL節(jié)點)
  • 從根節(jié)點到葉節(jié)點或空子節(jié)點的每條路徑,必須包含相同數(shù)目的黑色節(jié)點(即相同的黑色高度)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容