面試官心理分析
其實這是問到緩存必問的,因為緩存雪崩和穿透,是緩存最大的兩個問題,要么不出現(xiàn),一旦出現(xiàn)就是致命性的問題,所以面試官一定會問你。
面試題剖析

大約在 3 年前,國內(nèi)比較知名的一個互聯(lián)網(wǎng)公司,曾因為緩存事故,導(dǎo)致雪崩,后臺系統(tǒng)全部崩潰,事故從當(dāng)天下午持續(xù)到晚上凌晨 3~4 點,公司損失了幾千萬。
緩存雪崩的事前事中事后的解決方案如下。
????????事前:redis 高可用,主從+哨兵,redis cluster,避免全盤崩潰。
????????事中:本地 ehcache 緩存 + hystrix 限流&降級,避免 MySQL 被打死。
????????事后:redis 持久化,一旦重啟,自動從磁盤上加載數(shù)據(jù),快速恢復(fù)緩存數(shù)據(jù)。

用戶發(fā)送一個請求,系統(tǒng) A 收到請求后,先查本地 ehcache 緩存,如果沒查到再查 redis。如果 ehcache和 redis 都沒有,再查數(shù)據(jù)庫,將數(shù)據(jù)庫中的結(jié)果,寫入 ehcache 和 redis 中。
限流組件,可以設(shè)置每秒的請求,有多少能通過組件,剩余的未通過的請求,怎么辦?走降級!可以返回一些默認的值,或者友情提示,或者空白的值。
好處:
1.數(shù)據(jù)庫絕對不會死,限流組件確保了每秒只有多少個請求能通過。
2.只要數(shù)據(jù)庫不死,就是說,對用戶來說,2/5 的請求都是可以被處理的。
3.只要有 2/5 的請求可以被處理,就意味著你的系統(tǒng)沒死,對用戶來說,可能就是點擊幾次刷不出來頁面,但是多點幾次,就可以刷出來一次。
緩存穿透
對于系統(tǒng) A,假設(shè)一秒 5000 個請求,結(jié)果其中 4000 個請求是黑客發(fā)出的惡意攻擊。
黑客發(fā)出的那 4000 個攻擊,緩存中查不到,每次你去數(shù)據(jù)庫里查,也查不到。
舉個栗子。數(shù)據(jù)庫 id 是從 1 開始的,結(jié)果黑客發(fā)過來的請求 id 全部都是負數(shù)。這樣的話,緩存中不會有,請求每次都“視緩存于無物”,直接查詢數(shù)據(jù)庫。這種惡意攻擊場景的緩存穿透就會直接把數(shù)據(jù)庫給打死。

解決方式很簡單,每次系統(tǒng) A 從數(shù)據(jù)庫中只要沒查到,就寫一個空值到緩存里去,比如 set -999 UNKNOWN。然后設(shè)置一個過期時間,這樣的話,下次有相同的 key 來訪問的時候,在緩存失效之前,都可以直接從緩存中取數(shù)據(jù)。
緩存擊穿
緩存擊穿,就是說某個 key 非常熱點,訪問非常頻繁,處于集中式高并發(fā)訪問的情況,當(dāng)這個 key 在失效的瞬間,大量的請求就擊穿了緩存,直接請求數(shù)據(jù)庫,就像是在一道屏障上鑿開了一個洞。
解決方式也很簡單,可以將熱點數(shù)據(jù)設(shè)置為永遠不過期;或者基于 redis or zookeeper 實現(xiàn)互斥鎖,等待第一個請求構(gòu)建完緩存之后,再釋放鎖,進而其它請求才能通過該 key 訪問數(shù)據(jù)。