數(shù)據(jù)緩存的處理

一.緩存更新策略

典型的緩存模式,一般有如下幾種:

  • Cache Aside

  • Read/Write Through

  • Write Behind

1.Cache Aside 模式

這是大家經(jīng)常用到的一種策略模式。這種模式主要流程如下:

  • 應(yīng)用在查詢數(shù)據(jù)的時候,先從緩存Cache中讀取數(shù)據(jù),如果緩存中沒有,則再從數(shù)據(jù)庫中讀取數(shù)據(jù),得到數(shù)據(jù)庫的數(shù)據(jù)之后,將這個數(shù)據(jù)也放到緩存Cache中。

  • 如果應(yīng)用要更新某個數(shù)據(jù),也是先去更新數(shù)據(jù)庫中的數(shù)據(jù),更新完成之后,則通過指令讓緩存Cache中的數(shù)據(jù)失效。

這里為什么不讓更新操作在寫完數(shù)據(jù)庫之后,緊接著去把緩存Cache中的數(shù)據(jù)也修改了呢?

主要是因為這樣做的話,就有2個寫操作的事件了,擔(dān)心在并發(fā)的情況下會導(dǎo)致臟數(shù)據(jù),舉個例子:
假如同時有2個請求,請求A和請求B,并發(fā)的執(zhí)行。請求A是要去讀數(shù)據(jù),請求B是要去更新數(shù)據(jù)。初始狀態(tài)緩存中是沒有數(shù)據(jù)的,當(dāng)請求A讀到數(shù)據(jù)之后,準(zhǔn)備往回寫的時候,此刻,請求B正好要更新數(shù)據(jù),更新完了數(shù)據(jù)庫之后,又去把緩存更新了,那請求A再往緩存中寫的就是舊數(shù)據(jù)了,屬于臟數(shù)據(jù)。

那么 Cache Aside 模式就沒有臟數(shù)據(jù)問題了嗎?不是的,在極端情況下也可能會產(chǎn)生臟數(shù)據(jù),比如:

假如同時有2個請求,請求A和請求B,并發(fā)的執(zhí)行。請求A是要去讀數(shù)據(jù),請求B是要去寫數(shù)據(jù)。假如初始狀態(tài)緩存中沒有這個數(shù)據(jù),那請求A發(fā)現(xiàn)緩存中沒有數(shù)據(jù),就會去數(shù)據(jù)庫中讀數(shù)據(jù),讀到了數(shù)據(jù)準(zhǔn)備寫回緩存中,就在這個時候,請求B是要去寫數(shù)據(jù)的,請求B在寫完數(shù)據(jù)庫的數(shù)據(jù)之后,又去設(shè)置了緩存失效。這個時候,請求A由于在數(shù)據(jù)庫中讀到了之前的舊數(shù)據(jù),開始往緩存中寫數(shù)據(jù)了,此時寫進(jìn)入的就也是舊數(shù)據(jù)。那么最終就會導(dǎo)致,緩存中的數(shù)據(jù)與數(shù)據(jù)庫的數(shù)據(jù)不一致,造成了臟數(shù)據(jù)。

不過這種概率比上面一種概率要小很多。所以整體而言 Cache Aside 模式 還是一種比較簡單實用的方式。

2.Read/Write Through 模式

這個模式其實就是將 緩存服務(wù) 作為主要的存儲,應(yīng)用的所有讀寫請求都是直接與緩存服務(wù)打交道,而不管最后端的數(shù)據(jù)庫了,數(shù)據(jù)庫的數(shù)據(jù)由緩存服務(wù)來維護(hù)和更新。不過緩存中數(shù)據(jù)變更的時候是同步去更新數(shù)據(jù)庫的,在應(yīng)用的眼中只有緩存服務(wù)。

流程就相當(dāng)簡單了:

  • 應(yīng)用要讀數(shù)據(jù)和更新數(shù)據(jù)都直接訪問緩存服務(wù)

  • 緩存服務(wù)同步的將數(shù)據(jù)更新到數(shù)據(jù)庫

這個模式出現(xiàn)臟數(shù)據(jù)的概率就比較低,但是就強(qiáng)依賴緩存了,對緩存服務(wù)的穩(wěn)定性有較大要求,另外,增加新緩存節(jié)點時還會有初始狀態(tài)空數(shù)據(jù)問題。

3.Write Behind 模式

這個模式就是 Read/Write Through 模式 的一個變種。區(qū)別就是 Read/Write Through 模式的緩存寫數(shù)據(jù)庫的時候是同步的,而 Write Behind 模式 的緩存操作數(shù)據(jù)庫是異步的。

流程如下:

  • 應(yīng)用要讀數(shù)據(jù)和更新數(shù)據(jù)都直接訪問緩存服務(wù)

  • 緩存服務(wù)異步的將數(shù)據(jù)更新到數(shù)據(jù)庫(通過異步任務(wù))

這個模式的特點就是速度很快,效率會非常高,但是數(shù)據(jù)的一致性比較差,還可能會有數(shù)據(jù)的丟失情況,實現(xiàn)邏輯也較為復(fù)雜。

以上就是目前三種主流的緩存更新策略,另外還有Refrsh-Ahead模式等由于使用的不是很常見就不詳細(xì)介紹了。

二.緩存相關(guān)

1.緩存擊穿

緩存擊穿是指緩存中沒有但數(shù)據(jù)庫中有的數(shù)據(jù)(一般是緩存時間到期),這時由于并發(fā)用戶特別多,同時讀緩存沒讀到數(shù)據(jù),又同時去數(shù)據(jù)庫去取數(shù)據(jù),引起數(shù)據(jù)庫壓力瞬間增大,造成過大壓力
解決方案:

  • 設(shè)置熱點數(shù)據(jù)永遠(yuǎn)不過期。
  • 加互斥鎖,互斥鎖參考代碼如下:

2.緩存穿透

緩存穿透是指緩存和數(shù)據(jù)庫中都沒有的數(shù)據(jù),而用戶不斷發(fā)起請求,如發(fā)起為id為“-1”的數(shù)據(jù)或id為特別大不存在的數(shù)據(jù)。這時的用戶很可能是攻擊者,攻擊會導(dǎo)致數(shù)據(jù)庫壓力過大。
解決方案:

  • 布隆過濾器 接口層增加校驗,如用戶鑒權(quán)校驗,id做基礎(chǔ)校驗,id<=0的直接攔截;
  • 從緩存取不到的數(shù)據(jù),在數(shù)據(jù)庫中也沒有取到,這時也可以將key-value對寫為key-null,緩存有效時間可以設(shè)置短點,如30秒(設(shè)置太長會導(dǎo)致正常情況也沒法使用)。這樣可以防止攻擊用戶反復(fù)用同一個id暴力攻擊

3.緩存雪崩

緩存雪崩是指緩存中數(shù)據(jù)大批量到過期時間,而查詢數(shù)據(jù)量巨大,引起數(shù)據(jù)庫壓力過大甚至down機(jī)。和緩存擊穿不同的是, 緩存擊穿指并發(fā)查同一條數(shù)據(jù),緩存雪崩是不同數(shù)據(jù)都過期了,很多數(shù)據(jù)都查不到從而查數(shù)據(jù)庫。

解決方案:

  • 緩存數(shù)據(jù)的過期時間設(shè)置隨機(jī),防止同一時間大量數(shù)據(jù)過期現(xiàn)象發(fā)生。
  • 如果緩存數(shù)據(jù)庫是分布式部署,將熱點數(shù)據(jù)均勻分布在不同的緩存數(shù)據(jù)庫中。
  • 設(shè)置熱點數(shù)據(jù)永遠(yuǎn)不過期。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容