青青青在线播放,曰曰爱99

轉載:緩存穿透、緩存并發(fā)、熱點緩存之最佳招式

一、前言

我們在用緩存的時候，不管是Redis或者Memcached，基本上會通用遇到以下三個問題：

緩存穿透

緩存并發(fā)

緩存失效

緩存穿透

注：

上面三個圖會有什么問題呢？

我們在項目中使用緩存通常都是先檢查緩存中是否存在，如果存在直接返回緩存內容，如果不存在就直接查詢數(shù)據(jù)庫然后再緩存查詢結果返回。這個時候如果我們查詢的某一個數(shù)據(jù)在緩存中一直不存在，就會造成每一次請求都查詢DB，這樣緩存就失去了意義，在流量大時，可能DB就掛掉了。那這種問題有什么好辦法解決呢？

要是有人利用不存在的key頻繁攻擊我們的應用，這就是漏洞。

有一個比較巧妙的作法是，可以將這個不存在的key預先設定一個值。

比如，"key" , “&&”。

在返回這個&&值的時候，我們的應用就可以認為這是不存在的key，那我們的應用就可以決定是否繼續(xù)等待繼續(xù)訪問，還是放棄掉這次操作。如果繼續(xù)等待訪問，過一個時間輪詢點后，再次請求這個key，如果取到的值不再是&&，則可以認為這時候key有值了，從而避免了透傳到數(shù)據(jù)庫，從而把大量的類似請求擋在了緩存之中。

緩存并發(fā)

有時候如果網(wǎng)站并發(fā)訪問高，一個緩存如果失效，可能出現(xiàn)多個進程同時查詢DB，同時設置緩存的情況，如果并發(fā)確實很大，這也可能造成DB壓力過大，還有緩存頻繁更新的問題。

我現(xiàn)在的想法是對緩存查詢加鎖，如果KEY不存在，就加鎖，然后查DB入緩存，然后解鎖；其他進程如果發(fā)現(xiàn)有鎖就等待，然后等解鎖后返回數(shù)據(jù)或者進入DB查詢。

這種情況和剛才說的預先設定值問題有些類似，只不過利用鎖的方式，會造成部分請求等待。

緩存失效

引起這個問題的主要原因還是高并發(fā)的時候，平時我們設定一個緩存的過期時間時，可能有一些會設置1分鐘啊，5分鐘這些，并發(fā)很高時可能會出在某一個時間同時生成了很多的緩存，并且過期時間都一樣，這個時候就可能引發(fā)一當過期時間到后，這些緩存同時失效，請求全部轉發(fā)到DB，DB可能會壓力過重。

那如何解決這些問題呢？

其中的一個簡單方案就時講緩存失效時間分散開，比如我們可以在原有的失效時間基礎上增加一個隨機值，比如1-5分鐘隨機，這樣每一個緩存的過期時間的重復率就會降低，就很難引發(fā)集體失效的事件。

我們討論的第二個問題時針對同一個緩存，第三個問題時針對很多緩存。

總結來看：

緩存穿透：查詢一個必然不存在的數(shù)據(jù)。比如文章表，查詢一個不存在的id，每次都會訪問DB，如果有人惡意破壞，很可能直接對DB造成影響。

緩存失效：如果緩存集中在一段時間內失效，DB的壓力凸顯。這個沒有完美解決辦法，但可以分析用戶行為，盡量讓失效時間點均勻分布。

當發(fā)生大量的緩存穿透，例如對某個失效的緩存的大并發(fā)訪問就造成了緩存雪崩。

問題匯總

問題1：

如何解決DB和緩存一致性問題？

答：當修改了數(shù)據(jù)庫后，有沒有及時修改緩存。這種問題，以前有過實踐，修改數(shù)據(jù)庫成功，而修改緩存失敗的情況，最主要就是緩存服務器掛了。而因為網(wǎng)絡問題引起的沒有及時更新，可以通過重試機制來解決。而緩存服務器掛了，請求首先自然也就無法到達，從而直接訪問到數(shù)據(jù)庫。那么我們在修改數(shù)據(jù)庫后，無法修改緩存，這時候可以將這條數(shù)據(jù)放到數(shù)據(jù)庫中，同時啟動一個異步任務定時去檢測緩存服務器是否連接成功，一旦連接成功則從數(shù)據(jù)庫中按順序取出修改數(shù)據(jù)，依次進行緩存最新值的修改。

問題2：

問下緩存穿透那塊！例如，一個用戶查詢文章，通過ID查詢，按照之前說的，是將緩存的KEY預先設置一個值，，如果通過ID插過來，發(fā)現(xiàn)是預先設定的一個值，比如說是“&&”，那之后的繼續(xù)等待訪問是什么意思，這個ID什么時候會真正被附上用戶所需要的值呢？

答：我剛說的主要是咱們常用的后面配置，前臺獲取的場景。前臺無法獲取相應的key，則等待，或者放棄。當在后臺配置界面上配置了相關key和value之后，那么以前的key &&也自然會被替換掉。你說的那種情況，自然也應該會有一個進程會在某一個時刻，在緩存中設置這個ID，再有新的請求到達的時候，就會獲取到最新的ID和value。

問題3：

其實用redis的話，那天看到一個不錯的例子，雙key，有一個當時生成的一個附屬key來標識數(shù)據(jù)修改到期時間，然后快到的時候去重新加載數(shù)據(jù)，如果覺得key多可以把結束時間放到主key中，附屬key起到鎖的功能。

答：這種方案，之前我們實踐過。這種方案會產(chǎn)生雙份數(shù)據(jù)，而且需要同時控制附屬key與key之間的關系，操作上有一定復雜度。

問題4：

多級緩存是什么概念呢？

答：多級緩存就像我今天之前給大家發(fā)的文章里面提到了，將ehcache與redis做二級緩存，就像我之前寫的文章 http://www.itdecent.cn/p/2cd6ad416a5a 提到過的。但同樣會存在一致性問題，如果我們需要強一致性的話，緩存與數(shù)據(jù)庫同步是會存在時間差的，所以我們在具體開發(fā)的過程中，一定要根據(jù)場景來具體分析，二級緩存更多的解決是，緩存穿透與程序的健壯性，當集中式緩存出現(xiàn)問題的時候，我們的應用能夠繼續(xù)運行。

說明：本文中提到的緩存可以理解為Redis。

二、緩存穿透與并發(fā)方案

上文中介紹了關于緩存穿透、并發(fā)的一些常用思路，但是沒有明確一些思路的使用場景，下面繼續(xù)深入探討。相信不少朋友之前看過很多類似的文章，但是歸根結底就是二個問題：

如何解決穿透

如何解決并發(fā)

當并發(fā)較高的時候，其實我是不建議使用緩存過期這個策略的，我更希望緩存一直存在，通過后臺系統(tǒng)來更新緩存系統(tǒng)中的數(shù)據(jù)達到數(shù)據(jù)的一致性目的，有的朋友可能會質疑，如果緩存系統(tǒng)掛了怎么辦，這樣數(shù)據(jù)庫更新了但是緩存沒有更新，沒有達到一致性的狀態(tài)。

解決問題的思路是：如果緩存是因為網(wǎng)絡問題沒有更新成功數(shù)據(jù)，那么建議重試幾次，如果依然沒有更新成功則認為緩存系統(tǒng)出錯不可用，這時候客戶端會將數(shù)據(jù)的KEY插入到消息系統(tǒng)中，消息系統(tǒng)可以過濾相同的KEY，只需保證消息系統(tǒng)不存在相同的KEY，當緩存系統(tǒng)恢復可用的時候，依次從mq中取出KEY值然后從數(shù)據(jù)庫中讀取最新的數(shù)據(jù)更新緩存。注意：更新緩存之前，緩存中依然有舊數(shù)據(jù)，所以不會造成緩存穿透。

下圖展示了整個思路的過程：

看完上面的方案以后，又會有不少朋友提出疑問，如果我是第一次使用緩存或者緩存中暫時沒有我需要的數(shù)據(jù)，那又該如何處理呢？

解決問題的思路：在這種場景下，客戶端從緩存中根據(jù)KEY讀取數(shù)據(jù)，如果讀到了數(shù)據(jù)則流程結束，如果沒有讀到數(shù)據(jù)（可能會有多個并發(fā)都沒有讀到數(shù)據(jù)），這時候使用緩存系統(tǒng)中的setNX方法設置一個值（這種方法類似加個鎖），沒有設置成功的請求則sleep一段時間，設置成功的請求讀取數(shù)據(jù)庫獲取值，如果獲取到則更新緩存，流程結束，之前sleep的請求這時候喚醒后直接再從緩存中讀取數(shù)據(jù)，此時流程結束。

在看完這個流程后，我想這里面會有一個漏洞，如果數(shù)據(jù)庫中沒有我們需要的數(shù)據(jù)該怎么處理，如果不處理則請求會造成死循環(huán)，不斷的在緩存和數(shù)據(jù)庫中查詢，這時候我們會沿用我之前文章中的如果沒有讀到數(shù)據(jù)則往緩存中插入一個NULL字符串的思路，這樣其他請求直接就可以根據(jù)“NULL”進行處理，直到后臺系統(tǒng)在數(shù)據(jù)庫成功插入數(shù)據(jù)后同步更新清理NULL數(shù)據(jù)和更新緩存。

流程圖如下所示：

總結：在實際工作中，我們往往將上面二個方案組合使用才能達到最佳效果，雖然第二種方案也會造成請求阻塞，但是只是在第一次使用或者緩存暫時沒有數(shù)據(jù)的情況下才會產(chǎn)生，在生產(chǎn)中經(jīng)過檢驗在TPS沒有上萬的情況下是不會造成問題的。

三、熱點緩存解決方案

1、緩存使用背景：

我們拿用戶中心的一個案例來說明：每個用戶都會首先獲取自己的用戶信息，然后再進行其他相關的操作，有可能會有如下一些場景情況：

會有大量相同用戶重復訪問該項目。

會有同一用戶頻繁訪問同一模塊。

2、思路解析

因為用戶本身是不固定的而且用戶數(shù)量也有幾百萬尤其上千萬，我們不可能把所有的用戶信息全部緩存起來，通過第一個場景情況可以看到一些規(guī)律，那就是有大量的相同用戶重復訪問，但是究竟是哪些用戶重復訪問我們也并不知道。

如果有一個用戶頻繁刷新讀取項目，那么對數(shù)據(jù)庫本身也會造成較大壓力，當然我們也會有相關的保護機制來確實惡意攻擊，可以從前端控制，也可以有采黑名單等機制，這里不在贅述。如果用緩存的話，我們又該如何控制同一用戶繁重讀取用戶信息呢。

請看下圖：

我們會通過緩存系統(tǒng)做一個排序隊列，比如1000個用戶，系統(tǒng)會根據(jù)用戶的訪問時間更新用戶信息的時間，越是最近訪問的用戶排名越排前，系統(tǒng)會定期過濾掉排名最后的200個用戶，然后再從數(shù)據(jù)庫中隨機取出200個用戶加入隊列，這樣請求每次到達的時候，會先從隊列中獲取用戶信息，如果命中則根據(jù)userId，再從另一個緩存數(shù)據(jù)結構中讀取用戶信息，如果沒有命中則說明該用戶請求頻率不高。

JAVA偽代碼如下所示：

for (int i = 0; i < times; i++) {

? ? user = new ExternalUser();

? ? user.setId(i+"");

? ? user.setUpdateTime(new Date(System.currentTimeMillis()));

? ? CacheUtil.zadd(sortKey, user.getUpdateTime().getTime(), user.getId());

? ? CacheUtil.putAndThrowError(userKey+user.getId(), JSON.toJSONString(user));

}

Set userSet = CacheUtil.zrange(sortKey, 0, -1);

System.out.println("[sortedSet] - " + JSON.toJSONString(userSet) );

if(userSet == null || userSet.size() == 0)

? ? return;

Set userSetS = CacheUtil.zrangeWithScores(sortKey, 0, -1);

StringBuffer sb = new StringBuffer();

for(Tuple t:userSetS){

? ? sb.append("{member: ").append(t.getElement()).append(", score: ").append(t.getScore()).append("}, ");

}

System.out.println("[sortedcollect] - " + sb.toString().substring(0, sb.length() - 2));

Set members = new HashSet();

for(String uid:userSet){

? ? String key = userKey + uid;

? ? members.add(uid);

? ? ExternalUser user2 = CacheUtil.getObject(key, ExternalUser.class);

? ? System.out.println("[user] - " + JSON.toJSONString(user2) );

}

System.out.println("[user] - " ?+ System.currentTimeMillis());

String[] keys = new String[members.size()];

members.toArray(keys);

Long rem = CacheUtil.zrem(sortKey, keys);

System.out.println("[rem] - " + rem);

userSet = CacheUtil.zrange(sortKey, 0, -1);

System.out.println("[remove - sortedSet] - " + JSON.toJSONString(userSet));

作者：小程故事多原文：http://www.itdecent.cn/p/d96906140199

新書推薦：《深入分布式緩存：從原理到實踐》

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

緩存穿透、緩存并發(fā)、熱點緩存之最佳招式

緩存穿透、緩存并發(fā)、熱點緩存之最佳招式

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

緩存穿透、緩存并發(fā)、熱點緩存之最佳招式

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

緩存穿透、緩存并發(fā)、熱點緩存之最佳招式