redis緩存介紹以及常見(jiàn)問(wèn)題淺析
沒(méi)緩存的日子

對(duì)于web來(lái)說(shuō),是用戶量和訪問(wèn)量支持項(xiàng)目技術(shù)的更迭和前進(jìn)。隨著服務(wù)用戶提升。可能會(huì)出現(xiàn)一下的一些狀況:
- 頁(yè)面并發(fā)量和訪問(wèn)量并不多,mysql
足以支撐自己邏輯業(yè)務(wù)的發(fā)展。那么其實(shí)可以不加緩存。最多對(duì)靜態(tài)頁(yè)面進(jìn)行緩存即可。 - 頁(yè)面的并發(fā)量顯著增多,數(shù)據(jù)庫(kù)有些壓力,并且有些數(shù)據(jù)更新頻率較低
反復(fù)被查詢或者查詢速度較慢。那么就可以考慮使用緩存技術(shù)優(yōu)化。對(duì)高命中的對(duì)象存到key-value形式的redis中,那么,如果數(shù)據(jù)被命中,那么可以省經(jīng)效率很低的db。從高效的redis中查找到數(shù)據(jù)。 - 當(dāng)然,可能還會(huì)遇到其他問(wèn)題,你可以需要靜態(tài)頁(yè)面本地緩存,cdn加速,甚至負(fù)載均衡這些方法提高系統(tǒng)并發(fā)量。這里就不做介紹。
緩存思想無(wú)處不在
我們從一個(gè)算法問(wèn)題開(kāi)始了解緩存的意義。
問(wèn)題1:
- 輸入一個(gè)數(shù)n(n<20),求
n!;
分析1:
- 單單考慮算法,不考慮數(shù)值越界問(wèn)題。 當(dāng)然我們知道
n!=n * (n-1) * (n-2) * ... * 1= n * (n-1)!; 那么我們可以用一個(gè)遞歸函數(shù)解決問(wèn)題。
static long jiecheng(int n)
{
if(n==1||n==0)return 1;
else {
return n*jiecheng(n-1);
}
}
這樣每輸入求一次需要執(zhí)行n次。 問(wèn)題2:
- 輸入t組數(shù)據(jù)(可能成百上千),每組一個(gè)x(n<20),求
x!;
分析2:
- 如果使用
遞歸,輸入t組數(shù)據(jù),每個(gè)位x,那么每次都要執(zhí)行 [圖片上傳失敗...(image-8bf557-1565769531992)]Xi
當(dāng)Xi過(guò)大或者n過(guò)大都會(huì)造成不小的負(fù)擔(dān)!時(shí)間復(fù)雜度為O(n2) - 那么能否換個(gè)思想的。沒(méi)錯(cuò)、是
打表(也可以理解位動(dòng)態(tài)規(guī)劃)。打表常用于ACM算法中,常用于解決多組輸入輸出、圖論搜索結(jié)果、路徑儲(chǔ)存問(wèn)題。那么,對(duì)于這個(gè)求階乘。我們只需要申請(qǐng)一個(gè)數(shù)組。每個(gè)數(shù)據(jù)為前一個(gè)數(shù)據(jù)*當(dāng)前index。那么思想很明確啦!
import java.util.Scanner;
public class test3 {
public static void main(String[] args) {
// TODO Auto-generated method stub
Scanner sc=new Scanner(System.in);
int t=sc.nextInt();
long jiecheng[]=new long[21];
jiecheng[0]=1;
for(int i=1;i<21;i++)
{
jiecheng[i]=jiecheng[i-1]*i;
}
for(int i=0;i<t;i++) {
int x=sc.nextInt();
System.out.println(jiecheng[x]);
}
}
}
- 時(shí)間復(fù)雜度才O(n)。這里的思想就和
緩存思想差不多。先將數(shù)據(jù)在jiecheng[21]數(shù)組中儲(chǔ)存。執(zhí)行一次計(jì)算。當(dāng)后面繼續(xù)訪問(wèn)的時(shí)候就相當(dāng)于當(dāng)問(wèn)靜態(tài)數(shù)組值。為O(1)。就能大大的減少查詢、執(zhí)行成本啦!
緩存的應(yīng)用場(chǎng)景
- 緩存適用于高并發(fā)的場(chǎng)景,提升服務(wù)容量。主要是將從
經(jīng)常被訪問(wèn)的數(shù)據(jù)或者查詢成本較高從慢的介質(zhì)中存到比較快的介質(zhì)中,比如從硬盤(pán)—>內(nèi)存。我們知道大多數(shù)關(guān)系數(shù)據(jù)庫(kù)是基于硬盤(pán)讀寫(xiě)的,其效率和資源有限,而redis等非關(guān)系型就是基于內(nèi)存存儲(chǔ)。其效率差別很大。當(dāng)然,緩存也分為本地緩存和服務(wù)端緩存,這里只講redis的服務(wù)端緩存。 - 舉個(gè)例子。例如如果一個(gè)接口sql查詢
需要2s。你每次查詢都會(huì)2s并且加載的時(shí)候都會(huì)等在,這個(gè)長(zhǎng)期等待給用戶的體驗(yàn)是非常糟糕的。而用戶能夠接受的往往是第一次的等待。如果你用了緩存技術(shù)。你第一次查詢放到redis里面。然后數(shù)據(jù)再?gòu)膔edis返回給你。后面當(dāng)你繼續(xù)訪問(wèn)這個(gè)數(shù)據(jù)的時(shí)候。查詢到redis中有備份,那么不需要通過(guò)db直接能從redis中獲取數(shù)據(jù)。那么,你想想,從一個(gè)key value的Nosql中取一個(gè)value能要多久呢! - 所以對(duì)于像樣的,有點(diǎn)規(guī)模的網(wǎng)站,緩存is
necessary的.redis也是必不可少的。并且服務(wù)端的緩存設(shè)計(jì)也是要根據(jù)業(yè)務(wù)有所區(qū)別的。也要防止占用內(nèi)存過(guò)大,redis雪崩等問(wèn)題。
需要注意的問(wèn)題
- 緩存使用不當(dāng)會(huì)帶來(lái)很多問(wèn)題。所以需要對(duì)一些細(xì)節(jié)進(jìn)行認(rèn)真考量和設(shè)計(jì)。筆者對(duì)于分布式的經(jīng)驗(yàn)并不是很豐富,就相對(duì)于筆者的眼中談?wù)劸彺嬖O(shè)計(jì)不好會(huì)帶來(lái)那些問(wèn)題。
是否用緩存
- 現(xiàn)在不少項(xiàng)目,為了緩存而緩存,然而緩存并不是適合所有場(chǎng)景,比如如果對(duì)
數(shù)據(jù)一致性要求極高,又或者數(shù)據(jù)頻繁更改而查詢并不多。有的可以不需要緩存。因?yàn)槿绻褂胷edis緩存多多少少可能會(huì)遇到數(shù)據(jù)一致性問(wèn)題。那你可以考慮使用redis做成分布式鎖去鎖sql的數(shù)據(jù)。同樣如果頻繁更新數(shù)據(jù),那么redis能起到的作用就僅僅是多了一層中轉(zhuǎn)站。反而浪費(fèi)資源。使得傳輸過(guò)程臃腫。
過(guò)期策略選擇
- 大部分場(chǎng)景
不適合緩存一致存在,首先,你的sql數(shù)據(jù)庫(kù)的內(nèi)容可能很多就不說(shuō)了,另外,返回給你的對(duì)象如果是完整的pojo對(duì)象還好,但是如果是使用不同參數(shù)各種關(guān)聯(lián)查詢出來(lái)的結(jié)果那么redis中會(huì)儲(chǔ)存太多冷數(shù)據(jù)。占用資源而得不到銷毀。我們學(xué)過(guò)操作系統(tǒng)也知道在計(jì)算機(jī)的緩存實(shí)現(xiàn)中有)先進(jìn)先出的算法(FIFO);最近最少使用算法(LRU);最佳淘汰算法(OPT);最少訪問(wèn)頁(yè)面算法(LFR)等磁盤(pán)調(diào)度算法。對(duì)于web開(kāi)發(fā)也可以借鑒。根據(jù)時(shí)間來(lái)的FIFO是最好實(shí)現(xiàn)的。因?yàn)閞edis在全局key支持過(guò)期策略。 - 而開(kāi)發(fā)中可能還會(huì)遇到
其他問(wèn)題。比如過(guò)期時(shí)間的選擇上,如果過(guò)久會(huì)導(dǎo)致數(shù)據(jù)聚集。而過(guò)少可能導(dǎo)致頻繁查詢數(shù)據(jù)庫(kù)甚至可能會(huì)導(dǎo)致緩存雪崩等問(wèn)題。 - 所以,過(guò)期策略一定要設(shè)置。并且對(duì)于
關(guān)鍵key一定要小心謹(jǐn)慎設(shè)計(jì)。
數(shù)據(jù)一致性問(wèn)題★
上面其實(shí)提到數(shù)據(jù)一致性問(wèn)題。如果對(duì)一致性要求極高那么不建議使用緩存。下面稍微梳理一下緩存的數(shù)據(jù)。 在redis緩存中經(jīng)常會(huì)遇到數(shù)據(jù)一致性問(wèn)題。對(duì)于一個(gè)緩存。下面羅列逼仄
讀
read:從redis中讀取,如果redis中沒(méi)有,那么就從mysql中獲取更新redis緩存。 該流程圖描述常規(guī)場(chǎng)景。一般沒(méi)啥爭(zhēng)議。

寫(xiě)1:先更新數(shù)據(jù)庫(kù),再更新緩存(普通低并發(fā))

- 更新數(shù)據(jù)庫(kù)信息,再更新redis緩存。這是常規(guī)做法,緩存基于數(shù)據(jù)庫(kù),取自數(shù)據(jù)庫(kù)。但是其中可能遇到一些問(wèn)題。例如上述如果更新緩存失敗(宕機(jī)等其他狀況),將會(huì)使得數(shù)據(jù)庫(kù)和redis
數(shù)據(jù)不一致。造成DB新數(shù)據(jù),緩存舊數(shù)據(jù)。
寫(xiě)2:先刪除緩存,再寫(xiě)入數(shù)據(jù)庫(kù)(低并發(fā)優(yōu)化)

解決的問(wèn)題
- 這種情況能夠有效避免寫(xiě)1中防止寫(xiě)入redis失敗的問(wèn)題。將緩存刪除進(jìn)行更新。理想是讓下次訪問(wèn)redis為空去
mysql取得最新值到緩存中。但是這種情況僅限于低并發(fā)的場(chǎng)景中而不適用高并發(fā)場(chǎng)景。
存在的問(wèn)題
- 寫(xiě)2雖然能夠看似寫(xiě)入redis異常的問(wèn)題??此戚^為好的解決方案但是在高并發(fā)的方案中其實(shí)還是有問(wèn)題的。我們?cè)趯?xiě)1討論過(guò)如果更新庫(kù)成功,緩存更新失敗會(huì)導(dǎo)致臟數(shù)據(jù)。我們理想是刪除緩存讓下一個(gè)線程訪問(wèn)適合更新緩存。問(wèn)題是:如果這下一個(gè)線程來(lái)的太早、太巧了呢?

- 因?yàn)槎嗑€程你也不知道誰(shuí)先誰(shuí)后,誰(shuí)快誰(shuí)慢。如上圖所示情況,將會(huì)出現(xiàn)redis緩存數(shù)據(jù)和mysql不一致。當(dāng)然你可以對(duì)key進(jìn)行
上鎖。但是鎖這種重量級(jí)的東西對(duì)并發(fā)功能影響太大,能不用鎖就別用!上述情況就高并發(fā)下依然會(huì)造成緩存是舊數(shù)據(jù),DB是新數(shù)據(jù)。并且如果緩存沒(méi)有過(guò)期這個(gè)問(wèn)題會(huì)一致存在。
寫(xiě)3:延時(shí)雙刪策略

- 這個(gè)就是延時(shí)雙刪策略,能過(guò)緩解在寫(xiě)2中在更新mysql過(guò)程中有讀的線程進(jìn)入造成redis緩存與mysql數(shù)據(jù)不一致。方法就是
刪除緩存->更新緩存->延時(shí)(幾百ms)(可異步)再次刪除緩存。即使在更新緩存途中發(fā)生寫(xiě)2的問(wèn)題。造成數(shù)據(jù)不一致,但是延時(shí)(具體實(shí)間根據(jù)業(yè)務(wù)來(lái),一般幾百ms)再次刪除也能很快的解決不一致。 - 但是就寫(xiě)的方案其實(shí)還是有漏洞的,比如
第二次刪除錯(cuò)誤、多寫(xiě)多讀高并發(fā)情況下對(duì)mysql訪問(wèn)的壓力等等。當(dāng)然你可以選擇用mq等消息隊(duì)列異步解決。其實(shí)實(shí)際的解決很難顧及到萬(wàn)無(wú)一失,所以不少大佬在設(shè)計(jì)這一環(huán)節(jié)可能會(huì)因?yàn)?code>一些紕漏會(huì)被噴。作為菜菜的筆者在這里就更不獻(xiàn)丑了,策略只是提供大綱,具體設(shè)計(jì)還是需要自己團(tuán)隊(duì)實(shí)踐和摸索。并且也對(duì)一致性的要求級(jí)別有所區(qū)別。
寫(xiě)4:直接操作緩存,定期寫(xiě)入sql(適合高并發(fā))
- 當(dāng)有
一堆并發(fā)(寫(xiě))扔過(guò)來(lái)的后,前面幾個(gè)方案即使使用消息隊(duì)列異步通信但也很難給用戶一個(gè)舒適的體驗(yàn)。并且對(duì)大規(guī)模操作sql對(duì)系統(tǒng)也會(huì)造成不小的壓力。所以還有一種方案就是直接操作緩存,將緩存定期寫(xiě)入sql。因?yàn)閞edis這種非關(guān)系數(shù)據(jù)庫(kù)又基于內(nèi)存操作KV相比傳統(tǒng)關(guān)系型要快很多(找值最多多碰撞幾次)。
[圖片上傳失敗...(image-521252-1565770519509)]
- 上面適用于高并發(fā)情況下業(yè)務(wù)設(shè)計(jì),這個(gè)時(shí)候以redis數(shù)據(jù)為主,mysql數(shù)據(jù)為輔助。定期插入(好像數(shù)據(jù)備份庫(kù)一樣)。當(dāng)然,這種高并發(fā)往往會(huì)因?yàn)闃I(yè)務(wù)對(duì)
讀、寫(xiě)的順序等等可能有不同要求,可能還要借助消息隊(duì)列以及鎖完成針對(duì)業(yè)務(wù)上對(duì)數(shù)據(jù)和順序可能會(huì)因?yàn)?code>高并發(fā)、多線程帶來(lái)的不確定性和不穩(wěn)定性。提高業(yè)務(wù)可靠性。
總之,越是高并發(fā)、越是對(duì)數(shù)據(jù)一致性要求高的方案在數(shù)據(jù)一致性的設(shè)計(jì)方案需要考慮和顧及的越復(fù)雜、越多。上述也是筆者針對(duì)redis數(shù)據(jù)一致性問(wèn)題的學(xué)習(xí)和自我發(fā)散(胡扯)學(xué)習(xí)。如果有解釋理解不合理或者還請(qǐng)聯(lián)系告知!
緩存穿透、緩存雪崩和緩存擊穿
如果不了解,可能對(duì)這幾個(gè)概念都不了解,聽(tīng)著感覺(jué)太高大上,至少筆者剛開(kāi)始是這么覺(jué)得,本文并不是詳細(xì)介紹如何解決和完美解決,更主要的是認(rèn)識(shí)和認(rèn)知吧。
redis緩存穿透

理解
- 重在
穿透吧,也就是訪問(wèn)透過(guò)redis直接經(jīng)過(guò)mysql,通常是一個(gè)不存在的key,在數(shù)據(jù)庫(kù)查詢?yōu)?code>null。每次請(qǐng)求落在數(shù)據(jù)庫(kù)、并且高并發(fā)。數(shù)據(jù)庫(kù)扛不住會(huì)掛掉。
解決方案
- 可以將查到的null設(shè)成該key的緩存對(duì)象。
- 當(dāng)然,也可以根據(jù)明顯錯(cuò)誤的key在邏輯層就就行
驗(yàn)證。 - 同時(shí),你也可以分析用戶行為,是否為故意請(qǐng)求或者爬蟲(chóng)、攻擊者。針對(duì)用戶訪問(wèn)做限制。
- 其他等等,比如看到其他人用布隆過(guò)濾器(超大型hashmap)過(guò)濾。
redis緩存雪崩
理解
- 雪崩,就是某東西蜂擁而至的意思,像雪崩一樣。在這里,就是redis緩存集體大規(guī)模集體失效,在高并發(fā)情況下突然使得key大規(guī)模訪問(wèn)mysql,使得數(shù)據(jù)庫(kù)崩掉??梢韵胂笙聡?guó)家人口老年化。以后那天人集中在70-80歲,就沒(méi)人干活了。國(guó)家勞動(dòng)力就造成壓力。

解決方案
- 通常的解決方案是將key的過(guò)期時(shí)間后面加上一個(gè)
隨機(jī)數(shù),讓key均勻的失效。 - 考慮用隊(duì)列或者鎖讓程序執(zhí)行在壓力范圍之內(nèi),當(dāng)然這種方案可能會(huì)影響并發(fā)量。
redis緩存擊穿
理解

- 擊穿和穿透不同,穿透的意思是想法
繞過(guò)redis去使得數(shù)據(jù)庫(kù)崩掉。而擊穿你可以理解為正面剛擊穿,這種通常為大量并發(fā)對(duì)一個(gè)key進(jìn)行大規(guī)模的讀寫(xiě)操作。這個(gè)key在緩存失效期間大量請(qǐng)求數(shù)據(jù)庫(kù),對(duì)數(shù)據(jù)庫(kù)造成太大壓力使得數(shù)據(jù)庫(kù)崩掉。就比如在秒殺場(chǎng)景下10000塊錢(qián)的mac和100塊的mac這個(gè)100塊的那個(gè)訂單肯定會(huì)被搶到爆。所以緩存擊穿就是針對(duì)某個(gè)常用key大量請(qǐng)求導(dǎo)致數(shù)據(jù)庫(kù)崩潰。
解決方案
- 能夠達(dá)到這種場(chǎng)景的公司其實(shí)不多,我也不清楚他們的具體處理方法,但是一個(gè)鎖攔截請(qǐng)求總是能防止數(shù)據(jù)庫(kù)崩掉吧。
總結(jié)與感悟
其實(shí)緩存看起來(lái),理解起來(lái)看似簡(jiǎn)單然而實(shí)際上的設(shè)計(jì)方案非常有學(xué)問(wèn)。在細(xì)節(jié)設(shè)計(jì)上還會(huì)遇到消息隊(duì)列、布隆過(guò)濾器、分布式鎖、服務(wù)降級(jí)、熔斷、分流這些。在緩存處理上甚至還有緩存預(yù)熱(提前緩存部分熱點(diǎn)數(shù)據(jù)防止剛開(kāi)始緩存全部命中導(dǎo)致服務(wù)崩掉)等其他熱門(mén)名詞和問(wèn)題這里就不做介紹了。