課程大綱
1、RDB和AOF兩種持久化機(jī)制的介紹
2、RDB持久化機(jī)制的優(yōu)點(diǎn)
3、RDB持久化機(jī)制的缺點(diǎn)
4、AOF持久化機(jī)制的優(yōu)點(diǎn)
5、AOF持久化機(jī)制的缺點(diǎn)
6、RDB和AOF到底該如何選擇
我們已經(jīng)知道對于一個(gè)企業(yè)級的redis架構(gòu)來說,持久化是不可減少的
企業(yè)級redis集群架構(gòu):海量數(shù)據(jù)、高并發(fā)、高可用
持久化主要是做災(zāi)難恢復(fù),數(shù)據(jù)恢復(fù),也可以歸類到高可用的一個(gè)環(huán)節(jié)里面去
比如你redis整個(gè)掛了,然后redis就不可用了,你要做的事情是讓redis變得可用,盡快變得可用
重啟redis,盡快讓它對外提供服務(wù),但是就像上一講說,如果你沒做數(shù)據(jù)備份,這個(gè)時(shí)候redis啟動(dòng)了,也不可用啊,數(shù)據(jù)都沒了
很可能說,大量的請求過來,緩存全部無法命中,在redis里根本找不到數(shù)據(jù),這個(gè)時(shí)候就死定了,緩存雪崩問題,所有請求,沒有在redis命中,就會(huì)去mysql數(shù)據(jù)庫這種數(shù)據(jù)源頭中去找,一下子mysql承接高并發(fā),然后就掛了
mysql掛掉,你都沒法去找數(shù)據(jù)恢復(fù)到redis里面去,redis的數(shù)據(jù)從哪兒來?從mysql來。。。
具體的完整的緩存雪崩的場景,還有企業(yè)級的解決方案,到后面講
如果你把redis的持久化做好,備份和恢復(fù)方案做到企業(yè)級的程度,那么即使你的redis故障了,也可以通過備份數(shù)據(jù),快速恢復(fù),一旦恢復(fù)立即對外提供服務(wù)
redis的持久化,跟高可用,是有關(guān)系的,企業(yè)級redis架構(gòu)中去講解
redis持久化:RDB,AOF
1、RDB和AOF兩種持久化機(jī)制的介紹
RDB持久化機(jī)制,對redis中的數(shù)據(jù)執(zhí)行周期性的持久化
AOF機(jī)制對每條寫入命令作為日志,以append-only的模式寫入一個(gè)日志文件中,在redis重啟的時(shí)候,可以通過回放AOF日志中的寫入指令來重新構(gòu)建整個(gè)數(shù)據(jù)集
如果我們想要redis僅僅作為純內(nèi)存的緩存來用,那么可以禁止RDB和AOF所有的持久化機(jī)制
通過RDB或AOF,都可以將redis內(nèi)存中的數(shù)據(jù)給持久化到磁盤上面來,然后可以將這些數(shù)據(jù)備份到別的地方去,比如說阿里云,云服務(wù)
如果redis掛了,服務(wù)器上的內(nèi)存和磁盤上的數(shù)據(jù)都丟了,可以從云服務(wù)上拷貝回來之前的數(shù)據(jù),放到指定的目錄中,然后重新啟動(dòng)redis,redis就會(huì)自動(dòng)根據(jù)持久化數(shù)據(jù)文件中的數(shù)據(jù),去恢復(fù)內(nèi)存中的數(shù)據(jù),繼續(xù)對外提供服務(wù)
如果同時(shí)使用RDB和AOF兩種持久化機(jī)制,那么在redis重啟的時(shí)候,會(huì)使用AOF來重新構(gòu)建數(shù)據(jù),因?yàn)锳OF中的數(shù)據(jù)更加完整
2、RDB持久化機(jī)制的優(yōu)點(diǎn)
(1)RDB會(huì)生成多個(gè)數(shù)據(jù)文件,每個(gè)數(shù)據(jù)文件都代表了某一個(gè)時(shí)刻中redis的數(shù)據(jù),這種多個(gè)數(shù)據(jù)文件的方式,非常適合做冷備,可以將這種完整的數(shù)據(jù)文件發(fā)送到一些遠(yuǎn)程的安全存儲(chǔ)上去,比如說Amazon的S3云服務(wù)上去,在國內(nèi)可以是阿里云的ODPS分布式存儲(chǔ)上,以預(yù)定好的備份策略來定期備份redis中的數(shù)據(jù)
RDB也可以做冷備,生成多個(gè)文件,每個(gè)文件都代表了某一個(gè)時(shí)刻的完整的數(shù)據(jù)快照
AOF也可以做冷備,只有一個(gè)文件,但是你可以,每隔一定時(shí)間,去copy一份這個(gè)文件出來
RDB做冷備,優(yōu)勢在哪兒呢?由redis去控制固定時(shí)長生成快照文件的事情,比較方便; AOF,還需要自己寫一些腳本去做這個(gè)事情,各種定時(shí)
RDB數(shù)據(jù)做冷備,在最壞的情況下,提供數(shù)據(jù)恢復(fù)的時(shí)候,速度比AOF快
(2)RDB對redis對外提供的讀寫服務(wù),影響非常小,可以讓redis保持高性能,因?yàn)閞edis主進(jìn)程只需要fork一個(gè)子進(jìn)程,讓子進(jìn)程執(zhí)行磁盤IO操作來進(jìn)行RDB持久化即可
RDB,每次寫,都是直接寫redis內(nèi)存,只是在一定的時(shí)候,才會(huì)將數(shù)據(jù)寫入磁盤中
AOF,每次都是要寫文件的,雖然可以快速寫入os cache中,但是還是有一定的時(shí)間開銷的,速度肯定比RDB略慢一些
(3)相對于AOF持久化機(jī)制來說,直接基于RDB數(shù)據(jù)文件來重啟和恢復(fù)redis進(jìn)程,更加快速
AOF,存放的指令日志,做數(shù)據(jù)恢復(fù)的時(shí)候,其實(shí)是要回放和執(zhí)行所有的指令日志,來恢復(fù)出來內(nèi)存中的所有數(shù)據(jù)的
RDB,就是一份數(shù)據(jù)文件,恢復(fù)的時(shí)候,直接加載到內(nèi)存中即可
結(jié)合上述優(yōu)點(diǎn),RDB特別適合做冷備份,冷備
3、RDB持久化機(jī)制的缺點(diǎn)
(1)如果想要在redis故障時(shí),盡可能少的丟失數(shù)據(jù),那么RDB沒有AOF好。一般來說,RDB數(shù)據(jù)快照文件,都是每隔5分鐘,或者更長時(shí)間生成一次,這個(gè)時(shí)候就得接受一旦redis進(jìn)程宕機(jī),那么會(huì)丟失最近5分鐘的數(shù)據(jù)
這個(gè)問題,也是rdb最大的缺點(diǎn),就是不適合做第一優(yōu)先的恢復(fù)方案,如果你依賴RDB做第一優(yōu)先恢復(fù)方案,會(huì)導(dǎo)致數(shù)據(jù)丟失的比較多
(2)RDB每次在fork子進(jìn)程來執(zhí)行RDB快照數(shù)據(jù)文件生成的時(shí)候,如果數(shù)據(jù)文件特別大,可能會(huì)導(dǎo)致對客戶端提供的服務(wù)暫停數(shù)毫秒,或者甚至數(shù)秒
一般不要讓RDB的間隔太長,否則每次生成的RDB文件太大了,對redis本身的性能可能會(huì)有影響的
4、AOF持久化機(jī)制的優(yōu)點(diǎn)
(1)AOF可以更好的保護(hù)數(shù)據(jù)不丟失,一般AOF會(huì)每隔1秒,通過一個(gè)后臺線程執(zhí)行一次fsync操作,最多丟失1秒鐘的數(shù)據(jù)
每隔1秒,就執(zhí)行一次fsync操作,保證os cache中的數(shù)據(jù)寫入磁盤中
redis進(jìn)程掛了,最多丟掉1秒鐘的數(shù)據(jù)
(2)AOF日志文件以append-only模式寫入,所以沒有任何磁盤尋址的開銷,寫入性能非常高,而且文件不容易破損,即使文件尾部破損,也很容易修復(fù)
(3)AOF日志文件即使過大的時(shí)候,出現(xiàn)后臺重寫操作,也不會(huì)影響客戶端的讀寫。因?yàn)樵趓ewrite log的時(shí)候,會(huì)對其中的指導(dǎo)進(jìn)行壓縮,創(chuàng)建出一份需要恢復(fù)數(shù)據(jù)的最小日志出來。再創(chuàng)建新日志文件的時(shí)候,老的日志文件還是照常寫入。當(dāng)新的merge后的日志文件ready的時(shí)候,再交換新老日志文件即可。
(4)AOF日志文件的命令通過非??勺x的方式進(jìn)行記錄,這個(gè)特性非常適合做災(zāi)難性的誤刪除的緊急恢復(fù)。比如某人不小心用flushall命令清空了所有數(shù)據(jù),只要這個(gè)時(shí)候后臺rewrite還沒有發(fā)生,那么就可以立即拷貝AOF文件,將最后一條flushall命令給刪了,然后再將該AOF文件放回去,就可以通過恢復(fù)機(jī)制,自動(dòng)恢復(fù)所有數(shù)據(jù)
5、AOF持久化機(jī)制的缺點(diǎn)
(1)對于同一份數(shù)據(jù)來說,AOF日志文件通常比RDB數(shù)據(jù)快照文件更大
(2)AOF開啟后,支持的寫QPS會(huì)比RDB支持的寫QPS低,因?yàn)锳OF一般會(huì)配置成每秒fsync一次日志文件,當(dāng)然,每秒一次fsync,性能也還是很高的
如果你要保證一條數(shù)據(jù)都不丟,也是可以的,AOF的fsync設(shè)置成沒寫入一條數(shù)據(jù),fsync一次,那就完蛋了,redis的QPS大降
(3)以前AOF發(fā)生過bug,就是通過AOF記錄的日志,進(jìn)行數(shù)據(jù)恢復(fù)的時(shí)候,沒有恢復(fù)一模一樣的數(shù)據(jù)出來。所以說,類似AOF這種較為復(fù)雜的基于命令日志/merge/回放的方式,比基于RDB每次持久化一份完整的數(shù)據(jù)快照文件的方式,更加脆弱一些,容易有bug。不過AOF就是為了避免rewrite過程導(dǎo)致的bug,因此每次rewrite并不是基于舊的指令日志進(jìn)行merge的,而是基于當(dāng)時(shí)內(nèi)存中的數(shù)據(jù)進(jìn)行指令的重新構(gòu)建,這樣健壯性會(huì)好很多。
(4)唯一的比較大的缺點(diǎn),其實(shí)就是做數(shù)據(jù)恢復(fù)的時(shí)候,會(huì)比較慢,還有做冷備,定期的備份,不太方便,可能要自己手寫復(fù)雜的腳本去做,做冷備不太合適
6、RDB和AOF到底該如何選擇
(1)不要僅僅使用RDB,因?yàn)槟菢訒?huì)導(dǎo)致你丟失很多數(shù)據(jù)
(2)也不要僅僅使用AOF,因?yàn)槟菢佑袃蓚€(gè)問題,第一,你通過AOF做冷備,沒有RDB做冷備,來的恢復(fù)速度更快; 第二,RDB每次簡單粗暴生成數(shù)據(jù)快照,更加健壯,可以避免AOF這種復(fù)雜的備份和恢復(fù)機(jī)制的bug
(3)綜合使用AOF和RDB兩種持久化機(jī)制,用AOF來保證數(shù)據(jù)不丟失,作為數(shù)據(jù)恢復(fù)的第一選擇; 用RDB來做不同程度的冷備,在AOF文件都丟失或損壞不可用的時(shí)候,還可以使用RDB來進(jìn)行快速的數(shù)據(jù)恢復(fù)
