課程大綱
1、Redis持久化的意義
2、如何應(yīng)對故障的發(fā)生
3、持久化方式-RDB
4、持久化方式-AOF
5、RDB持久化機制的優(yōu)點與缺點
6、AOF持久化機制的優(yōu)點與缺點
7、RDB和AOF到底該如何選擇
1、Redis持久化的意義
redis持久化的意義,在于故障恢復(fù)
2、如何應(yīng)對故障的發(fā)生
常見的故障如下圖所示:

image.png
1.比如你部署了一個redis,作為cache緩存,當(dāng)然也可以保存一些較為重要的數(shù)據(jù)
2.如果沒有持久化的話,redis遇到災(zāi)難性故障的時候,就會丟失所有的數(shù)據(jù)
3.如果通過持久化將數(shù)據(jù)搞一份兒在磁盤上去,然后定期比如說同步和備份到一些云存儲服務(wù)上去,那么就可以保證數(shù)據(jù)不丟失全部,還是可以恢復(fù)一部分數(shù)據(jù)回來的
3、持久化方式-RDB
RDB 持久化方式如下圖所示:

image.png
RDB持久化機制,對redis中的數(shù)據(jù)執(zhí)行周期性的持久化.
4、持久化方式-AOF
AOF 持久化方式如下圖所示:

image.png
AOF機制對每條寫入命令作為日志,以append-only的模式寫入一個日志文件中,在redis重啟的時候,可以通過回放AOF日志中的寫入指令來重新構(gòu)建整個數(shù)據(jù)集
4.1、AOF rewrite 原理如下圖所示:

image.png
4.2、持久化RDB-AOF注意事項
1.如果同時使用RDB和AOF兩種持久化機制,那么在redis重啟的時候,會使用AOF來重新構(gòu)建數(shù)據(jù),因為AOF中的數(shù)據(jù)更加完整.
2.通過RDB或AOF,都可以將redis內(nèi)存中的數(shù)據(jù)給持久化到磁盤上面來,然后可以將這些數(shù)據(jù)備份到別的地方去,比如說阿里云,云服務(wù)
3.如果redis掛了,服務(wù)器上的內(nèi)存和磁盤上的數(shù)據(jù)都丟了,可以從云服務(wù)上拷貝回來之前的數(shù)據(jù),放到指定的目錄中,然后重新啟動redis,redis就會自動根據(jù)持久化數(shù)據(jù)文件中的數(shù)據(jù),去恢復(fù)內(nèi)存中的數(shù)據(jù),繼續(xù)對外提供服務(wù).
4.如果我們想要redis僅僅作為純內(nèi)存的緩存來用,那么可以禁止RDB和AOF所有的持久化機制
5、RDB持久化機制的優(yōu)點與缺點
RDB持久化機制的優(yōu)點:
1.RDB會生定期生成新的dump數(shù)據(jù)文件,當(dāng)前時間下的數(shù)據(jù)文件都代表了某一個時刻中redis最新的數(shù)據(jù),定時復(fù)制當(dāng)前時間最新的dump文件,生成多個備份文件的方式,非常適合做冷備,可以將這種完整的數(shù)據(jù)文件發(fā)送到一些遠程的安全存儲上去,比如說Amazon的S3云服務(wù)上去,在國內(nèi)可以是阿里云的ODPS分布式存儲上,以預(yù)定好的備份策略來定期備份redis中的數(shù)據(jù)。
2.RDB對redis對外提供的讀寫服務(wù),影響非常小,可以讓redis保持高性能,因為redis主進程只需要fork一個子進程,讓子進程執(zhí)行磁盤IO操作來進行RDB持久化即可。這個特性很重要。
3、相對于AOF持久化機制來說,直接基于RDB數(shù)據(jù)文件來重啟和恢復(fù)redis進程,更加快速。
RDB持久化機制的缺點:
1.如果想要在redis故障時,盡可能少的丟失數(shù)據(jù),那么RDB沒有AOF好。一般來說,RDB數(shù)據(jù)快照文件,都是每隔5分鐘,或者更長時間生成一次,這個時候就得接受一旦redis進程宕機,那么會丟失最近5分鐘的數(shù)據(jù)。
2.RDB每次在fork子進程來執(zhí)行RDB快照數(shù)據(jù)文件生成的時候,如果數(shù)據(jù)文件特別大,可能會導(dǎo)致對客戶端提供的服務(wù)暫停數(shù)毫秒,或者甚至數(shù)秒。
6、AOF持久化機制的優(yōu)點與缺點
AOF持久化機制的優(yōu)點:
1、AOF可以更好的保護數(shù)據(jù)不丟失,一般AOF會每隔1秒,通過一個后臺線程執(zhí)行一次fsync操作,最多丟失1秒鐘的數(shù)據(jù)
2、AOF日志文件以append-only模式寫入,所以沒有任何磁盤尋址的開銷,寫入性能非常高,而且文件不容易破損,即使文件尾部破損,也很容易修復(fù)
3、AOF日志文件即使過大的時候,出現(xiàn)后臺重寫操作,也不會影響客戶端的讀寫。因為在rewrite log的時候,會對其中的指導(dǎo)進行壓縮,創(chuàng)建出一份需要恢復(fù)數(shù)據(jù)的最小日志出來。再創(chuàng)建新日志文件的時候,老的日志文件還是照常寫入。當(dāng)新的merge后的日志文件ready的時候,再交換新老日志文件即可。
4、AOF日志文件的命令通過非??勺x的方式進行記錄,這個特性非常適合做災(zāi)難性的誤刪除的緊急恢復(fù)。比如某人不小心用flushall命令清空了所有數(shù)據(jù),只要這個時候后臺rewrite還沒有發(fā)生,那么就可以立即拷貝AOF文件,將最后一條flushall命令給刪了,然后再將該AOF文件放回去,就可以通過恢復(fù)機制,自動恢復(fù)所有數(shù)據(jù)
AOF持久化機制的缺點:
1、對于同一份數(shù)據(jù)來說,AOF日志文件通常比RDB數(shù)據(jù)快照文件更大
2、AOF開啟后,支持的寫QPS會比RDB支持的寫QPS低,因為AOF一般會配置成每秒fsync一次日志文件,當(dāng)然,每秒一次fsync,性能也還是很高的
3、以前AOF發(fā)生過bug,就是通過AOF記錄的日志,進行數(shù)據(jù)恢復(fù)的時候,沒有恢復(fù)一模一樣的數(shù)據(jù)出來。所以說,類似AOF這種較為復(fù)雜的基于命令日志/merge/回放的方式,比基于RDB每次持久化一份完整的數(shù)據(jù)快照文件的方式,更加脆弱一些,容易有bug。不過AOF就是為了避免rewrite過程導(dǎo)致的bug,因此每次rewrite并不是基于舊的指令日志進行merge的,而是基于當(dāng)時內(nèi)存中的數(shù)據(jù)進行指令的重新構(gòu)建,這樣健壯性會好很多。
7、RDB和AOF到底該如何選擇
1、不要僅僅使用RDB,因為那樣會導(dǎo)致你丟失很多數(shù)據(jù)
2、也不要僅僅使用AOF,因為那樣有兩個問題,第一,你通過AOF做冷備,沒有RDB做冷備,來的恢復(fù)速度更快; 第二,RDB每次簡單粗暴生成數(shù)據(jù)快照,更加健壯,可以避免AOF這種復(fù)雜的備份和恢復(fù)機制的bug
3、綜合使用AOF和RDB兩種持久化機制,用AOF來保證數(shù)據(jù)不丟失,作為數(shù)據(jù)恢復(fù)的第一選擇; 建議使用RDB來做不同程度的冷備,在AOF文件都丟失或損壞不可用的時候,還可以使用RDB來進行快速的數(shù)據(jù)恢復(fù)。
個人博客:http://www.markfork.com
個人簡書:http://www.itdecent.cn/u/c169fce5179b
慕課網(wǎng):https://www.imooc.com/u/2150709/articles