MYSQL-寫緩沖(change buffer)

(1)MySQL數(shù)據(jù)存儲(chǔ)包含內(nèi)存與磁盤兩個(gè)部分

(2)內(nèi)存緩沖池(buffer pool)以頁為單位,緩存最熱的數(shù)據(jù)頁(data page)與索引頁(index page);

(3)InnoDB以變種LRU算法管理緩沖池,并能夠解決“預(yù)讀失效”與“緩沖池污染”的問題;

毫無疑問,對(duì)于讀請(qǐng)求,緩沖池能夠減少磁盤IO,提升性能。問題來了,那寫請(qǐng)求呢?

情況一

假如要修改頁號(hào)為4的索引頁,而這個(gè)頁正好在緩沖池內(nèi)。

如上圖序號(hào)1-2:

(1)直接修改緩沖池中的頁,一次內(nèi)存操作;

(2)寫入redo log,一次磁盤順序?qū)懖僮鳎?/p>

這樣的效率是最高的。

畫外音:像寫日志這種順序?qū)?,每秒幾萬次沒問題。

是否會(huì)出現(xiàn)一致性問題呢?

并不會(huì)。

(1)讀取,會(huì)命中緩沖池的頁;

(2)緩沖池LRU數(shù)據(jù)淘汰,會(huì)將“臟頁”刷回磁盤;

(3)數(shù)據(jù)庫異常奔潰,能夠從redo log中恢復(fù)數(shù)據(jù);

什么時(shí)候緩沖池中的頁,會(huì)刷到磁盤上呢?

定期刷磁盤,而不是每次刷磁盤,能夠降低磁盤IO,提升MySQL的性能。

畫外音:批量寫,是常見的優(yōu)化手段。

情況二

假如要修改頁號(hào)為40的索引頁,而這個(gè)頁正好在緩沖池內(nèi)。

此時(shí)麻煩一點(diǎn),如上圖需要1-3:

(1)先把需要為40的索引頁,從磁盤加載到緩沖池,一次磁盤隨機(jī)讀操作;

(2)修改緩沖池中的頁,一次內(nèi)存操作;

(3)寫入redo log,一次磁盤順序?qū)懖僮鳎?/p>

沒有命中緩沖池的時(shí)候,至少產(chǎn)生一次磁盤IO,對(duì)于寫多讀少的業(yè)務(wù)場(chǎng)景,是否還有優(yōu)化的空間呢?

這即是InnoDB考慮的問題,又是本文將要討論的寫緩沖(change buffer)。

畫外音:從名字容易看出,寫緩沖是降低磁盤IO,提升數(shù)據(jù)庫寫性能的一種機(jī)制。

什么是InnoDB的寫緩沖?

在MySQL5.5之前,叫插入緩沖(insert buffer),只針對(duì)insert做了優(yōu)化;現(xiàn)在對(duì)delete和update也有效,叫做寫緩沖(change buffer)。

它是一種應(yīng)用在非唯一普通索引頁(non-unique secondary index page)不在緩沖池中,對(duì)頁進(jìn)行了寫操作,并不會(huì)立刻將磁盤頁加載到緩沖池,而僅僅記錄緩沖變更(buffer changes),等未來數(shù)據(jù)被讀取時(shí),再將數(shù)據(jù)合并(merge)恢復(fù)到緩沖池中的技術(shù)。寫緩沖的目的是降低寫操作的磁盤IO,提升數(shù)據(jù)庫性能。

InnoDB加入寫緩沖優(yōu)化,上文“情況二”流程會(huì)有什么變化?

假如要修改頁號(hào)為40的索引頁,而這個(gè)頁正好在緩沖池內(nèi)。


加入寫緩沖優(yōu)化后,流程優(yōu)化為:

(1)在寫緩沖中記錄這個(gè)操作,一次內(nèi)存操作;

(2)寫入redo log,一次磁盤順序?qū)懖僮鳎?/p>

其性能與,這個(gè)索引頁在緩沖池中,相近。

畫外音:可以看到,40這一頁,并沒有加載到緩沖池中。

是否會(huì)出現(xiàn)一致性問題呢?

也不會(huì)。

(1)數(shù)據(jù)庫異常奔潰,能夠從redo log中恢復(fù)數(shù)據(jù);

(2)寫緩沖不只是一個(gè)內(nèi)存結(jié)構(gòu),它也會(huì)被定期刷盤到寫緩沖系統(tǒng)表空間;

(3)數(shù)據(jù)讀取時(shí),有另外的流程,將數(shù)據(jù)合并到緩沖池;

不妨設(shè),稍后的一個(gè)時(shí)間,有請(qǐng)求查詢索引頁40的數(shù)據(jù)。

此時(shí)的流程如序號(hào)1-3:

(1)載入索引頁,緩沖池未命中,這次磁盤IO不可避免;

(2)從寫緩沖讀取相關(guān)信息;

(3)恢復(fù)索引頁,放到緩沖池LRU里;

畫外音:可以看到,40這一頁,在真正被讀取時(shí),才會(huì)被加載到緩沖池中。

還有一個(gè)遺漏問題,為什么寫緩沖優(yōu)化,僅適用于非唯一普通索引頁呢?

InnoDB里,聚集索引(clustered index)和普通索引(secondary index)的異同

如果索引設(shè)置了唯一(unique)屬性,在進(jìn)行修改操作時(shí),InnoDB必須進(jìn)行唯一性檢查。也就是說,索引頁即使不在緩沖池,磁盤上的頁讀取無法避免(否則怎么校驗(yàn)是否唯一?),此時(shí)就應(yīng)該直接把相應(yīng)的頁放入緩沖池再進(jìn)行修改,而不應(yīng)該再整寫緩沖這個(gè)幺蛾子。

除了數(shù)據(jù)頁被訪問,還有哪些場(chǎng)景會(huì)觸發(fā)刷寫緩沖中的數(shù)據(jù)呢?

還有這么幾種情況,會(huì)刷寫緩沖中的數(shù)據(jù):

(1)有一個(gè)后臺(tái)線程,會(huì)認(rèn)為數(shù)據(jù)庫空閑時(shí);

(2)數(shù)據(jù)庫緩沖池不夠用時(shí);

(3)數(shù)據(jù)庫正常關(guān)閉時(shí);

(4)redo log寫滿時(shí);

畫外音:幾乎不會(huì)出現(xiàn)redo log寫滿,此時(shí)整個(gè)數(shù)據(jù)庫處于無法寫入的不可用狀態(tài)。

什么業(yè)務(wù)場(chǎng)景,適合開啟InnoDB的寫緩沖機(jī)制?

先說什么時(shí)候不適合,如上文分析,當(dāng):

(1)數(shù)據(jù)庫都是唯一索引;

(2)或者,寫入一個(gè)數(shù)據(jù)后,會(huì)立刻讀取它;

這兩類場(chǎng)景,在寫操作進(jìn)行時(shí)(進(jìn)行后),本來就要進(jìn)行進(jìn)行頁讀取,本來相應(yīng)頁面就要入緩沖池,此時(shí)寫緩存反倒成了負(fù)擔(dān),增加了復(fù)雜度。

什么時(shí)候適合使用寫緩沖,如果:

(1)數(shù)據(jù)庫大部分是非唯一索引;

(2)業(yè)務(wù)是寫多讀少,或者不是寫后立刻讀??;

可以使用寫緩沖,將原本每次寫入都需要進(jìn)行磁盤IO的SQL,優(yōu)化定期批量寫磁盤。

畫外音:例如,賬單流水業(yè)務(wù)。

上述原理,對(duì)應(yīng)InnoDB里哪些參數(shù)?

有兩個(gè)比較重要的參數(shù)。

參數(shù):innodb_change_buffer_max_size

介紹:配置寫緩沖的大小,占整個(gè)緩沖池的比例,默認(rèn)值是25%,最大值是50%。

畫外音:寫多讀少的業(yè)務(wù),才需要調(diào)大這個(gè)值,讀多寫少的業(yè)務(wù),25%其實(shí)也多了。

參數(shù):innodb_change_buffering

介紹:配置哪些寫操作啟用寫緩沖,可以設(shè)置成all/none/inserts/deletes等。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容