Mysql中事務(wù)ACID實(shí)現(xiàn)原理

點(diǎn)關(guān)注,不迷路;持續(xù)更新Java相關(guān)技術(shù)及資訊?。?!

照例,我們先來一個(gè)場景~

面試官:"知道事務(wù)的四大特性么?"

你:"懂,ACID嘛,原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)!"

面試官:"你們是用mysql數(shù)據(jù)庫吧,能簡單說說innodb中怎么實(shí)現(xiàn)這四大特性的么?“

你:"我只知道隔離性是怎么做的balabala~~"

面試官:"還是回去等通知吧~"


OK,回到正題。說到事務(wù)的四大特性原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability),懂的人很多。但是稍微涉及細(xì)節(jié)一點(diǎn),這四大特性在數(shù)據(jù)庫中的實(shí)現(xiàn)原理是怎么樣的?那就沒有幾個(gè)人能夠答得上來了。因此,我們這篇文章著重討論一下四大特性在Mysql中的實(shí)現(xiàn)原理。

正文

我們以從A賬戶轉(zhuǎn)賬50元到B賬戶為例進(jìn)行說明一下ACID,四大特性。

原子性

根據(jù)定義,原子性是指一個(gè)事務(wù)是一個(gè)不可分割的工作單位,其中的操作要么都做,要么都不做。即要么轉(zhuǎn)賬成功,要么轉(zhuǎn)賬失敗,是不存在中間的狀態(tài)!

如果無法保證原子性會(huì)怎么樣?

OK,就會(huì)出現(xiàn)數(shù)據(jù)不一致的情形,A賬戶減去50元,而B賬戶增加50元操作失敗。系統(tǒng)將無故丟失50元~

隔離性

根據(jù)定義,隔離性是指多個(gè)事務(wù)并發(fā)執(zhí)行的時(shí)候,事務(wù)內(nèi)部的操作與其他事務(wù)是隔離的,并發(fā)執(zhí)行的各個(gè)事務(wù)之間不能互相干擾。

如果無法保證隔離性會(huì)怎么樣?

OK,假設(shè)A賬戶有200元,B賬戶0元。A賬戶往B賬戶轉(zhuǎn)賬兩次,金額為50元,分別在兩個(gè)事務(wù)中執(zhí)行。如果無法保證隔離性,會(huì)出現(xiàn)下面的情形

如圖所示,如果不保證隔離性,A扣款兩次,而B只加款一次,憑空消失了50元,依然出現(xiàn)了數(shù)據(jù)不一致的情形!

ps:可能有細(xì)心的讀者已經(jīng)發(fā)現(xiàn)了,mysql中是依靠鎖來解決隔離性問題。嗯,我們后面來說明。

持久性

根據(jù)定義,持久性是指事務(wù)一旦提交,它對數(shù)據(jù)庫的改變就應(yīng)該是永久性的。接下來的其他操作或故障不應(yīng)該對其有任何影響。

如果無法保證持久性會(huì)怎么樣?

在Mysql中,為了解決CPU和磁盤速度不一致問題,Mysql是將磁盤上的數(shù)據(jù)加載到內(nèi)存,對內(nèi)存進(jìn)行操作,然后再回寫磁盤。好,假設(shè)此時(shí)宕機(jī)了,在內(nèi)存中修改的數(shù)據(jù)全部丟失了,持久性就無法保證。

設(shè)想一下,系統(tǒng)提示你轉(zhuǎn)賬成功。但是你發(fā)現(xiàn)金額沒有發(fā)生任何改變,此時(shí)數(shù)據(jù)出現(xiàn)了不合法的數(shù)據(jù)狀態(tài),我們將這種狀態(tài)認(rèn)為是數(shù)據(jù)不一致的情形。

一致性

根據(jù)定義,一致性是指事務(wù)執(zhí)行前后,數(shù)據(jù)處于一種合法的狀態(tài),這種狀態(tài)是語義上的而不是語法上的。

那什么是合法的數(shù)據(jù)狀態(tài)呢?

oK,這個(gè)狀態(tài)是滿足預(yù)定的約束就叫做合法的狀態(tài),再通俗一點(diǎn),這狀態(tài)是由你自己來定義的。滿足這個(gè)狀態(tài),數(shù)據(jù)就是一致的,不滿足這個(gè)狀態(tài),數(shù)據(jù)就是不一致的!

如果無法保證一致性會(huì)怎么樣?

例一:A賬戶有200元,轉(zhuǎn)賬300元出去,此時(shí)A賬戶余額為-100元。你自然就發(fā)現(xiàn)了此時(shí)數(shù)據(jù)是不一致的,為什么呢?因?yàn)槟愣x了一個(gè)狀態(tài),余額這列必須大于0。

例二:A賬戶200元,轉(zhuǎn)賬50元給B賬戶,A賬戶的錢扣了,但是B賬戶因?yàn)楦鞣N意外,余額并沒有增加。你也知道此時(shí)數(shù)據(jù)是不一致的,為什么呢?因?yàn)槟愣x了一個(gè)狀態(tài),要求A+B的余額必須不變。

實(shí)戰(zhàn)解答

問題一:Mysql怎么保證一致性的?

OK,這個(gè)問題分為兩個(gè)層面來說。

從數(shù)據(jù)庫層面,數(shù)據(jù)庫通過原子性、隔離性、持久性來保證一致性。也就是說ACID四大特性之中,C(一致性)是目的,A(原子性)、I(隔離性)、D(持久性)是手段,是為了保證一致性,數(shù)據(jù)庫提供的手段。數(shù)據(jù)庫必須要實(shí)現(xiàn)AID三大特性,才有可能實(shí)現(xiàn)一致性。例如,原子性無法保證,顯然一致性也無法保證。

但是,如果你在事務(wù)里故意寫出違反約束的代碼,一致性還是無法保證的。例如,你在轉(zhuǎn)賬的例子中,你的代碼里故意不給B賬戶加錢,那一致性還是無法保證。因此,還必須從應(yīng)用層角度考慮。

從應(yīng)用層面,通過代碼判斷數(shù)據(jù)庫數(shù)據(jù)是否有效,然后決定回滾還是提交數(shù)據(jù)!

問題二: Mysql怎么保證原子性的?

OK,是利用Innodb的undo log。

undo log名為回滾日志,是實(shí)現(xiàn)原子性的關(guān)鍵,當(dāng)事務(wù)回滾時(shí)能夠撤銷所有已經(jīng)成功執(zhí)行的sql語句,他需要記錄你要回滾的相應(yīng)日志信息。

例如

(1)當(dāng)你delete一條數(shù)據(jù)的時(shí)候,就需要記錄這條數(shù)據(jù)的信息,回滾的時(shí)候,insert這條舊數(shù)據(jù)

(2)當(dāng)你update一條數(shù)據(jù)的時(shí)候,就需要記錄之前的舊值,回滾的時(shí)候,根據(jù)舊值執(zhí)行update操作

(3)當(dāng)年insert一條數(shù)據(jù)的時(shí)候,就需要這條記錄的主鍵,回滾的時(shí)候,根據(jù)主鍵執(zhí)行delete操作

undo log記錄了這些回滾需要的信息,當(dāng)事務(wù)執(zhí)行失敗或調(diào)用了rollback,導(dǎo)致事務(wù)需要回滾,便可以利用undo log中的信息將數(shù)據(jù)回滾到修改之前的樣子。

ps:具體的undo log日志長啥樣,這個(gè)可以寫一篇文章了。而且寫出來,看的人也不多,姑且先這么簡單的理解吧。

問題三: Mysql怎么保證持久性的?

OK,是利用Innodb的redo log。

正如之前說的,Mysql是先把磁盤上的數(shù)據(jù)加載到內(nèi)存中,在內(nèi)存中對數(shù)據(jù)進(jìn)行修改,再刷回磁盤上。如果此時(shí)突然宕機(jī),內(nèi)存中的數(shù)據(jù)就會(huì)丟失。

怎么解決這個(gè)問題?

簡單啊,事務(wù)提交前直接把數(shù)據(jù)寫入磁盤就行啊。

這么做有什么問題?

只修改一個(gè)頁面里的一個(gè)字節(jié),就要將整個(gè)頁面刷入磁盤,太浪費(fèi)資源了。畢竟一個(gè)頁面16kb大小,你只改其中一點(diǎn)點(diǎn)東西,就要將16kb的內(nèi)容刷入磁盤,聽著也不合理。

畢竟一個(gè)事務(wù)里的SQL可能牽涉到多個(gè)數(shù)據(jù)頁的修改,而這些數(shù)據(jù)頁可能不是相鄰的,也就是屬于隨機(jī)IO。顯然操作隨機(jī)IO,速度會(huì)比較慢。

于是,決定采用redo log解決上面的問題。當(dāng)做數(shù)據(jù)修改的時(shí)候,不僅在內(nèi)存中操作,還會(huì)在redo log中記錄這次操作。當(dāng)事務(wù)提交的時(shí)候,會(huì)將redo log日志進(jìn)行刷盤(redo log一部分在內(nèi)存中,一部分在磁盤上)。當(dāng)數(shù)據(jù)庫宕機(jī)重啟的時(shí)候,會(huì)將redo log中的內(nèi)容恢復(fù)到數(shù)據(jù)庫中,再根據(jù)undo log和binlog內(nèi)容決定回滾數(shù)據(jù)還是提交數(shù)據(jù)。

采用redo log的好處?

其實(shí)好處就是將redo log進(jìn)行刷盤比對數(shù)據(jù)頁刷盤效率高,具體表現(xiàn)如下

redo log體積小,畢竟只記錄了哪一頁修改了啥,因此體積小,刷盤快。

redo log是一直往末尾進(jìn)行追加,屬于順序IO。效率顯然比隨機(jī)IO來的快。

ps:不想具體去談redo log具體長什么樣,因?yàn)閮?nèi)容太多了。

問題四: Mysql怎么保證隔離性的?

OK,利用的是鎖和MVCC機(jī)制。還是拿轉(zhuǎn)賬例子來說明,有一個(gè)賬戶表如下

表名t_balance

id? ?user_id? ? balance

1? ? ? ? A? ? ? ? ? 200

2? ? ? ? B? ? ? ? ? ?0

其中id是主鍵,user_id為賬戶名,balance為余額。還是以轉(zhuǎn)賬兩次為例,如下圖所示

至于MVCC,即多版本并發(fā)控制(Multi Version Concurrency Control),一個(gè)行記錄數(shù)據(jù)有多個(gè)版本對快照數(shù)據(jù),這些快照數(shù)據(jù)在undo log中。

如果一個(gè)事務(wù)讀取的行正在做DELELE或者UPDATE操作,讀取操作不會(huì)等行上的鎖釋放,而是讀取該行的快照版本。

由于MVCC機(jī)制在可重復(fù)讀(Repeateable Read)和讀已提交(Read Commited)的MVCC表現(xiàn)形式不同,就不贅述了。

但是有一點(diǎn)說明一下,在事務(wù)隔離級別為讀已提交(Read Commited)時(shí),一個(gè)事務(wù)能夠讀到另一個(gè)事務(wù)已經(jīng)提交的數(shù)據(jù),是不滿足隔離性的。但是當(dāng)事務(wù)隔離級別為可重復(fù)讀(Repeateable Read)中,是滿足隔離性的。

總結(jié)

本文講了Mysql中事務(wù)ACID四大特性的實(shí)現(xiàn)原理,希望大家有所收獲。

本號(hào)專注Java源碼分析。喜歡底層源碼的朋友可以來交流探討。交流群:818491202 驗(yàn)證:33

關(guān)注公眾號(hào)【Java耕耘者】,專注于Spring源碼分析、Dubbo、Redis、Netty、zookeeper、Spring cloud、分布式等全棧技術(shù),定期視頻教程分享,關(guān)注后回復(fù) Java ,領(lǐng)取我為你精心準(zhǔn)備的 Java 干貨!

本文到這里就結(jié)束了,喜歡的朋友可以幫忙轉(zhuǎn)發(fā)和關(guān)注一下,感謝支持!

作者:孤獨(dú)煙?出處:?http://rjzheng.cnblogs.com/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容