在面試環(huán)節(jié),經(jīng)常會問CAP、BASE等相關(guān)的分布式理論,其實這些名詞主要還是來自于分布式的一致性,今天主要介紹分布式一致性:強(qiáng)一致性、最終一致性、ACID、CAP等理論。
分布式一致性的背景
隨著分布式事務(wù)的出現(xiàn),傳統(tǒng)的單機(jī)事務(wù)模型(ACID)已經(jīng)無法勝任,尤其是對于一個高訪問量、高并發(fā)的互聯(lián)網(wǎng)分布式系統(tǒng)來說。
如果我們要求嚴(yán)格一致性,很可能就需要犧牲掉系統(tǒng)的可用性,反之亦然。
如何構(gòu)建一個兼顧可用性和一致性的分布式系統(tǒng)成為了無數(shù)Java工程師探討的難題。
數(shù)據(jù)一致性的由來
一致性(Consistency)一直是分布式系統(tǒng)里一個很重要的話題。
在存儲系統(tǒng)中,為了避免數(shù)據(jù)丟失,我們都會對數(shù)據(jù)進(jìn)行持久化。
對數(shù)據(jù)進(jìn)行持久化可以避免宕機(jī)帶來的數(shù)據(jù)丟失問題,但是不能解決單機(jī)永久性故障的問題。存儲系統(tǒng)作為基礎(chǔ)設(shè)施,在單機(jī)上持久化是遠(yuǎn)遠(yuǎn)不夠的,我們需要將數(shù)據(jù)復(fù)制到多臺機(jī)器上以提升系統(tǒng)的可用性和可靠性。
一旦數(shù)據(jù)被復(fù)制到多個節(jié)點,那么就產(chǎn)生了一致性的問題。
分布式數(shù)據(jù)一致性的級別
1、強(qiáng)一致性
是最強(qiáng)的一致性模型,要求任何讀取操作都能讀取到最新的值,換句話說,要求任何寫入操作立即同步給所有進(jìn)程。
2、弱一致性
這種一致性級別約束了系統(tǒng)在寫入成功后,不承諾立即可以讀到寫入的值,也不久承諾多久之后數(shù)據(jù)能夠達(dá)到一致,但會盡可能地保證到某個時間級別(比如秒級別)后,數(shù)據(jù)能夠達(dá)到一致狀態(tài)。
3、最終一致性
最終一致性是弱一致性的一個特例,系統(tǒng)會保證在一定時間內(nèi),能夠達(dá)到一個數(shù)據(jù)一致的狀態(tài)。
這里之所以將最終一致性單獨提出來,是因為它是弱一致性中非常推崇的一種一致性模型,也是業(yè)界在大型分布式系統(tǒng)的數(shù)據(jù)一致性上比較推崇的模型。
一致性相關(guān)的理論
關(guān)系式數(shù)據(jù)庫ACID
ACID是數(shù)據(jù)庫(MySQL)事務(wù)正確執(zhí)行所必須滿足的四個特性的首字母縮寫。
1.Atomicity(原子性)
一個事務(wù)的所有操作,要么全部完成,要么全部不完成。
所謂事務(wù),是指由一系列數(shù)據(jù)操作所組成的完整邏輯過程。比如銀行轉(zhuǎn)賬事務(wù)由兩個操作組成:從源賬戶扣除金額,以及向目標(biāo)賬戶增加金額。
2.Consistency(一致性)
指事務(wù)開始之前和事務(wù)結(jié)束之后,數(shù)據(jù)的完整性約束沒有被破壞。
包含兩層含義:
a)數(shù)據(jù)庫機(jī)制層面,事務(wù)執(zhí)行前后,數(shù)據(jù)能符合設(shè)置的約束,如唯一約束、外鍵約束;
b)業(yè)務(wù)層面,由應(yīng)用開發(fā)人員保證業(yè)務(wù)一致性。還是以銀行轉(zhuǎn)賬為例,A、B兩個賬號,轉(zhuǎn)賬之前和之后,A、B兩個賬號余額總額必須一致。
3.Isolation(隔離性)
數(shù)據(jù)庫能夠防止由于多個并發(fā)事務(wù)交叉執(zhí)行而導(dǎo)致數(shù)據(jù)的不一致。
4.Durability(持久性)
指事務(wù)結(jié)束后,對數(shù)據(jù)的修改是永久的,不會回滾到之前的狀態(tài)。
CAP理論
在分布式系統(tǒng)中,也有類似數(shù)據(jù)庫ACID的特性,那就是CAP,他們分別是:
1.Consistency 一致性
強(qiáng)調(diào)進(jìn)群節(jié)點中數(shù)據(jù)一致。在分布式中一致性又包括強(qiáng)一致性和弱一致性,強(qiáng)一致性就是指在任何時刻任何節(jié)點看到的數(shù)據(jù)都是一樣的;
弱一致性一般實現(xiàn)是最終一致性,即剛開始可能存在差異,但隨著時間的推移,最終數(shù)據(jù)保持一致。
2.Availability 可用性
強(qiáng)調(diào)集群在任何時間內(nèi)都正常使用
3.Partition Tolerance 分區(qū)容錯性
即使某一部分集群壞掉,另一部分仍能正常工作。
這三個特性只能滿足其中兩個,犧牲另一個。大部分系統(tǒng)也都是如此:
一般來說分布式集群都會保證P優(yōu)先,即集群部分節(jié)點壞死不影響整個集群的使用,然后再去追求C和A。因為如果放棄P——分區(qū)可用性,那不如就直接使用多個傳統(tǒng)數(shù)據(jù)庫了。事實上,很多微服務(wù)分庫分表就是這個道理。
如果追求強(qiáng)一致性,那么勢必會導(dǎo)致可用性下降。比如在Master-Slave的場景中,Master負(fù)責(zé)數(shù)據(jù)寫入,然后分發(fā)給各個節(jié)點,所有節(jié)點都寫入成功,才算寫入,這樣保證了強(qiáng)一致性,但是延遲也會隨之增加,導(dǎo)致可用性降低。
因此在可用性和一致性之間,就出現(xiàn)了各種解決方案,如時序一致性、最終一致性等等。
BASE理論
BASE理論是對CAP理論的延伸,核心思想是即使無法做到強(qiáng)一致性(Strong Consistency,CAP的一致性就是強(qiáng)一致性),但應(yīng)用可以采用適合的方式達(dá)到最終一致性(Eventual Consitency)。
BASE是指基本可用(Basically Available)、軟狀態(tài)( Soft State)、最終一致性( Eventual Consistency)。
1.基本可用(Basically Available)
基本可用是指分布式系統(tǒng)在出現(xiàn)故障的時候,允許損失部分可用性,即保證核心可用。
電商大促時,為了應(yīng)對訪問量激增,部分用戶可能會被引導(dǎo)到降級頁面,服務(wù)層也可能只提供降級服務(wù),這就是損失部分可用性的體現(xiàn)。
2.軟狀態(tài)( Soft State)
軟狀態(tài)是指允許系統(tǒng)存在中間狀態(tài),而該中間狀態(tài)不會影響系統(tǒng)整體可用性。
分布式存儲中一般一份數(shù)據(jù)至少會有三個副本,允許不同節(jié)點間副本同步的延時就是軟狀態(tài)的體現(xiàn)。mysql replication的異步復(fù)制也是一種體現(xiàn)。
3.最終一致性( Eventual Consistency)
最終一致性是指系統(tǒng)中的所有數(shù)據(jù)副本經(jīng)過一定時間后,最終能夠達(dá)到一致的狀態(tài)。
弱一致性和強(qiáng)一致性相反,最終一致性是弱一致性的一種特殊情況。
BASE和ACID代表兩種截然相反的設(shè)計理念,ACID注重一致性,是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(MySQL)的設(shè)計思路,BASE關(guān)注高可用性。
當(dāng)今大規(guī)模、跨數(shù)據(jù)中心的分布式系統(tǒng)(如云計算)大多同時采用這兩種設(shè)計理念,并在兩者之間尋求平衡。
以上就是分布式一致性理論的介紹,更多分布式架構(gòu)設(shè)計:Redis緩存、Dubbo、Kafka、秒殺專題,請參考:阿里架構(gòu)師進(jìn)階23期精講:Redis、Kafka、Dubbo、Docker等
覺得不錯請點贊支持,歡迎留言或進(jìn)我的個人群179961551領(lǐng)取【架構(gòu)資料專題目合集90期】、【BATJTMD大廠JAVA面試真題1000+】,本群專用于學(xué)習(xí)交流技術(shù)、分享面試機(jī)會,拒絕廣告,我也會在群內(nèi)不定期答題、探討。