兩階段提交協(xié)議-2PC
兩階段提交協(xié)議(2PC):是一種原子承諾協(xié)議,一種分布式算法,它協(xié)調(diào)參與分布式事務(wù)的所有應(yīng)用(進(jìn)程)是否提交或終止(回滾)事務(wù),
2PC基本算法
-
階段一:提交事務(wù)詢問請(qǐng)求(或投票)階段
- 事務(wù)協(xié)調(diào)者(TM)向所有參與該事務(wù)的進(jìn)程發(fā)送事務(wù)內(nèi)容,詢問是否可以執(zhí)行該事務(wù)的提交,并等待所有AP的響應(yīng)
- 每個(gè)AP節(jié)點(diǎn)執(zhí)行事務(wù)操作,將undo和redo信息記錄到事務(wù)日志中,盡量把提交過程中所消耗時(shí)間的操作和準(zhǔn)備都提前完成后確保后續(xù)事務(wù)提交的成功率(undo log-回滾日志,redo log-重做日志)
- 每個(gè)AP向TM回復(fù)協(xié)議消息(投票),如果AP執(zhí)行成功則投票贊成,如果AP回復(fù)協(xié)議消息失敗或者出現(xiàn)無法預(yù)知的錯(cuò)誤則投票不贊成
2pc階段一 -
階段二:提交事務(wù)階段
-
階段一成功執(zhí)行事務(wù):協(xié)調(diào)者(TM)在提交事務(wù)請(qǐng)求階段收到來自所有AP的協(xié)議消息
- TM向所有AP發(fā)送事務(wù)提交消息
- 每個(gè)AP執(zhí)行事務(wù)操作,并釋放事務(wù)期間所有持有的鎖和資源
- 每個(gè)AP向TM發(fā)送事務(wù)確認(rèn)的協(xié)議消息
- TM收到所有AP的確認(rèn)消息完成本次事務(wù)
-
階段一失敗中斷事務(wù):任何AP投票否或者TM超時(shí)
- TM向所有AP發(fā)送事務(wù)回滾消息
- 每個(gè)AP根據(jù)回滾日志(undo log)撤銷事務(wù),并釋放事務(wù)期間所有持有的鎖和資源
- 每個(gè)AP向TM發(fā)送確認(rèn)消息
-
TM收到所有的確認(rèn)消息后撤銷該事務(wù)
2pc階段二
-
階段一成功執(zhí)行事務(wù):協(xié)調(diào)者(TM)在提交事務(wù)請(qǐng)求階段收到來自所有AP的協(xié)議消息
2PC的缺點(diǎn)
同步堵塞:兩階段提交協(xié)議最大的缺點(diǎn)就是它是一種堵塞協(xié)議,在事務(wù)詢問階段AP向TM發(fā)送協(xié)議消息后,AP將堵塞,直到AP收到TM提交或回滾事務(wù)
數(shù)據(jù)一致性:如果在執(zhí)行階段二時(shí)TM或者部分AP不可用,部分AP執(zhí)行事務(wù)不成功,導(dǎo)致數(shù)據(jù)不一致
三階段提交協(xié)議-3PC
3PC是2PC的升級(jí)版,與2PC最大的不同就是3PC它是非堵塞的,具體就是在事務(wù)提交或者中止之前增加了一種超時(shí)機(jī)制,當(dāng)超過這個(gè)時(shí)間上限還未提交事務(wù),就會(huì)把該事務(wù)綁定的資源釋放掉
3PC算法
-
階段一:canCommit(投票)
- TM接收到事務(wù)請(qǐng)求后,向所有事務(wù)參與者發(fā)送
canCommit請(qǐng)求,等待參與者返回信息,如果TM在接收事務(wù)請(qǐng)求時(shí)出現(xiàn)故障或者不可用,TM將直接中止事務(wù)。 - 事務(wù)參與者接收到一個(gè)來自TM的
canCommit請(qǐng)求后,如果參與者都同意后會(huì)向TM回復(fù)yes消息并進(jìn)入準(zhǔn)備狀態(tài),如果參與者獲取資源失敗或者出現(xiàn)不可用會(huì)回復(fù)no中止事務(wù)。
- TM接收到事務(wù)請(qǐng)求后,向所有事務(wù)參與者發(fā)送
-
階段二:preCommit(預(yù)提交)
- TM在超時(shí)時(shí)間內(nèi)收到
yes消息后,會(huì)向所有的參與者發(fā)送preCommit消息,如果出現(xiàn)故障,超時(shí)或者TM收到no消息,TM將向所有參與者發(fā)送中止事務(wù)的消息。 - 所有等待中的參與者如果收到
preCommit消息會(huì)發(fā)揮ACK消息并等待最終提交或中止事務(wù),如果搜道協(xié)調(diào)者中止消息,失敗或者超時(shí)等待則會(huì)中止事務(wù)。
- TM在超時(shí)時(shí)間內(nèi)收到
-
階段三:doCommit(提交)
如果協(xié)調(diào)者正常工作并收到了所有參與者的
ACK消息,它會(huì)向所有的參與者發(fā)送doCommit消息,如果超時(shí)時(shí)間范圍內(nèi)未收到或者部分未收到等情況,協(xié)調(diào)者向所有的參與者發(fā)送中止事務(wù)消息。-
如果參與者接收到
doCommit消息,會(huì)正式提交事務(wù),并釋放整個(gè)事務(wù)期間占用的資源,然后向TM反饋ACK消息,如果收到來自TM的中止消息參與者會(huì)根據(jù)階段一的undo log回滾事務(wù),并釋放所有的事務(wù)資源并向TM反饋ACK信息。完成事務(wù)。。
3pc
3PC的缺點(diǎn)
在階段三如果協(xié)調(diào)者在超時(shí)范圍內(nèi)未提交doCommit消息或者中止消息,參與者在超時(shí)后會(huì)繼續(xù)進(jìn)行事務(wù)的提交,如果doCommit沒問題但是如果是中止服務(wù)的話參與者還會(huì)自動(dòng)提交事務(wù)這樣可能導(dǎo)致本來的事務(wù)回滾變成了事務(wù)提交。
參閱:
https://en.wikipedia.org/wiki/Two-phase_commit_protocol
https://en.wikipedia.org/wiki/Three-phase_commit_protocol


