MVCC概念:InnoDB使用MVCC實(shí)現(xiàn)高并發(fā)
MVCC并不是MySql獨(dú)有的,Oracle,PostgreSQL等都實(shí)現(xiàn)了MVCC,但各自實(shí)現(xiàn)機(jī)制不同。因?yàn)镸VCC沒有統(tǒng)一實(shí)現(xiàn)標(biāo)準(zhǔn)。
MVCC可以認(rèn)為它是行級(jí)鎖的一個(gè)變種,但是它在很多情況下避免了加鎖操作,因此開銷更低。實(shí)現(xiàn)了非阻塞的讀操作,寫操作也只鎖定必要的行。
MVCC的基本原理:
MVCC的實(shí)現(xiàn),通過保存數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)的快照來實(shí)現(xiàn)的。這意味著一個(gè)事務(wù)無論執(zhí)行多長(zhǎng)時(shí)間,在同一個(gè)事務(wù)里看到數(shù)據(jù)都實(shí)一致的。根據(jù)事務(wù)開始的時(shí)間不同,每個(gè)事務(wù)對(duì)同一張表同一個(gè)時(shí)刻看到的數(shù)據(jù)可能不同。
MVCC的基本特征:
每行數(shù)據(jù)都存在一個(gè)版本,每次數(shù)據(jù)更新時(shí)都更新該版本。
修改時(shí)Copy出當(dāng)前版本隨意修改,各個(gè)事務(wù)之間無干擾。
保存時(shí)比較版本號(hào),如果成功(commit),則覆蓋原記錄;失敗則放棄copy(rollback)
InnoDB存儲(chǔ)引擎MVCC的實(shí)現(xiàn)策略:
通過在每一行數(shù)據(jù)后面保存兩個(gè)隱藏的列實(shí)現(xiàn):當(dāng)前行創(chuàng)建時(shí)的版本號(hào)和刪除時(shí)的版本號(hào)(可能為空)。這里的版本號(hào)并不是實(shí)際的時(shí)間值,而是系統(tǒng)版本號(hào)。每開始一個(gè)新的事務(wù),系統(tǒng)版本號(hào)都會(huì)自動(dòng)遞增。事務(wù)開始時(shí)刻的系統(tǒng)版本號(hào)會(huì)作為事務(wù)的版本號(hào),用來和查詢到的每行記錄的版本號(hào)進(jìn)行比較。
每個(gè)事務(wù)又有自己的版本號(hào),這樣事務(wù)內(nèi)執(zhí)行CRUD操作時(shí),就通過版本號(hào)的比較來達(dá)到數(shù)據(jù)版本控制的目的。具體做法見下面的示意圖。

MVCC具體的操作如下:
SELECT:InnoDB會(huì)根據(jù)以下兩個(gè)條件檢查每行記錄:
1)InnoDB只查找版本早于當(dāng)前事務(wù)版本的數(shù)據(jù)行(也就是,行的系統(tǒng)版本號(hào)小于或等于事務(wù)的系統(tǒng)版本號(hào)),這樣可以確保事務(wù)讀取的行,要么是在事務(wù)開始前已經(jīng)存在的,要么是事務(wù)自身插入或者修改過的。
2)行的刪除版本要么未定義,要么大于當(dāng)前事務(wù)版本號(hào)。這可以確保事務(wù)讀取到的行,在事務(wù)開始之前未被刪除。
INSERT:InnoDB為新插入的每一行保存當(dāng)前系統(tǒng)版本號(hào)作為行版本號(hào)。
DELETE:InnoDB為刪除的每一行保存當(dāng)前系統(tǒng)版本號(hào)作為行刪除標(biāo)識(shí)。
UPDATE:InnoDB為插入一行新記錄,保存當(dāng)前系統(tǒng)版本號(hào)作為行版本號(hào),同時(shí)保存當(dāng)系統(tǒng)的版本號(hào)為原來的行作為刪除標(biāo)識(shí)。
保存這兩個(gè)額外系統(tǒng)版本號(hào),使大多數(shù)操作都可以不用加鎖。這樣設(shè)計(jì)使得計(jì)數(shù)據(jù)操作很簡(jiǎn)單,性能很好,并且也能保證只會(huì)讀取到符合標(biāo)準(zhǔn)的行。不足之處是每行記錄都需要額外的存儲(chǔ)空間,需要做更多的行檢查工作,以及一些額外的維護(hù)工作。
MVCC只在REPEATABLE READ和READ COMMITED兩個(gè)隔離級(jí)別下工作,其它兩個(gè)隔離級(jí)別和MVCC不兼容。
Purge流程
Purge功能:
InnoDB由于要支持多版本協(xié)議,因此無論是更新,刪除,都只是設(shè)置記錄上的deleted bit標(biāo)記位,而不是真正的刪除記錄。后續(xù)這些記錄的真正刪除,是通過Purge后臺(tái)進(jìn)程實(shí)現(xiàn)的。Purge進(jìn)程定期掃描InnoDB的undo,按照先讀老undo,再讀新undo的順序,讀取每條undo record。對(duì)于每一條undo record,判斷其對(duì)應(yīng)的記錄是否可以被purge
MVCC 可以保證不阻塞地讀到一致的數(shù)據(jù)
參考:
http://blog.csdn.net/chen77716/article/details/6742128