字節(jié)二面你知道InnoDB行記錄存儲結(jié)構(gòu)嗎?

程序員常用的IDEA插件:https://github.com/silently9527/Toolkit

前言

我們平時在向MySQL數(shù)據(jù)庫表中插入數(shù)據(jù)時,實際數(shù)據(jù)是以行記錄的格式存儲在磁盤上的,本篇我們就一起來詳細的了解下MySQL的行記錄格式,理解了行記錄的格式有助于我們后面了解MySQL如何快速在頁中定位出行記錄,以及MySQL的版本控制鏈,事務(wù)隔離級別等等,行記錄格式是許多MySQL核心知識的基礎(chǔ)。

InnoDB行記錄類型

MySQL中總共提供了四種類型的行格式:Compact,Redundant,Dynamic,Compressed

在創(chuàng)建表或修改表的時候可以指定行記錄的格式
create table 表名 row_format=行格式名
alter table 表名 row_format=行格式名

知道就行,不需要去記住,基本上使用不到

Compact行格式

在四種類型的行格式中,我們主要來學(xué)習(xí)Compact格式,其他格式的行記錄類似;

image

從圖中我們可以看出行記錄主要是由4部分組成:變長字段長度、Null值列表,行記錄頭信息以及列的真實數(shù)據(jù)

變長字段長度列表

在MySQL中很一些變長的數(shù)據(jù)類型(varchar,text等),MySQL需要知道這些數(shù)據(jù)的實際長度,這樣才能正確的在真實數(shù)據(jù)中取出對應(yīng)列的數(shù)據(jù),所以變長字段是由兩部分組成:

  • 真實數(shù)據(jù)的長度
  • 真實數(shù)據(jù)的字節(jié)

每個變長字段的長度要么用1字節(jié)要么用2字節(jié)表示,由此就決定了每個字段的最大字節(jié)數(shù)是65535;

  • 假如字符類型若為gbk,每個字符最多占2個字節(jié),最大長度不能超過32766;
  • 假如字符類型若為utf8,每個字符最多占3個字節(jié),最大長度不能超過21845。

那到底什么時候選用1字節(jié)什么時候選用2字節(jié)呢?

這里需要定義三個變量:w,m,l

  1. 假如使用的字符集是utf8mb4,每個字符占用的字節(jié)數(shù)是4字節(jié),那么w=4;假如字符類型若為utf8,每個字符最多占3個字節(jié),那么w=3; 所以w表示字符集中每個字符所占的字節(jié)數(shù)
  2. varchr(m),這里m表示的是定義的字符的長度
  3. l 表示的是該字段真實數(shù)據(jù)占用的字節(jié)數(shù)

當(dāng) m*w <= 255;表示該字段定義的最大長度都不會超過1字節(jié),那么該字段的長度就用1字節(jié)表示

當(dāng) m*w > 255 && l<=127; 表示該字段定義的長度可能會超過1個字節(jié),但是當(dāng)前的實際長度是小于127的,可以用1個字節(jié)表示

當(dāng) m*w > 255 && l>127; 用2字節(jié)來表示該字段的長度

思考:為什么與l比較的值是127呢?
當(dāng)我們定義的變長字段可能大于255(也就是超過一個字節(jié))時,MySQL如何才能知道當(dāng)前讀取的字節(jié)該字段的完成字段長度,還是該字段的半個字段長度,為了解決這個問題,MySQL使用了1字節(jié)的首位,當(dāng)首位為0表示當(dāng)前是1字節(jié),當(dāng)首位為0表示當(dāng)前長度是2字節(jié);由于占用了1字節(jié)的首位,所以剩下7位所能表示的最大值是127

變長字段不會存儲為Null列的長度;其次并不是行記錄中一定需要變長字段長度這段內(nèi)容,如果行記錄中沒有定義變長字段或者是變長字段都為Null,那么就不會有變長字段長度這部分

變長字段占用的字節(jié)數(shù)按照順序逆序存儲

Null值列表

一條記錄中某些列通常可能允許為null,所以Compact行格式把這些允許為null的進行了統(tǒng)一管理;

  1. 首先統(tǒng)計出表中定義的哪些列允許為null
  2. 如果表中的字段都不能為空,那么就不存在null值列表;如果存在允許為null的字段,那么就按照字段的順序為每個字段對應(yīng)一個二進制位,當(dāng)二進制位為1時表示該列值為空;當(dāng)二進制位位0時表示該列值不為空
  3. Null值列表必須有整數(shù)個字節(jié)來表示,所以對應(yīng)沒有占用的位使用0補位
image

行記錄的頭信息

頭信息中主要包含了6個字段,其中5個字段也是在面試中經(jīng)常被問到的,為了方便記憶,我們把5個字段對應(yīng)到手的5根指頭:

  • n_owned(拇指): 一個數(shù)據(jù)頁會被分成很多個組,每組最后的一條記錄該字段為1,其他記錄該字段為0,就像分組中所有的記錄的大哥;(對應(yīng)拇指)

  • deleted_flag(食指): 標記該記錄是被刪除的;當(dāng)記錄被刪除時不會真實刪除,而是用該字段標記,并且把所有刪除的記錄使用鏈表連接起來,以后的文章會繼續(xù)說到這個字段。(想象下你平時挖鼻屎是不是用的食指)

  • heap_no(中指): 表示當(dāng)前記錄在數(shù)據(jù)頁中的相對位置(MySQL使用該字段來表示記錄位置,可以和中指對應(yīng),不可描述)

  • record_type(無名指): 表示當(dāng)前記錄屬于哪種類型,(無名指用來帶戒指的,與分類有關(guān),可以把人分為已婚和未婚,)

    1. 0表示普通記錄
    2. 1表示目錄項記錄,索引中非葉子結(jié)點中的數(shù)據(jù)記錄都是1
    3. 2表示infrmum記錄,每個數(shù)據(jù)頁中至少會有兩條記錄,其中最小記錄的record_type=2
    4. 3表示Supremum記錄,每個數(shù)據(jù)頁中至少會有兩條記錄,其中最大記錄的record_type=3
  • next_record(小拇指): 存放下一條記錄的相對位置(當(dāng)數(shù)數(shù)時,左手的小拇指數(shù)完之后就該換右手了,和next_record表達的意思類型)

最后一個字段min_rec_flag : B+樹中每層非葉子結(jié)點最小目錄項記錄該字段為1;該字段相對于其他5個字段顯得不那么重要,不會影響理解B+樹索引

隱藏列

除了用戶自定義的數(shù)據(jù)列以外,MySQL還會為每行記錄生成3個隱藏列

  • row_id: 行ID,記錄的唯一標識;當(dāng)用戶在表中定義了主鍵字段就優(yōu)先選擇用戶定義的主鍵,如果沒有,就查找是否有定義不為null的唯一索引,如果有就把該列作為主鍵,如果沒有MySQL就會生成一列row_id隱藏列作為主鍵
  • trx_id: 事務(wù)的ID;該字段對于實現(xiàn)一致性視圖和事務(wù)隔離級別至關(guān)重要,以后會詳細說明
  • roll_pointer: 回滾指針,指向的是該記錄的上一個版本號,MySQL的MVCC主要就是通過這個字段來實現(xiàn)的。

溢出列

MySQL中所有的行記錄都會被存儲在數(shù)據(jù)頁中,每個數(shù)據(jù)頁的大小是16KB,也就是16384個字節(jié);在前面我們講過變長字段的長度可以用兩個字節(jié)來表示,所以列的最大長度可以是65535,當(dāng)遇到這種極端情況時,一個數(shù)據(jù)頁是存儲不下這一條記錄的。

Compact行格式針對這種情況的處理方式是在真實的數(shù)據(jù)處記錄該列的一部分數(shù)據(jù)(768字節(jié)),其他多余的數(shù)據(jù)會存儲到新的數(shù)據(jù)頁中(溢出頁),然后在該記錄中使用20個字節(jié)存儲這些數(shù)據(jù)頁的地址

image

溢出頁與溢出頁之間使用的鏈表相連接

其他的行記錄格式:

Redundant:MySQL5.0之前的格式,直接忽略

Dynamic,CompressedCompact很像,只是在溢出列的處理有些差異,他們只會在真實數(shù)據(jù)列中使用20個字節(jié)存儲溢出頁的地址

面試題

  • char(M)定義的字段,在變長字段的長度列表中會記錄該字段的長度嗎?

歡迎大家在評論區(qū)留言討論


最后(點關(guān)注,不迷路)

文中或許會存在或多或少的不足、錯誤之處,有建議或者意見也非常歡迎大家在評論交流。

最后,寫作不易,請不要白嫖我喲,希望朋友們可以點贊評論關(guān)注三連,因為這些就是我分享的全部動力來源??

image
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容