MySQL 的邏輯架構(gòu)圖

MySQL 可以分為 Server 層和存儲引擎層兩部分。
1、Server 層包括連接器、查詢緩存、分析器、優(yōu)化器、執(zhí)行器等,涵蓋 MySQL 的大多數(shù)核心服務(wù)功能,以及所有的內(nèi)置函數(shù)(如日期、時間、數(shù)學(xué)和加密函數(shù)等),所有跨存儲引擎的功能都在這一層實現(xiàn),比如存儲過程、觸發(fā)器、視圖等。
2、存儲引擎層負責(zé)數(shù)據(jù)的存儲和提取。其架構(gòu)模式是插件式的,支持 InnoDB、MyISAM、Memory 等多個存儲引擎。現(xiàn)在最常用的存儲引擎是 InnoDB,它從 MySQL 5.5.5 版本開始成為了默認存儲引擎。
也就是說,你執(zhí)行 create table 建表的時候,如果不指定引擎類型,默認使用的就是 InnoDB。不過,你也可以通過指定存儲引擎的類型來選擇別的引擎,比如在 create table 語句中使用 engine=memory, 來指定使用內(nèi)存引擎創(chuàng)建表。不同存儲引擎的表數(shù)據(jù)存取方式不同,支持的功能也不同,不同的存儲引擎共用一個 Server 層
連接器
連接器負責(zé)跟客戶端建立連接、獲取權(quán)限、維持和管理連接。連接命令一般是這么寫的:
mysql -h$ip -P$port -u$user -p
連接操作
連接命令中的 mysql 是客戶端工具,用來跟服務(wù)端建立連接。在完成經(jīng)典的 TCP 握手后,連接器就要開始認證你的身份,這個時候用的就是你輸入的用戶名和密碼。
- 如果用戶名或密碼不對,你就會收到一個"Access denied for user"的錯誤,然后客戶端程序結(jié)束執(zhí)行。
- 如果用戶名密碼認證通過,連接器會到權(quán)限表里面查出你擁有的權(quán)限。之后,這個連接里面的權(quán)限判斷邏輯,都將依賴于此時讀到的權(quán)限。
一個用戶成功建立連接后,MySQL 修改用戶權(quán)限,下次登錄生效
連接完成
連接完成后,如果你沒有后續(xù)的動作,這個連接就處于空閑狀態(tài)??蛻舳巳绻L時間沒動靜,連接器就會自動將它斷開。這個時間是由參數(shù) wait_timeout 控制的,默認值是 8 小時。
長連接與短連接
1、長連接是指連接成功后,如果客戶端持續(xù)有請求,則一直使用同一個連接。
2、短連接則是指每次執(zhí)行完很少的幾次查詢就斷開連接,下次查詢再重新建立一個。
(盡量減少建立連接的動作,也就是盡量使用長連接。)
mysql執(zhí)行中一些數(shù)據(jù)綁定在連接對象中,因為長連接長時間不斷開導(dǎo)致內(nèi)存占用太多??梢允褂枚〞r超時斷開,或在每次執(zhí)行一個比較大的操作后,通過重新初始化連接資源,達到清空效果。(重新初始化這個過程不需要重連和重新做權(quán)限驗證,但是會將連接恢復(fù)到剛剛創(chuàng)建完時的狀態(tài)。)
查詢緩存
連接建立完成后,你就可以執(zhí)行 select 語句了。執(zhí)行邏輯就會來到第二步:查詢緩存。
MySQL 拿到一個查詢請求后,會先到查詢緩存看看,之前是不是執(zhí)行過這條語句。之前執(zhí)行過的語句及其結(jié)果可能會以 key-value 對的形式,被直接緩存在內(nèi)存中。key 是查詢的語句,value 是查詢的結(jié)果。如果你的查詢能夠直接在這個緩存中找到 key,那么這個 value 就會被直接返回給客戶端。如果語句不在查詢緩存中,就會繼續(xù)后面的執(zhí)行階段。執(zhí)行完成后,執(zhí)行結(jié)果會被存入查詢緩存中。
MySQL 8.0 版本直接將查詢緩存的整塊功能刪掉了,因為查詢緩存往往弊大于利
查詢緩存的失效非常頻繁,只要有對一個表的更新,這個表上所有的查詢緩存都會被清空。因此很可能你費勁地把結(jié)果存起來,還沒使用呢,就被一個更新全清空了。對于更新壓力大的數(shù)據(jù)庫來說,查詢緩存的命中率會非常低。除非你的業(yè)務(wù)就是有一張靜態(tài)表,很長時間才會更新一次。比如,一個系統(tǒng)配置表,那這張表上的查詢才適合使用查詢緩存。
分析器
分析器主要是對sql語句進行詞法分析和語法分析
詞法分析
你輸入的是由多個字符串和空格組成的一條 SQL 語句,MySQL 需要識別出里面的字符串分別是什么,代表什么。
MySQL 從你輸入的"select"這個關(guān)鍵字識別出來,這是一個查詢語句。它也要把字符串“T”識別成“表名 T”,把字符串“ID”識別成“列 ID”。
語法分析
做完了這些識別以后,就要做“語法分析”。根據(jù)詞法分析的結(jié)果,語法分析器會根據(jù)語法規(guī)則,判斷你輸入的這個 SQL 語句是否滿足 MySQL 語法。
優(yōu)化器
經(jīng)過了分析器,MySQL 就知道你要做什么了。在開始執(zhí)行之前,還要先經(jīng)過優(yōu)化器的處理。
優(yōu)化器是在表里面有多個索引的時候,決定使用哪個索引;或者在一個語句有多表關(guān)聯(lián)(join)的時候,決定各個表的連接順序。比如你執(zhí)行下面這樣的語句,這個語句是執(zhí)行兩個表的 join:
mysql> select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
- 既可以先從表 t1 里面取出 c=10 的記錄的 ID 值,再根據(jù) ID 值關(guān)聯(lián)到表 t2,再判斷 t2 里面 d 的值是否等于 20。
- 也可以先從表 t2 里面取出 d=20 的記錄的 ID 值,再根據(jù) ID 值關(guān)聯(lián)到 t1,再判斷 t1 里面 c 的值是否等于 10。
這兩種執(zhí)行方法的邏輯結(jié)果是一樣的,但是執(zhí)行的效率會有不同,而優(yōu)化器的作用就是決定選擇使用哪一個方案。
優(yōu)化器階段完成后,這個語句的執(zhí)行方案就確定下來了,然后進入執(zhí)行器階段。如果你還有一些疑問,比如優(yōu)化器是怎么選擇索引的,有沒有可能選擇錯等等,沒關(guān)系,我會在后面的文章中單獨展開說明優(yōu)化器的內(nèi)容。
執(zhí)行器
MySQL 通過分析器知道了你要做什么,通過優(yōu)化器知道了該怎么做,于是就進入了執(zhí)行器階段,開始執(zhí)行語句。
開始執(zhí)行的時候,要先判斷一下你對這個表 T 有沒有執(zhí)行查詢的權(quán)限,
1、如果沒有,就會返回沒有權(quán)限的錯誤
2、如果有權(quán)限,就打開表繼續(xù)執(zhí)行。打開表的時候,執(zhí)行器就會根據(jù)表的引擎定義,去使用這個引擎提供的接口。
select * from T where ID=10;
比如我們這個例子中的表 T 中,ID 字段沒有索引,那么執(zhí)行器的執(zhí)行流程是這樣的:
1、調(diào)用 InnoDB 引擎接口取這個表的第一行,判斷 ID 值是不是 10,如果不是則跳過,如果是則將這行存在結(jié)果集中;
2、調(diào)用引擎接口取“下一行”,重復(fù)相同的判斷邏輯,直到取到這個表的最后一行。
3、執(zhí)行器將上述遍歷過程中所有滿足條件的行組成的記錄集作為結(jié)果集返回給客戶端。
對于有索引的表,執(zhí)行的邏輯也差不多。第一次調(diào)用的是“取滿足條件的第一行”這個接口,之后循環(huán)取“滿足條件的下一行”這個接口,這些接口都是引擎中已經(jīng)定義好的。
你會在數(shù)據(jù)庫的慢查詢?nèi)罩局锌吹揭粋€ rows_examined 的字段,表示這個語句執(zhí)行過程中掃描了多少行。這個值就是在執(zhí)行器每次調(diào)用引擎獲取數(shù)據(jù)行的時候累加的。
在有些場景下,執(zhí)行器調(diào)用一次,在引擎內(nèi)部則掃描了多行,因此引擎掃描行數(shù)跟 rows_examined 并不是完全相同的。我們后面會專門有一篇文章來講存儲引擎的內(nèi)部機制,里面會有詳細的說明。