數(shù)據(jù)存儲(chǔ) - MySQL 規(guī)范

學(xué)習(xí)完整課程請(qǐng)移步 互聯(lián)網(wǎng) Java 全棧工程師

基礎(chǔ)規(guī)范

  • 表存儲(chǔ)引擎必須使用 InnoDB
  • 表字符集默認(rèn)使用 utf8,必要時(shí)候使用 utf8mb4
    • 通用,無亂碼風(fēng)險(xiǎn),漢字 3 字節(jié),英文 1 字節(jié)
    • utf8mb4utf8 的超集,有存儲(chǔ) 4 字節(jié)例如表情符號(hào)時(shí),使用它
  • 禁止使用存儲(chǔ)過程,視圖,觸發(fā)器,Event
    • 對(duì)數(shù)據(jù)庫性能影響較大,互聯(lián)網(wǎng)業(yè)務(wù),能讓站點(diǎn)層和服務(wù)層干的事情,不要交到數(shù)據(jù)庫層
    • 調(diào)試,排錯(cuò),遷移都比較困難,擴(kuò)展性較差
  • 禁止在數(shù)據(jù)庫中存儲(chǔ)大文件,例如照片,可以將大文件存儲(chǔ)在對(duì)象存儲(chǔ)系統(tǒng),數(shù)據(jù)庫中存儲(chǔ)路徑
  • 禁止在線上環(huán)境做數(shù)據(jù)庫壓力測試
  • 測試,開發(fā),線上數(shù)據(jù)庫環(huán)境必須隔離

命名規(guī)范

  • 庫名,表名,列名必須用小寫,采用下劃線分隔
    • abc,Abc,ABC 都是給自己埋坑
  • 庫名,表名,列名必須見名知義,長度不要超過 32 字符
    • tmp,wushan 誰 TM 知道這些庫是干嘛的
  • 庫備份必須以 bak 為前綴,以日期為后綴
  • 從庫必須以 -s 為后綴
  • 備庫必須以 -ss 為后綴

表設(shè)計(jì)規(guī)范

  • 單實(shí)例表個(gè)數(shù)必須控制在 2000 個(gè)以內(nèi)
  • 單表分表個(gè)數(shù)必須控制在 1024 個(gè)以內(nèi)
  • 表必須有主鍵,推薦使用 UNSIGNED 整數(shù)為主鍵
    • 刪除無主鍵的表,如果是 row 模式的主從架構(gòu),從庫會(huì)掛住
  • 禁止使用外鍵,如果要保證完整性,應(yīng)由應(yīng)用程式實(shí)現(xiàn)
    • 外鍵使得表之間相互耦合,影響 update/delete 等 SQL 性能,有可能造成死鎖,高并發(fā)情況下容易成為數(shù)據(jù)庫瓶頸
  • 建議將大字段,訪問頻度低的字段拆分到單獨(dú)的表中存儲(chǔ),分離冷熱數(shù)據(jù)(具體參考:《如何實(shí)施數(shù)據(jù)庫垂直拆分》

列設(shè)計(jì)規(guī)范

  • 根據(jù)業(yè)務(wù)區(qū)分使用 tinyint/int/bigint,分別會(huì)占用 1/4/8 字節(jié)
  • 根據(jù)業(yè)務(wù)區(qū)分使用 char/varchar
    • 字段長度固定,或者長度近似的業(yè)務(wù)場景,適合使用 char,能夠減少碎片,查詢性能高
    • 字段長度相差較大,或者更新較少的業(yè)務(wù)場景,適合使用 varchar,能夠減少空間
  • 根據(jù)業(yè)務(wù)區(qū)分使用 datetime/timestamp
    • 前者占用 5 個(gè)字節(jié),后者占用 4 個(gè)字節(jié),存儲(chǔ)年使用 YEAR,存儲(chǔ)日期使用 DATE,存儲(chǔ)時(shí)間使用 datetime
  • 必須把字段定義為 NOT NULL 并設(shè)默認(rèn)值
    • NULL 的列使用索引,索引統(tǒng)計(jì),值都更加復(fù)雜,MySQL 更難優(yōu)化
    • NULL 需要更多的存儲(chǔ)空間
    • NULL 只能采用 IS NULL 或者 IS NOT NULL ,而在 =/!=/in/not in 時(shí)有大坑
  • 使用 INT UNSIGNED 存儲(chǔ) IPv4 ,不要用 char(15)
  • 使用 varchar(20) 存儲(chǔ)手機(jī)號(hào),不要使用整數(shù)
    • 牽扯到國家代號(hào),可能出現(xiàn) +/-/() 等字符,例如 +86
    • 手機(jī)號(hào)不會(huì)用來做數(shù)學(xué)運(yùn)算
    • varchar 可以模糊查詢,例如 like‘138%’
  • 使用 TINYINT 來代替 ENUM
    • ENUM 增加新值要進(jìn)行 DDL 操作

索引規(guī)范

  • 唯一索引使用 uniq_[字段名] 來命名
  • 非唯一索引使用 idx_[字段名] 來命名
  • 單張表索引數(shù)量建議控制在 5 個(gè)以內(nèi)
    • 互聯(lián)網(wǎng)高并發(fā)業(yè)務(wù),太多索引會(huì)影響寫性能
    • 生成執(zhí)行計(jì)劃時(shí),如果索引太多,會(huì)降低性能,并可能導(dǎo)致 MySQL 選擇不到最優(yōu)索引
    • 異常復(fù)雜的查詢需求,可以選擇 ES 等更為適合的方式存儲(chǔ)
  • 組合索引字段數(shù)不建議超過 5 個(gè)
    • 如果 5 個(gè)字段還不能極大縮小 row 范圍,八成是設(shè)計(jì)有問題
  • 不建議在頻繁更新的字段上建立索引
  • 非必要不要進(jìn)行 JOIN 查詢,如果要進(jìn)行 JOIN 查詢,被 JOIN 的字段必須類型相同,并建立索引
    • 踩過因?yàn)?JOIN 字段類型不一致,而導(dǎo)致全表掃描的坑么?
  • 理解組合索引最左前綴原則,避免重復(fù)建設(shè)索引,如果建立了(a,b,c),相當(dāng)于建立了(a), (a,b), (a,b,c)

SQL 規(guī)范

  • 禁止使用 select *,只獲取必要字段
    • select * 會(huì)增加 cpu/io/內(nèi)存/帶寬 的消耗
    • 指定字段能有效利用索引覆蓋
    • 指定字段查詢,在表結(jié)構(gòu)變更時(shí),能保證對(duì)應(yīng)用程序無影響
  • insert 必須指定字段,禁止使用 insert into T values()
    • 指定字段插入,在表結(jié)構(gòu)變更時(shí),能保證對(duì)應(yīng)用程序無影響
  • 隱式類型轉(zhuǎn)換會(huì)使索引失效,導(dǎo)致全表掃描
  • 禁止在 where 條件列使用函數(shù)或者表達(dá)式
    • 導(dǎo)致不能命中索引,全表掃描
  • 禁止負(fù)向查詢以及 % 開頭的模糊查詢
    • 導(dǎo)致不能命中索引,全表掃描
  • 禁止大表 JOIN 和子查詢
  • 同一個(gè)字段上的 OR 必須改寫問 IN,IN 的值必須少于 50 個(gè)
  • 應(yīng)用程序必須捕獲 SQL 異常
    • 方便定位線上問題

說明

本規(guī)范適用于并發(fā)量大,數(shù)據(jù)量大的典型互聯(lián)網(wǎng)業(yè)務(wù),可直接帶走參考,不謝。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容