多個單列索引和聯(lián)合索引的區(qū)別詳解

參考地址https://blog.csdn.net/Abysscarry/article/details/80792876

為了提高數(shù)據(jù)庫效率,建索引是家常便飯;那么當(dāng)查詢條件為2個及以上時,我們是創(chuàng)建多個單列索引還是創(chuàng)建一個聯(lián)合索引好呢?他們之間的區(qū)別是什么?哪個效率高呢?我在這里詳細測試分析下。

一、聯(lián)合索引測試

注:Mysql版本為 5.7.20

創(chuàng)建測試表(表記錄數(shù)為63188):

CREATE TABLE `t_mobilesms_11` (

? `id` bigint(20) NOT NULL AUTO_INCREMENT,

? `userId` varchar(255) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL DEFAULT '' COMMENT '用戶id,創(chuàng)建任務(wù)時的userid',

? `mobile` varchar(24) NOT NULL DEFAULT '' COMMENT '手機號碼',

? `billMonth` varchar(32) DEFAULT NULL COMMENT '賬單月',

? `time` varchar(32) DEFAULT NULL COMMENT '收/發(fā)短信時間',

? `peerNumber` varchar(64) NOT NULL COMMENT '對方號碼',

? `location` varchar(64) DEFAULT NULL COMMENT '通信地(自己的)',

? `sendType` varchar(16) DEFAULT NULL COMMENT 'SEND-發(fā)送; RECEIVE-收取',

? `msgType` varchar(8) DEFAULT NULL COMMENT 'SMS-短信; MSS-彩信',

? `serviceName` varchar(256) DEFAULT NULL COMMENT '業(yè)務(wù)名稱. e.g. 點對點(網(wǎng)內(nèi))',

? `fee` int(11) DEFAULT NULL COMMENT '通信費(單位分)',

? `createTime` datetime DEFAULT NULL COMMENT '創(chuàng)建時間',

? `lastModifyTime` datetime DEFAULT NULL COMMENT '最后修改時間',

? PRIMARY KEY (`id`),

? KEY `聯(lián)合索引` (`userId`,`mobile`,`billMonth`)

) ENGINE=InnoDB AUTO_INCREMENT=71185 DEFAULT CHARSET=utf8 COMMENT='手機短信詳情'

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

我們?yōu)閡serId, mobile, billMonth三個字段添加上聯(lián)合索引!

我們選擇 explain 查看執(zhí)行計劃來觀察索引利用情況:

1.查詢條件為 userid

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE userid='2222'

1

可以通過key看到,聯(lián)合索引有效

2.查詢條件為 mobile

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE mobile='13281899972'

1

可以看到聯(lián)合索引無效

3.查詢條件為 billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE billMonth='2018-04'

1

聯(lián)合索引無效

4.查詢條件為 userid and mobile

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE userid='2222' AND mobile='13281899972'

1

聯(lián)合索引有效

5.查詢條件為 mobile and userid

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE? mobile='13281899972' AND userid='2222'

1

在4的基礎(chǔ)上調(diào)換了查詢條件的順序,發(fā)現(xiàn)聯(lián)合索引依舊有效

6.查詢條件為 userid or mobile

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE userid='2222' OR mobile='13281899972'

1

把 and 換成 or,發(fā)現(xiàn)聯(lián)合所索引無效!

7.查詢條件為 userid and billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE userid='2222' AND billMonth='2018-04'

1

這兩個條件分別位于聯(lián)合索引位置的第一和第三,測試聯(lián)合索引依舊有效!

8.查詢條件為 mobile and billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE mobile='13281899972' AND billMonth='2018-04'

1

這兩個條件分別位于聯(lián)合索引位置的第二和第三,發(fā)現(xiàn)聯(lián)合索引無效!

9.查詢條件為 userid and mobile and billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE? userid='2222' AND mobile='13281899972' AND billMonth='2018-04'

1

所有條件一起查詢,聯(lián)合索引有效!(當(dāng)然,這才是最正統(tǒng)的用法啊?。?/p>

二、單列索引測試

創(chuàng)建三個單列索引:

1.查詢條件為 userid and mobile and billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE? userid='2222' AND mobile='13281899972' AND billMonth='2018-04'

1

我們發(fā)現(xiàn)三個單列索引只有 userid 有效(位置為查詢條件第一個),其他兩個都沒有用上。

那么為什么沒有用上呢?按照我們的理解,三個字段都加索引了,無論怎么排列組合查詢,應(yīng)該都能利用到這三個索引才對!

其實這里其實涉及到了mysql優(yōu)化器的優(yōu)化策略!當(dāng)多條件聯(lián)合查詢時,優(yōu)化器會評估用哪個條件的索引效率最高!它會選擇最佳的索引去使用,也就是說,此處userid 、mobile 、billMonth這三個索引列都能用,只不過優(yōu)化器判斷只需要使用userid這一個索引就能完成本次查詢,故最終explain展示的key為userid。

當(dāng)然,如果優(yōu)化器判斷本次查詢非要全使用三個索引才能效率最高,那么explain的key就會是userid 、mobile 、billMonth,都會生效!

2.查詢條件為 mobile and billMonth

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE mobile='13281899972' AND billMonth='2018-04'

1

我們發(fā)現(xiàn)此處兩個查詢條件只有 mobile 生效(位置也為查詢條件第一個)

3.查詢條件為 userid or mobile

EXPLAIN SELECT * FROM `t_mobilesms_11` WHERE? userid='2222' OR mobile='13281899972'

1

這次把 and 換成 or,發(fā)現(xiàn)兩個查詢條件都用上索引了!

我們在網(wǎng)上可能常常看到有人說or會導(dǎo)致索引失效,其實這并不準(zhǔn)確。而且我們首先需要判斷用的是哪個數(shù)據(jù)庫哪個版本,什么引擎?

比如我用的是mysql5.7版本,innodb引擎,在這個環(huán)境下我們再去討論索引的具體問題。

關(guān)于or查詢的真相是:

所謂的索引失效指的是:假如or連接的倆個查詢條件字段中有一個沒有索引的話,引擎會放棄索引而產(chǎn)生全表掃描。我們從or的基本含義出發(fā)應(yīng)該能理解并認可這種說法,沒啥問題。

此刻需要注意type類型為index_merge。

我查資料說mysql 5.0 版本之前 使用or只會用到一個索引(即使如上我給userid和mobile都建立的單列索引),但自從5.0版本開始引入了index_merge索引合并優(yōu)化!也就是說,我們現(xiàn)在可以利用上多個索引去優(yōu)化or查詢了。

index_merge作用:

1、索引合并是把幾個索引的范圍掃描合并成一個索引。

2、索引合并的時候,會對索引進行并集,交集或者先交集再并集操作,以便合并成一個索引。

3、這些需要合并的索引只能是一個表的。不能對多表進行索引合并。

index_merge應(yīng)用場景:

1.對OR語句求并集,如查詢SELECT * FROM TB1 WHERE c1="xxx" OR c2=""xxx"時,如果c1和c2列上分別有索引,可以按照c1和c2條件進行查詢,再將查詢結(jié)果合并(union)操作,得到最終結(jié)果

2.對AND語句求交集,如查詢SELECT * FROM TB1 WHERE c1="xxx" AND c2=""xxx"時,如果c1和c2列上分別有索引,可以按照c1和c2條件進行查詢,再將查詢結(jié)果取交集(intersect)操作,得到最終結(jié)果

3.對AND和OR組合語句求結(jié)果

三、結(jié)論

通俗理解:

利用索引中的附加列,您可以縮小搜索的范圍,但使用一個具有兩列的索引 不同于使用兩個單獨的索引。復(fù)合索引的結(jié)構(gòu)與電話簿類似,人名由姓和名構(gòu)成,電話簿首先按姓氏對進行排序,然后按名字對有相同姓氏的人進行排序。如果您知道姓,電話簿將非常有用;如果您知道姓和名,電話簿則更為有用,但如果您只知道名不姓,電話簿將沒有用處。

所以說創(chuàng)建復(fù)合索引時,應(yīng)該仔細考慮列的順序。對索引中的所有列執(zhí)行搜索或僅對前幾列執(zhí)行搜索時,復(fù)合索引非常有用;僅對后面的任意列執(zhí)行搜索時,復(fù)合索引則沒有用處。

重點:

多個單列索引在多條件查詢時優(yōu)化器會選擇最優(yōu)索引策略,可能只用一個索引,也可能將多個索引全用上! 但多個單列索引底層會建立多個B+索引樹,比較占用空間,也會浪費一定搜索效率,故如果只有多條件聯(lián)合查詢時最好建聯(lián)合索引!

最左前綴原則:

顧名思義是最左優(yōu)先,以最左邊的為起點任何連續(xù)的索引都能匹配上,

注:如果第一個字段是范圍查詢需要單獨建一個索引

注:在創(chuàng)建聯(lián)合索引時,要根據(jù)業(yè)務(wù)需求,where子句中使用最頻繁的一列放在最左邊。這樣的話擴展性較好,比如 userid 經(jīng)常需要作為查詢條件,而 mobile 不常常用,則需要把 userid 放在聯(lián)合索引的第一位置,即最左邊

同時存在聯(lián)合索引和單列索引(字段有重復(fù)的),這個時候查詢mysql會怎么用索引呢?

這個涉及到mysql本身的查詢優(yōu)化器策略了,當(dāng)一個表有多條索引可走時, Mysql 根據(jù)查詢語句的成本來選擇走哪條索引;

有人說where查詢是按照從左到右的順序,所以篩選力度大的條件盡量放前面。網(wǎng)上百度過,很多都是這種說法,但是據(jù)我研究,mysql執(zhí)行優(yōu)化器會對其進行優(yōu)化,當(dāng)不考慮索引時,where條件順序?qū)π蕸]有影響,真正有影響的是是否用到了索引!

聯(lián)合索引本質(zhì):

當(dāng)創(chuàng)建**(a,b,c)聯(lián)合索引時,相當(dāng)于創(chuàng)建了(a)單列索引**,(a,b)聯(lián)合索引以及**(a,b,c)聯(lián)合索引**

想要索引生效的話,只能使用 a和a,b和a,b,c三種組合;當(dāng)然,我們上面測試過,a,c組合也可以,但實際上只用到了a的索引,c并沒有用到!

注:這個可以結(jié)合上邊的 通俗理解 來思考!

其他知識點:

1、需要加索引的字段,要在where條件中

2、數(shù)據(jù)量少的字段不需要加索引;因為建索引有一定開銷,如果數(shù)據(jù)量小則沒必要建索引(速度反而慢)

3、避免在where子句中使用or來連接條件,因為如果倆個字段中有一個沒有索引的話,引擎會放棄索引而產(chǎn)生全表掃描

4、聯(lián)合索引比對每個列分別建索引更有優(yōu)勢,因為索引建立得越多就越占磁盤空間,在更新數(shù)據(jù)的時候速度會更慢。另外建立多列索引時,順序也是需要注意的,應(yīng)該將嚴(yán)格的索引放在前面,這樣篩選的力度會更大,效率更高。

最后的說明:

網(wǎng)上關(guān)于索引優(yōu)化等文章太多了,針對各個數(shù)據(jù)庫各個版本各種引擎都可能存在不一樣的說法!

我們的SQL引擎自帶的優(yōu)化也越來越強大,說不定你的某個SQL優(yōu)化認知,其SQL引擎在某次升級中早就自優(yōu)化了。

所以要么跟進官方文檔,要么關(guān)注數(shù)據(jù)庫大牛的最新文章,要么在現(xiàn)有數(shù)據(jù)庫環(huán)境下自己去親手測試!

數(shù)據(jù)庫領(lǐng)域的水很深。。大家加油。。共勉 ~

————————————————

版權(quán)聲明:本文為CSDN博主「深寒丶」的原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。

原文鏈接:https://blog.csdn.net/Abysscarry/article/details/80792876

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容