重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

版權(quán)聲明:本文為博主原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。 https://blog.csdn.net/a724888/article/details/79394168

本文不堆疊網(wǎng)上海量的sql優(yōu)化技巧或是訣竅。只通過(guò)兩個(gè)淺顯易懂又實(shí)用的例子介紹mysql的sql語(yǔ)句優(yōu)化。

首先介紹一下一般的大表優(yōu)化方案。當(dāng)MySQL單表記錄數(shù)過(guò)大時(shí),增刪改查性能都會(huì)急劇下降,可以參考以下步驟來(lái)優(yōu)化:

單表優(yōu)化

微信公眾號(hào)【黃小斜】大廠程序員,互聯(lián)網(wǎng)行業(yè)新知,終身學(xué)習(xí)踐行者。關(guān)注后回復(fù)「Java」、「Python」、「C++」、「大數(shù)據(jù)」、「機(jī)器學(xué)習(xí)」、「算法」、「AI」、「Android」、「前端」、「iOS」、「考研」、「BAT」、「校招」、「筆試」、「面試」、「面經(jīng)」、「計(jì)算機(jī)基礎(chǔ)」、「LeetCode」 等關(guān)鍵字可以獲取對(duì)應(yīng)的免費(fèi)學(xué)習(xí)資料。

                 ![](https://upload-images.jianshu.io/upload_images/5447660-2390da759f43a606.jpeg)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== "點(diǎn)擊并拖拽以移動(dòng)")?

除非單表數(shù)據(jù)未來(lái)會(huì)一直不斷上漲,否則不要一開(kāi)始就考慮拆分,拆分會(huì)帶來(lái)邏輯、部署、運(yùn)維的各種復(fù)雜度,一般以整型值為主的表在千萬(wàn)級(jí)以下,字符串為主的表在五百萬(wàn)以下是沒(méi)有太大問(wèn)題的。而事實(shí)上很多時(shí)候MySQL單表的性能依然有不少優(yōu)化空間,甚至能正常支撐千萬(wàn)級(jí)以上的數(shù)據(jù)量:

字段

  • 盡量使用TINYINTSMALLINT、MEDIUM_INT作為整數(shù)類(lèi)型而非INT,如果非負(fù)則加上UNSIGNED

  • VARCHAR的長(zhǎng)度只分配真正需要的空間

  • 使用枚舉或整數(shù)代替字符串類(lèi)型

  • 盡量使用TIMESTAMP而非DATETIME

  • 單表不要有太多字段,建議在20以內(nèi)

  • 避免使用NULL字段,很難查詢優(yōu)化且占用額外索引空間

  • 用整型來(lái)存IP

索引

  • 索引并不是越多越好,要根據(jù)查詢有針對(duì)性的創(chuàng)建,考慮在WHEREORDER BY命令上涉及的列建立索引,可根據(jù)EXPLAIN來(lái)查看是否用了索引還是全表掃描

  • 應(yīng)盡量避免在WHERE子句中對(duì)字段進(jìn)行NULL值判斷,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描

  • 值分布很稀少的字段不適合建索引,例如"性別"這種只有兩三個(gè)值的字段

  • 字符字段只建前綴索引

  • 字符字段最好不要做主鍵

  • 不用外鍵,由程序保證約束

  • 盡量不用UNIQUE,由程序保證約束

  • 使用多列索引時(shí)主意順序和查詢條件保持一致,同時(shí)刪除不必要的單列索引

查詢SQL

  • 可通過(guò)開(kāi)啟慢查詢?nèi)罩緛?lái)找出較慢的SQL

  • 不做列運(yùn)算:SELECT id WHERE age + 1 = 10,任何對(duì)列的操作都將導(dǎo)致表掃描,它包括數(shù)據(jù)庫(kù)教程函數(shù)、計(jì)算表達(dá)式等等,查詢時(shí)要盡可能將操作移至等號(hào)右邊

  • sql語(yǔ)句盡可能簡(jiǎn)單:一條sql只能在一個(gè)cpu運(yùn)算;大語(yǔ)句拆小語(yǔ)句,減少鎖時(shí)間;一條大sql可以堵死整個(gè)庫(kù)

  • 不用SELECT *

  • OR改寫(xiě)成INOR的效率是n級(jí)別,IN的效率是log(n)級(jí)別,in的個(gè)數(shù)建議控制在200以內(nèi)

  • 不用函數(shù)和觸發(fā)器,在應(yīng)用程序?qū)崿F(xiàn)

  • 避免%xxx式查詢

  • 少用JOIN

  • 使用同類(lèi)型進(jìn)行比較,比如用'123''123'比,123123

  • 盡量避免在WHERE子句中使用!=或<>操作符,否則將引擎放棄使用索引而進(jìn)行全表掃描

  • 對(duì)于連續(xù)數(shù)值,使用BETWEEN不用INSELECT id FROM t WHERE num BETWEEN 1 AND 5

  • 列表數(shù)據(jù)不要拿全表,要使用LIMIT來(lái)分頁(yè),每頁(yè)數(shù)量也不要太大

引擎

目前廣泛使用的是MyISAM和InnoDB兩種引擎:

MyISAM

MyISAM引擎是MySQL 5.1及之前版本的默認(rèn)引擎,它的特點(diǎn)是:

  • 不支持行鎖,讀取時(shí)對(duì)需要讀到的所有表加鎖,寫(xiě)入時(shí)則對(duì)表加排它鎖

  • 不支持事務(wù)

  • 不支持外鍵

  • 不支持崩潰后的安全恢復(fù)

  • 在表有讀取查詢的同時(shí),支持往表中插入新紀(jì)錄

  • 支持BLOBTEXT的前500個(gè)字符索引,支持全文索引

  • 支持延遲更新索引,極大提升寫(xiě)入性能

  • 對(duì)于不會(huì)進(jìn)行修改的表,支持壓縮表,極大減少磁盤(pán)空間占用

InnoDB

InnoDB在MySQL 5.5后成為默認(rèn)索引,它的特點(diǎn)是:

  • 支持行鎖,采用MVCC來(lái)支持高并發(fā)

  • 支持事務(wù)

  • 支持外鍵

  • 支持崩潰后的安全恢復(fù)

  • 不支持全文索引

總體來(lái)講,MyISAM適合SELECT密集型的表,而InnoDB適合INSERTUPDATE密集型的表

0、自己寫(xiě)的海量數(shù)據(jù)sql優(yōu)化實(shí)踐

首先是建表和導(dǎo)數(shù)據(jù)的過(guò)程。

參考https://nsimple.top/archives/mysql-create-million-data.html

有時(shí)候我們需要對(duì)大數(shù)據(jù)進(jìn)行測(cè)試,本地一般沒(méi)有那么多數(shù)據(jù),就需要我們自己生成一些。下面會(huì)借助內(nèi)存表的特點(diǎn)進(jìn)行生成百萬(wàn)條測(cè)試數(shù)據(jù)。

  1. 創(chuàng)建一個(gè)臨時(shí)內(nèi)存表, 做數(shù)據(jù)插入的時(shí)候會(huì)比較快些

SQL

-- 創(chuàng)建一個(gè)臨時(shí)內(nèi)存表
DROP TABLE IF EXISTS `vote_record_memory`;
CREATE TABLE `vote_record_memory` (
    `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
    `user_id` varchar(20) NOT NULL DEFAULT '',
    `vote_num` int(10) unsigned NOT NULL DEFAULT '0',
    `group_id` int(10) unsigned NOT NULL DEFAULT '0',
    `status` tinyint(2) unsigned NOT NULL DEFAULT '1',
    `create_time` datetime NOT NULL DEFAULT '0000-00-00 00:00:00',
    PRIMARY KEY (`id`),
    KEY `index_user_id` (`user_id`) USING HASH
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

  1. -- 創(chuàng)建一個(gè)普通表,用作模擬大數(shù)據(jù)的測(cè)試用例

SQL

DROP TABLE IF EXISTS `vote_record`;
CREATE TABLE `vote_record` (
    `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
    `user_id` varchar(20) NOT NULL DEFAULT '' COMMENT '用戶Id',
    `vote_num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '投票數(shù)',
    `group_id` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '用戶組id 0-未激活用戶 1-普通用戶 2-vip用戶 3-管理員用戶',
    `status` tinyint(2) unsigned NOT NULL DEFAULT '1' COMMENT '狀態(tài) 1-正常 2-已刪除',
    `create_time` int(10) unsigned NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '創(chuàng)建時(shí)間',
    PRIMARY KEY (`id`),
    KEY `index_user_id` (`user_id`) USING HASH COMMENT '用戶ID哈希索引'
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='投票記錄表';

  1. 為了數(shù)據(jù)的隨機(jī)性和真實(shí)性,我們需要?jiǎng)?chuàng)建一個(gè)可生成長(zhǎng)度為n的隨機(jī)字符串的函數(shù)。

SQL

-- 創(chuàng)建生成長(zhǎng)度為n的隨機(jī)字符串的函數(shù)
DELIMITER // -- 修改MySQL delimiter:'//'
DROP FUNCTION IF EXISTS `rand_string` //
SET NAMES utf8 //
CREATE FUNCTION `rand_string` (n INT) RETURNS VARCHAR(255) CHARSET 'utf8'
BEGIN 
    DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
    DECLARE return_str varchar(255) DEFAULT '';
    DECLARE i INT DEFAULT 0;
    WHILE i < n DO
        SET return_str = concat(return_str, substring(char_str, FLOOR(1 + RAND()*62), 1));
        SET i = i+1;
    END WHILE;
    RETURN return_str;
END //

  1. 為了操作方便,我們?cè)賱?chuàng)建一個(gè)插入數(shù)據(jù)的存儲(chǔ)過(guò)程

SQL

-- 創(chuàng)建插入數(shù)據(jù)的存儲(chǔ)過(guò)程
DROP PROCEDURE IF EXISTS `add_vote_record_memory` //
CREATE PROCEDURE `add_vote_record_memory`(IN n INT)
BEGIN
    DECLARE i INT DEFAULT 1;
    DECLARE vote_num INT DEFAULT 0;
    DECLARE group_id INT DEFAULT 0;
    DECLARE status TINYINT DEFAULT 1;
    WHILE i < n DO
        SET vote_num = FLOOR(1 + RAND() * 10000);
        SET group_id = FLOOR(0 + RAND()*3);
        SET status = FLOOR(1 + RAND()*2);
        INSERT INTO `vote_record_memory` VALUES (NULL, rand_string(20), vote_num, group_id, status, NOW());
        SET i = i + 1;
    END WHILE;
END //
DELIMITER ;  -- 改回默認(rèn)的 MySQL delimiter:';'

  1. 開(kāi)始執(zhí)行存儲(chǔ)過(guò)程,等待生成數(shù)據(jù)(10W條生成大約需要40分鐘)

SQL

-- 調(diào)用存儲(chǔ)過(guò)程 生成100W條數(shù)據(jù)
CALL add_vote_record_memory(1000000);

  1. 查詢內(nèi)存表已生成記錄(為了下步測(cè)試,目前僅生成了105645條)

SQL

SELECT count(*) FROM `vote_record_memory`;
-- count(*)
-- 105646

  1. 把數(shù)據(jù)從內(nèi)存表插入到普通表中(10w條數(shù)據(jù)13s就插入完了)

SQL

INSERT INTO vote_record SELECT * FROM `vote_record_memory`;

  1. 查詢普通表已的生成記錄

SQL

SELECT count(*) FROM `vote_record`;
-- count(*)
-- 105646

  1. 如果一次性插入普通表太慢,可以分批插入,這就需要寫(xiě)個(gè)存儲(chǔ)過(guò)程了:

SQL

-- 參數(shù)n是每次要插入的條數(shù)
-- lastid是已導(dǎo)入的最大id
CREATE PROCEDURE `copy_data_from_tmp`(IN n INT)
BEGIN
    DECLARE lastid INT DEFAULT 0;
    SELECT MAX(id) INTO lastid FROM `vote_record`;
    INSERT INTO `vote_record` SELECT * FROM `vote_record_memory` where id > lastid LIMIT n;
END

  1. 調(diào)用存儲(chǔ)過(guò)程:

SQL

-- 調(diào)用存儲(chǔ)過(guò)程 插入60w條
CALL copy_data_from_tmp(600000);

SELECT * FROM vote_record;

全表查詢

建完表以后開(kāi)啟慢查詢?nèi)罩?,具體參考下面的例子,然后學(xué)會(huì)用explain。windows慢日志的位置在c盤(pán),另外,使用client工具也可以記錄慢日志,所以不一定要用命令行來(lái)執(zhí)行測(cè)試,否則大表數(shù)據(jù)在命令行中要顯示的非常久。

1 全表掃描select * from vote_record


慢日志

SET timestamp=1529034398;
select * from vote_record;

Time: 2018-06-15T03:52:58.804850Z

User@Host: root[root] @ localhost [::1] Id: 74

Query_time: 3.166424 Lock_time: 0.000000 Rows_sent: 900500 Rows_examined: 999999

耗時(shí)3秒,我設(shè)置的門(mén)檻是一秒。所以記錄了下來(lái)。

explain執(zhí)行計(jì)劃

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N ALL \N \N \N \N 996507 100.00 \N

全表掃描耗時(shí)3秒多,用不到索引。

2 select * from vote_record where vote_num > 1000

沒(méi)有索引,所以相當(dāng)于全表掃描,一樣是3.5秒左右

3 select * from vote_record where vote_num > 1000

**加索引create **

CREATE INDEX vote ON vote_record(vote_num);

/索引信息/--------------

Table Non_unique Key_name Seq_in_index Column_name Collation Cardinality Sub_part Packed Null Index_type Comment Index_comment


vote_record 0 PRIMARY 1 id A 996507 (NULL) (NULL) BTREE
vote_record 1 votenum 1 vote_num A 9942 (NULL) (NULL) BTREE

/DDL 信息/------------

CREATE TABLE vote_record (
id int(10) unsigned NOT NULL AUTO_INCREMENT,
user_id varchar(20) NOT NULL DEFAULT '' COMMENT '用戶Id',
vote_num int(10) unsigned NOT NULL DEFAULT '0' COMMENT '投票數(shù)',
group_id int(10) unsigned NOT NULL DEFAULT '0' COMMENT '用戶組id 0-未激活用戶 1-普通用戶 2-vip用戶 3-管理員用戶',
status tinyint(2) unsigned NOT NULL DEFAULT '1' COMMENT '狀態(tài) 1-正常 2-已刪除',
create_time datetime NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '創(chuàng)建時(shí)間',
PRIMARY KEY (id),
KEY votenum (vote_num)
) ENGINE=InnoDB AUTO_INCREMENT=1000000 DEFAULT CHARSET=utf8 COMMENT='投票記錄表'

explain查看執(zhí)行計(jì)劃

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N ALL votenum,vote \N \N \N 996507 50.00 Using where

還是沒(méi)用到索引,因?yàn)椴环献钭笄熬Y匹配。查詢需要3.5秒左右

最后修改一下sql語(yǔ)句

EXPLAIN SELECT * FROM vote_record WHERE id > 0 AND vote_num > 1000;

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N range PRIMARY,votenum,vote PRIMARY 4 \N 498253 50.00 Using where

用到了索引,但是只用到了主鍵索引。再修改一次

EXPLAIN SELECT * FROM vote_record WHERE id > 0 AND vote_num = 1000;

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N index_merge PRIMARY,votenum,vote votenum,PRIMARY 8,4 \N 51 100.00 Using intersect(votenum,PRIMARY); Using where

用到了兩個(gè)索引,votenum,PRIMARY。

這是為什么呢。

再看一個(gè)語(yǔ)句

EXPLAIN SELECT * FROM vote_record WHERE id = 1000 AND vote_num > 1000

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N const PRIMARY,votenum PRIMARY 4 const 1 100.00 \N

也只有主鍵用到了索引。這是因?yàn)橹挥凶钭笄熬Y索引可以用>或<,其他索引用<或者>會(huì)導(dǎo)致用不到索引。

下面是幾個(gè)網(wǎng)上參考的例子:

一:索引是sql語(yǔ)句優(yōu)化的關(guān)鍵,學(xué)會(huì)使用慢日志和執(zhí)行計(jì)劃分析sql

背景:使用A電腦安裝mysql,B電腦通過(guò)xshell方式連接,數(shù)據(jù)內(nèi)容我都已經(jīng)創(chuàng)建好,現(xiàn)在我已正常的進(jìn)入到mysql中

步驟1:設(shè)置慢查詢?nèi)罩镜某瑫r(shí)時(shí)間,先查看日志存放路徑查詢慢日志的地址,因?yàn)橛新樵兊膬?nèi)容,就會(huì)到這個(gè)日志中:

<pre>show global variables like "%slow%";</pre>

2.開(kāi)啟慢查詢?nèi)罩?/p>

<pre>set global slow_query_log=on;</pre>

3.查看慢查詢?nèi)罩镜脑O(shè)置時(shí)間,是否是自己需要的

<pre>show global variables like "%long%";</pre>

4.如果不是自己想的時(shí)間,修改慢查詢時(shí)間,只要超過(guò)了以下的設(shè)置時(shí)間,查詢的日志就會(huì)到剛剛的日志中,我設(shè)置查詢時(shí)間超過(guò)1S就進(jìn)入到慢查詢?nèi)罩局?/p>

<pre>set global long_query_time=1;</pre>

5.大數(shù)據(jù)已準(zhǔn)備,進(jìn)行數(shù)據(jù)的查詢,xshell最好開(kāi)兩個(gè)窗口,一個(gè)查看日志,一個(gè)執(zhí)行內(nèi)容

<pre>Sql查詢語(yǔ)句:select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'</pre>

發(fā)現(xiàn)查數(shù)據(jù)的總時(shí)間去掉了17.74S

查看日志:打開(kāi)日志

標(biāo)記1:執(zhí)行的sql語(yǔ)句

標(biāo)記2:執(zhí)行sql的時(shí)間,我的是10點(diǎn)52執(zhí)行的

標(biāo)記3:使用那臺(tái)機(jī)器

標(biāo)記4:執(zhí)行時(shí)間,query_tims,查詢數(shù)據(jù)的時(shí)間

標(biāo)記5:不知道是干嘛的

標(biāo)記6:執(zhí)行耗時(shí)的sql語(yǔ)句,我在想我1的應(yīng)該是截取錯(cuò)了!但是記住最后一定是顯示耗時(shí)是因?yàn)閳?zhí)行什么sql造成的

6.執(zhí)行打印計(jì)劃,主要是查看是否使用了索引等其他內(nèi)容,主要就是在sql前面加上explain 關(guān)鍵字

<pre>explain select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M';</pre>

描述extra中,表示只使用了where條件,沒(méi)有其他什么索引之類(lèi)的

7.進(jìn)行sql優(yōu)化,建一個(gè)fist_name的索引,索引就是將你需要的數(shù)據(jù)先給篩選出來(lái),這樣就可以節(jié)省很多掃描時(shí)間

<pre>create index firstname on employees_tmp(first_name);</pre>

注:創(chuàng)建索引時(shí)會(huì)很慢,是對(duì)整個(gè)表做了一個(gè)復(fù)制功能,并進(jìn)行數(shù)據(jù)的一些分類(lèi)(我猜是這樣,所以會(huì)很慢)

8.查看建立的索引

<pre>show index from employees_tmp;</pre>

9.在執(zhí)行查詢語(yǔ)句,查看語(yǔ)句的執(zhí)行時(shí)間

<pre>select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'</pre>

發(fā)現(xiàn)時(shí)間已經(jīng)有所提升了,其實(shí)選擇索引也不一開(kāi)始就知道,我們?cè)谠囋囀褂眯詣e,gender進(jìn)行索引

10.刪除已經(jīng)有的索引,刪除索引:

<pre>drop index first_name on employees_tmp;</pre>

11.創(chuàng)建性別的索引(性別是不怎么好的索引方式,因?yàn)橛泻芏嘀貜?fù)數(shù)據(jù))

<pre>create index index_gendar on employees_tmp(gender);</pre>

在執(zhí)行sql語(yǔ)句查詢數(shù)據(jù),查看查詢執(zhí)行時(shí)間,沒(méi)有創(chuàng)建比較優(yōu)秀的索引,導(dǎo)致查詢時(shí)間還變長(zhǎng)了,

為嘛還變長(zhǎng)了,這個(gè)我沒(méi)有弄懂

12.我們?cè)谠囋囀褂脛?chuàng)建組合索引,使用性別和姓名

<pre>alter table employees_tmp add index idx_union (first_name,gender);</pre>

在執(zhí)行sql查看sql數(shù)據(jù)的執(zhí)行時(shí)間

<pre>select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'</pre>

速度提升了N多倍啊

查看創(chuàng)建的索引

<pre>show index from employees_tmp;</pre>

索引建的好真的一個(gè)好幫手,建不好就是費(fèi)時(shí)的一個(gè)操作

目前還不知道為什么建立性別的索引會(huì)這么慢

二:sql優(yōu)化注意要點(diǎn),比如索引是否用到,查詢優(yōu)化是否改變了執(zhí)行計(jì)劃,以及一些細(xì)節(jié)

場(chǎng)景

我用的數(shù)據(jù)庫(kù)是mysql5.6,下面簡(jiǎn)單的介紹下場(chǎng)景

課程表

create table Course(

c_id int PRIMARY KEY,

name varchar(10)

)

數(shù)據(jù)100條

學(xué)生表:

create table Student(

id int PRIMARY KEY,

name varchar(10)

)

數(shù)據(jù)70000條

學(xué)生成績(jī)表SC

CREATE table SC(

    sc_id int PRIMARY KEY,

    s_id int,

    c_id int,

    score int

)

數(shù)據(jù)70w條

查詢目的:

查找語(yǔ)文考100分的考生

查詢語(yǔ)句:

select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

執(zhí)行時(shí)間:30248.271s

暈,為什么這么慢,先來(lái)查看下查詢計(jì)劃:

EXPLAIN 

select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

發(fā)現(xiàn)沒(méi)有用到索引,type全是ALL,那么首先想到的就是建立一個(gè)索引,建立索引的字段當(dāng)然是在where條件的字段。

先給sc表的c_id和score建個(gè)索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再次執(zhí)行上述查詢語(yǔ)句,時(shí)間為: 1.054s

快了3w多倍,大大縮短了查詢時(shí)間,看來(lái)索引能極大程度的提高查詢效率,看來(lái)建索引很有必要,很多時(shí)候都忘記建

索引了,數(shù)據(jù)量小的的時(shí)候壓根沒(méi)感覺(jué),這優(yōu)化感覺(jué)挺爽。

但是1s的時(shí)間還是太長(zhǎng)了,還能進(jìn)行優(yōu)化嗎,仔細(xì)看執(zhí)行計(jì)劃:

查看優(yōu)化后的sql:

SELECT
    `YSB`.`s`.`s_id` AS `s_id`,
    `YSB`.`s`.`name` AS `name`
FROM
    `YSB`.`Student` `s`
WHERE
    < in_optimizer > (
        `YSB`.`s`.`s_id` ,< EXISTS > (
            SELECT
                1
            FROM
                `YSB`.`SC` `sc`
            WHERE
                (
                    (`YSB`.`sc`.`c_id` = 0)
                    AND (`YSB`.`sc`.`score` = 100)
                    AND (
                        < CACHE > (`YSB`.`s`.`s_id`) = `YSB`.`sc`.`s_id`
                    )
                )
        )
    )

補(bǔ)充:這里有網(wǎng)友問(wèn)怎么查看優(yōu)化后的語(yǔ)句

方法如下:

在命令窗口執(zhí)行

有type=all

按照我之前的想法,該sql的執(zhí)行的順序應(yīng)該是先執(zhí)行子查詢

select s_id from SC sc where sc.c_id = 0 and sc.score = 100

耗時(shí):0.001s

得到如下結(jié)果:

然后再執(zhí)行

select s.* from Student s where s.s_id in(7,29,5000)

耗時(shí):0.001s

這樣就是相當(dāng)快了啊,Mysql竟然不是先執(zhí)行里層的查詢,而是將sql優(yōu)化成了exists子句,并出現(xiàn)了EPENDENT SUBQUERY,

mysql是先執(zhí)行外層查詢,再執(zhí)行里層的查詢,這樣就要循環(huán)70007*11=770077次。

那么改用連接查詢呢?

SELECT s.* from 

Student s

INNER JOIN SC sc

on sc.s_id = s.s_id

where sc.c_id=0 and sc.score=100

這里為了重新分析連接查詢的情況,先暫時(shí)刪除索引sc_c_id_index,sc_score_index

執(zhí)行時(shí)間是:0.057s

效率有所提高,看看執(zhí)行計(jì)劃:

這里有連表的情況出現(xiàn),我猜想是不是要給sc表的s_id建立個(gè)索引

CREATE index sc_s_id_index on SC(s_id);

show index from SC

在執(zhí)行連接查詢

時(shí)間: 1.076s,竟然時(shí)間還變長(zhǎng)了,什么原因?查看執(zhí)行計(jì)劃:

優(yōu)化后的查詢語(yǔ)句為:

SELECT
    `YSB`.`s`.`s_id` AS `s_id`,
    `YSB`.`s`.`name` AS `name`
FROM
    `YSB`.`Student` `s`
JOIN `YSB`.`SC` `sc`
WHERE
    (
        (
            `YSB`.`sc`.`s_id` = `YSB`.`s`.`s_id`
        )
        AND (`YSB`.`sc`.`score` = 100)
        AND (`YSB`.`sc`.`c_id` = 0)
    )

貌似是先做的連接查詢,再執(zhí)行的where過(guò)濾

回到前面的執(zhí)行計(jì)劃:

這里是先做的where過(guò)濾,再做連表,執(zhí)行計(jì)劃還不是固定的,那么我們先看下標(biāo)準(zhǔn)的sql執(zhí)行順序:

正常情況下是先join再where過(guò)濾,但是我們這里的情況,如果先join,將會(huì)有70w條數(shù)據(jù)發(fā)送join做操,因此先執(zhí)行where

過(guò)濾是明智方案,現(xiàn)在為了排除mysql的查詢優(yōu)化,我自己寫(xiě)一條優(yōu)化后的sql

SELECT
    s.*
FROM
    (
        SELECT
            *
        FROM
            SC sc
        WHERE
            sc.c_id = 0
        AND sc.score = 100
    ) t
INNER JOIN Student s ON t.s_id = s.s_id

即先執(zhí)行sc表的過(guò)濾,再進(jìn)行表連接,執(zhí)行時(shí)間為:0.054s

和之前沒(méi)有建s_id索引的時(shí)間差不多

查看執(zhí)行計(jì)劃:

先提取sc再連表,這樣效率就高多了,現(xiàn)在的問(wèn)題是提取sc的時(shí)候出現(xiàn)了掃描表,那么現(xiàn)在可以明確需要建立相關(guān)索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再執(zhí)行查詢:

SELECT
    s.*
FROM
    (
        SELECT
            *
        FROM
            SC sc
        WHERE
            sc.c_id = 0
        AND sc.score = 100
    ) t
INNER JOIN Student s ON t.s_id = s.s_id

執(zhí)行時(shí)間為:0.001s,這個(gè)時(shí)間相當(dāng)靠譜,快了50倍

執(zhí)行計(jì)劃:

我們會(huì)看到,先提取sc,再連表,都用到了索引。

那么再來(lái)執(zhí)行下sql

SELECT s.* from 

Student s

INNER JOIN SC sc

on sc.s_id = s.s_id

where sc.c_id=0 and sc.score=100

執(zhí)行時(shí)間0.001s

執(zhí)行計(jì)劃:

這里是mysql進(jìn)行了查詢語(yǔ)句優(yōu)化,先執(zhí)行了where過(guò)濾,再執(zhí)行連接操作,且都用到了索引。

總結(jié):

1.mysql嵌套子查詢效率確實(shí)比較低

2.可以將其優(yōu)化成連接查詢

3.建立合適的索引

4.學(xué)會(huì)分析sql執(zhí)行計(jì)劃,mysql會(huì)對(duì)sql進(jìn)行優(yōu)化,所以分析執(zhí)行計(jì)劃很重要

由于時(shí)間問(wèn)題,這篇文章先寫(xiě)到這里,后續(xù)再分享其他的sql優(yōu)化經(jīng)歷。

三、海量數(shù)據(jù)分頁(yè)查找時(shí)如何使用主鍵索引進(jìn)行優(yōu)化

mysql百萬(wàn)級(jí)分頁(yè)優(yōu)化

普通分頁(yè)

數(shù)據(jù)分頁(yè)在網(wǎng)頁(yè)中十分多見(jiàn),分頁(yè)一般都是limit start,offset,然后根據(jù)頁(yè)碼page計(jì)算start

<pre> select * from user limit 1,20</pre>

這種分頁(yè)在幾十萬(wàn)的時(shí)候分頁(yè)效率就會(huì)比較低了,MySQL需要從頭開(kāi)始一直往后計(jì)算,這樣大大影響效率

<pre>SELECT * from user limit 100001,20; //time 0.151s

explain SELECT * from user limit 100001,20;</pre>

我們可以用explain分析下語(yǔ)句,沒(méi)有用到任何索引,MySQL執(zhí)行的行數(shù)是16W+,于是我們可以想用到索引去實(shí)現(xiàn)分頁(yè)

優(yōu)化分頁(yè)

使用主鍵索引來(lái)優(yōu)化數(shù)據(jù)分頁(yè)

<pre> select * from user where id>(select id from user where id>=100000 limit 1) limit 20; //time 0.003s</pre>

使用explain分析語(yǔ)句,MySQL這次掃描的行數(shù)是8W+,時(shí)間也大大縮短。

<pre> explain select * from user where id>(select id from user where id>=100000 limit 1) limit 20;</pre>

 ![](https://upload-images.jianshu.io/upload_images/5447660-e7c51b6a8713d3ed.png)

總結(jié)

在數(shù)據(jù)量比較大的時(shí)候,我們盡量去利用索引來(lái)優(yōu)化語(yǔ)句。上面的優(yōu)化方法如果id不是主鍵索引,查詢效率比第一種還要低點(diǎn)。我們可以先使用explain來(lái)分析語(yǔ)句,查看語(yǔ)句的執(zhí)行順序和執(zhí)行性能。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容