SQL查詢中in和exists的區(qū)別分析

SQL查詢中in和exists的區(qū)別分析

select * from A where id in (select id from B);

select * from A where exists (select 1 from B where A.id=B.id);

對(duì)于以上兩種情況,in是在內(nèi)存里遍歷比較,而exists需要查詢數(shù)據(jù)庫,所以當(dāng)B表數(shù)據(jù)量較大時(shí),exists效率優(yōu)于in。

1、IN()語句內(nèi)部工作原理

IN()只執(zhí)行一次,它查出B表中的所有id字段并緩存起來。之后,檢查A表的id是否與B表中的id相等,如果相等則將A表的記錄加入結(jié)果集中,直到遍歷完A表的所有記錄。
它的查詢過程類似于以下過程:

List resultSet={};
Array A=(select * from A);
Array B=(select id from B);

for(int i=0;i<A.length;i++) {
  for(int j=0;j<B.length;j++) {
      if(A[i].id==B[j].id) {
        resultSet.add(A[i]);
        break;
      }
  }
}
return resultSet;

可以看出,當(dāng)B表數(shù)據(jù)較大時(shí)不適合使用in(),因?yàn)樗鼤?huì)B表數(shù)據(jù)全部遍歷一次

  • 例1:A表有10000條記錄,B表有1000000條記錄,那么最多有可能遍歷10000*1000000次,效率很差。
  • 例2:A表有10000條記錄,B表有100條記錄,那么最多有可能遍歷10000*100次,遍歷次數(shù)大大減少,效率大大提升。

結(jié)論:IN()適合B表比A表數(shù)據(jù)小的情況

2、EXISTS()語句內(nèi)部工作原理

exists()會(huì)執(zhí)行A.length次,它并不緩存exists()結(jié)果集,因?yàn)閑xists()結(jié)果集的內(nèi)容并不重要,重要的是其內(nèi)查詢語句的結(jié)果集空或者非空,空則返回false,非空則返回true。
它的查詢過程類似于以下過程:

List resultSet={};
Array A=(select * from A);

for(int i=0;i<A.length;i++) {
   if(exists(A[i].id) {  //執(zhí)行select 1 from B where B.id=A.id是否有記錄返回
       resultSet.add(A[i]);
   }
}
return resultSet;

當(dāng)B表比A表數(shù)據(jù)大時(shí)適合使用exists(),因?yàn)樗鼪]有那么多遍歷操作,只需要再執(zhí)行一次查詢就行。

  • 例1:A表有10000條記錄,B表有1000000條記錄,那么exists()會(huì)執(zhí)行10000次去判斷A表中的id是否與B表中的id相等。
  • 例2:A表有10000條記錄,B表有100000000條記錄,那么exists()還是執(zhí)行10000次,因?yàn)樗粓?zhí)行A.length次,可見B表數(shù)據(jù)越多,越適合exists()發(fā)揮效果。
  • 例3:A表有10000條記錄,B表有100條記錄,那么exists()還是執(zhí)行10000次,還不如使用in()遍歷10000*100次,因?yàn)閕n()是在內(nèi)存里遍歷比較,而exists()需要查詢數(shù)據(jù)庫,我們都知道查詢數(shù)據(jù)庫所消耗的性能更高,而內(nèi)存比較很快。

結(jié)論:EXISTS()適合B表比A表數(shù)據(jù)大的情況

3、使用情況分析

當(dāng)A表數(shù)據(jù)與B表數(shù)據(jù)一樣大時(shí),in與exists效率差不多,可任選一個(gè)使用。

在插入記錄前,需要檢查這條記錄是否已經(jīng)存在,只有當(dāng)記錄不存在時(shí)才執(zhí)行插入操作,可以通過使用 EXISTS 條件句防止插入重復(fù)記錄。

insert into A (name,age) select name,age from B where not exists (select 1 from A where A.id=B.id);

EXISTS與IN的使用效率的問題,通常情況下采用exists要比in效率高,因?yàn)镮N不走索引。但要看實(shí)際情況具體使用:

  • IN適合于外表大而內(nèi)表小的情況;
  • EXISTS適合于外表小而內(nèi)表大的情況。

4、關(guān)于EXISTS:

EXISTS用于檢查子查詢是否至少會(huì)返回一行數(shù)據(jù),該子查詢實(shí)際上并不返回任何數(shù)據(jù),而是返回值True或False。

EXISTS 指定一個(gè)子查詢,檢測(cè)行的存在。

語法: EXISTS subquery

參數(shù): subquery 是一個(gè)受限的 SELECT 語句 (不允許有 COMPUTE 子句和 INTO 關(guān)鍵字)。

結(jié)果類型: Boolean 如果子查詢包含行,則返回 TRUE ,否則返回 FLASE 。

結(jié)論:

select * from A where exists (select 1 from B where A.id=B.id)

EXISTS(包括 NOT EXISTS )子句的返回值是一個(gè)boolean值。 EXISTS內(nèi)部有一個(gè)子查詢語句(SELECT ... FROM...),我將其稱為EXIST的內(nèi)查詢語句。其內(nèi)查詢語句返回一個(gè)結(jié)果集, EXISTS子句根據(jù)其內(nèi)查詢語句的結(jié)果集空或者非空,返回一個(gè)布爾值。

一種通俗的可以理解為:將外查詢表的每一行,代入內(nèi)查詢作為檢驗(yàn),如果內(nèi)查詢返回的結(jié)果取非空值,則EXISTS子句返回TRUE,這一行行可作為外查詢的結(jié)果行,否則不能作為結(jié)果。

分析器會(huì)先看語句的第一個(gè)詞,當(dāng)它發(fā)現(xiàn)第一個(gè)詞是SELECT關(guān)鍵字的時(shí)候,它會(huì)跳到FROM關(guān)鍵字,然后通過FROM關(guān)鍵字找到表名并把表裝入內(nèi)存。接著是找WHERE關(guān)鍵字,如果找不到則返回到SELECT找字段解析,如果找到WHERE,則分析其中的條件,完成后再回到SELECT分析字段。最后形成一張我們要的虛表。

WHERE關(guān)鍵字后面的是條件表達(dá)式。條件表達(dá)式計(jì)算完成后,會(huì)有一個(gè)返回值,即非0或0,非0即為真(true),0即為假(false)。同理WHERE后面的條件也有一個(gè)返回值,真或假,來確定接下來執(zhí)不執(zhí)行SELECT。

分析器先找到關(guān)鍵字SELECT,然后跳到FROM關(guān)鍵字將STUDENT表導(dǎo)入內(nèi)存,并通過指針找到第一條記錄,接著找到WHERE關(guān)鍵字計(jì)算它的條件表達(dá)式,如果為真那么把這條記錄裝到一個(gè)虛表當(dāng)中,指針再指向下一條記錄。如果為假那么指針直接指向下一條記錄,而不進(jìn)行其它操作。一直檢索完整個(gè)表,并把檢索出來的虛擬表返回給用戶。EXISTS是條件表達(dá)式的一部分,它也有一個(gè)返回值(true或false)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容