今天在實際開發(fā)過程中遇到一個數(shù)據(jù)庫去重查詢的問題,在這里給大家分享一下。

類似于上面這張數(shù)據(jù)表,我們發(fā)現(xiàn)id=5和id=6的數(shù)據(jù)passWord和userName數(shù)據(jù)是一樣的。我們的需求是去掉重復的數(shù)據(jù)(passWord,userName)獲得結果集,去重的條件就是根據(jù)passWord和userName兩個字段。
利用 distinct
我們知道,mysql提供了數(shù)據(jù)去重的方法,利用distinct關鍵字對需要處理的字段進行去重。我們來看一下效果。

咦?不對啊,為什么只返回了需要去重處理的字段,而我們想要的結果是對所有字段的返回啊。為什么?。克晕覀儊砗唵瘟私庀耫istinct的用法。在實際應用中,distinct是用來返回非重復記錄的條數(shù),而不能返回非重復數(shù)據(jù)的結果集。這是因為使用distinct之后只能返回去重的字段,而不能返回其他的字段。這顯然不是我們所需要的。既然distinct滿足不了我們的需求,我們來換一種查詢方式。
利用 group by
我們知道除了使用distinct關鍵字外還可以使用group by關鍵字對去重數(shù)據(jù)進行去重查詢,來試一下。

看效果確實是符合了我們的需求,但是我們的需求又變了,需要添加一個查詢條件,比如說根據(jù)id進行去重查詢,我們再來看下。

提示很友好,告訴我們這條sql是錯誤的,這是因為where是對數(shù)據(jù)集進行篩選的,而group by 是對結果集進行聚集,在執(zhí)行書序上來說group by 是在where篩選后才執(zhí)行的,再來簡單看下sql的執(zhí)行順序。
sql執(zhí)行順序
SELECT DISTINCT <select_list>
FROM <left_table>
<join_type> JOIN <right_table>
ON <join_condition>
WHERE <where_condition>
GROUP BY <group_by_list>
HAVING <having_condition>
ORDER BY <order_by_condition>
LIMIT <limit_number>
看到這里我們就知道為什么sql會報錯了,所以,要想符合我們的要求可以使用having關鍵字,因為having執(zhí)行順序位于group by之后,而且having是搭配group by一起來使用的,再來看下。
使用having
select * from user GROUP BY `passWord`,userName HAVING id = "1"
利用having關鍵字對結果集進行過濾后終于達到了符合我們要求的結果。這樣就實現(xiàn)了對數(shù)據(jù)的去重查詢。

where 和 having區(qū)別
1、having用于groyup by之后。
2、where是用于表中篩選查詢,having用于在where和group 結果中查詢。
3、havin可以使用聚合函數(shù),而where 不能。
4、having執(zhí)行順序位于where之后。