關(guān)于數(shù)據(jù)庫(kù)去除重復(fù)數(shù)據(jù)

關(guān)于數(shù)據(jù)庫(kù)去除重復(fù)數(shù)據(jù)已經(jīng)是一個(gè)老問(wèn)題了,甚至面試也會(huì)經(jīng)常被問(wèn)到這部分的問(wèn)題。
最老的方法就是建立中間表了,由于我對(duì)數(shù)據(jù)庫(kù)不是很熟悉,沒(méi)有深入研究過(guò),所以也不能一一列舉方法。
目前想記錄的一個(gè)東西是最近我爬取數(shù)據(jù)的時(shí)候,有大概幾萬(wàn)條數(shù)據(jù),但是重復(fù)率很高的情況,可以利用distinct等去篩選出來(lái),但是假設(shè)我不想寫代碼,從數(shù)據(jù)庫(kù)層面去操作的話,用distinct沒(méi)辦法配合delete操作,而且我懶,不愿意去建立中間表這些。
在翻找資料的過(guò)程中,終于找到了一種方法,如下:

DELETE
FROM
    table_name
WHERE
    id NOT IN (
select * from(
        SELECT
            min(id) AS id
        FROM
            table_name
        GROUP BY
            field)b
    )

但是這種去重效率并不高。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容