簡(jiǎn)介: 本文介紹如何找到和移除重復(fù)行。
- duplicated()方法
- 查看列是否重復(fù)
dataframe.colname.duplicated()
- 查看整行是否重復(fù)
dataframe.duplicated()
- 查看subset是否重復(fù)
dataframe.duplicated(subset = [])
- drop_duplicats()方法
用于丟棄重復(fù)項(xiàng)
dataframe.drop_duplicats()
- 參數(shù)keep
keep可以為first和last,表示是選擇最前一項(xiàng)還是最后一項(xiàng)保留。
dataframe.duplicated(keep = "first")
dataframe.duplicated(keep = "last")
也可以設(shè)置布爾類(lèi)型,當(dāng)設(shè)為False時(shí)候,重復(fù)項(xiàng)將都被顯示。
dataframe.duplicated(keep = "False")
附上小哥哥的視頻鏈接Data analysis in Python with pandas
Youtube ??
嗶哩嗶哩 ??
本系列文章列表
pandas使用技巧總覽