Pandas 頻次統(tǒng)計、加入新的計數(shù)列并按某一列去重保留重復(fù)項最新的一條記錄

初始表結(jié)構(gòu):


data.png

去除 elder_no 為空的垃圾數(shù)據(jù), 并重新排列行索引(刪除會導(dǎo)致行索引斷續(xù))

df = df.dropna(subset=['elder_no']).reset_index(drop=True)

先添加新的一列 count (根據(jù) elder_no 計數(shù)統(tǒng)計并把計數(shù)加入到新列)

df['count'] = df['elder_no'].apply(
                lambda x: dict(df['elder_no'].value_counts())[x])

# 相同的 "elder_no" count 數(shù)值一樣
add count.png

去重, elder_no 重復(fù)項按照 atime 保留最近的一條

finnal_df = df.iloc[df.groupby(['elder_no']).apply(
                lambda x: x['atime'].idxmax())]
finnal.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容