新建一個(gè)Dataframe
要求:
計(jì)算df中所有具有相同class,id的條目的個(gè)數(shù)(mode加和),然而value中必須不能同時(shí)為0,必須存在至少一個(gè)1
import pandas as pd
df = pd.DataFrame({'class':['A','A','A','B','B','B','C','C','C'],
'id':['a','b','a','a','a','b','a','b','a'],
'mode':['1','1','1','1','1','1','1','1','1'],
'value':[1,0,1,1,0,1,0,1,0]})
df1 = df.groupby(by = ['class','id']).count()
df2 = df.groupby(by = ['class','id']).sum()

image.png

image.png

image.png
對(duì)df進(jìn)行g(shù)roupby操作后,形成了多重索引的列表,頭疼了點(diǎn)。
可以看出df2種value為0的部分就是我們要?jiǎng)h除的部分。
那么,如何刪除掉具有multi-index中的這兩個(gè)條目,著實(shí)費(fèi)了很多功夫。最后找到方法如下:
所謂刪除,就是在一個(gè)列表中排除。然而只找到了isin的方法,,沒有isnotin,那么實(shí)際上我反選也是ok的
利用multi-index解法:
#df2中獲得排除value=0的剩余multi-index,轉(zhuǎn)為列表
selector = list(df2[df2['value']!=0].index)
#在df1種用df.index.isin獲得selector中相同multi-index的條目,剩余的就是我們要的東西
df1 = df1[df1.index.isin(selector)]

image.png
暫時(shí)沒有想到其他方法,如果您有更好的方法,歡迎告訴我,共同學(xué)習(xí)!