python 中g(shù)roupby高頻應(yīng)用

1、主要作用

這個(gè)和excel中分類匯總或者透視表實(shí)現(xiàn)的功能是一樣的,比如有一組關(guān)于客戶的數(shù)據(jù),里面有客戶的性別、年齡段等數(shù)據(jù),現(xiàn)在想要知道每個(gè)年齡段每個(gè)性別有多少人。

2、常見應(yīng)用1:單類分組

單類分組是指只有一個(gè)統(tǒng)計(jì)變量,如下面的統(tǒng)計(jì)字段['shot_zone_basic'] (數(shù)據(jù)是來自kaggle比賽數(shù)據(jù))

創(chuàng)建groupby對(duì)象

以上的操作只能創(chuàng)建一個(gè)groupby對(duì)象,一般在應(yīng)用中會(huì)加上要統(tǒng)計(jì)的方式,如下客戶直接展示數(shù)據(jù)的多種統(tǒng)計(jì)指標(biāo),當(dāng)然如果只需要統(tǒng)計(jì)一種統(tǒng)計(jì)指標(biāo)可以直接將descrbe()替換成mean()、count()等。

按組統(tǒng)計(jì)相關(guān)統(tǒng)計(jì)指標(biāo)

很多時(shí)候統(tǒng)計(jì)的指標(biāo)和數(shù)據(jù)變量較多時(shí),數(shù)據(jù)使用橫排展示在視覺上很難看清,這時(shí)可以使用unstack()函數(shù)優(yōu)化展示。

unstack()可以理解為將原來橫排變成豎排數(shù)據(jù)展示更好

3、常見應(yīng)用2:多類分組

多類統(tǒng)計(jì)是統(tǒng)計(jì)時(shí)有一個(gè)以上的變量,在實(shí)際工作中應(yīng)用就是多個(gè)變量多個(gè)統(tǒng)計(jì)指標(biāo)的統(tǒng)計(jì)方式,如下:

多類統(tǒng)計(jì)
多類多方式統(tǒng)計(jì)

4、groupby中匿名函數(shù)的應(yīng)用

這種應(yīng)用場景主要是針對(duì)在統(tǒng)計(jì)數(shù)據(jù)中某個(gè)字段時(shí),僅統(tǒng)計(jì)字段中某一部分的內(nèi)容,這個(gè)時(shí)候需要對(duì)字段進(jìn)行自定義處理,如下:

groupby中使用匿名函數(shù)整理統(tǒng)計(jì)數(shù)據(jù)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容