1、主要作用
這個(gè)和excel中分類匯總或者透視表實(shí)現(xiàn)的功能是一樣的,比如有一組關(guān)于客戶的數(shù)據(jù),里面有客戶的性別、年齡段等數(shù)據(jù),現(xiàn)在想要知道每個(gè)年齡段每個(gè)性別有多少人。
2、常見應(yīng)用1:單類分組
單類分組是指只有一個(gè)統(tǒng)計(jì)變量,如下面的統(tǒng)計(jì)字段['shot_zone_basic'] (數(shù)據(jù)是來自kaggle比賽數(shù)據(jù))

以上的操作只能創(chuàng)建一個(gè)groupby對(duì)象,一般在應(yīng)用中會(huì)加上要統(tǒng)計(jì)的方式,如下客戶直接展示數(shù)據(jù)的多種統(tǒng)計(jì)指標(biāo),當(dāng)然如果只需要統(tǒng)計(jì)一種統(tǒng)計(jì)指標(biāo)可以直接將descrbe()替換成mean()、count()等。

很多時(shí)候統(tǒng)計(jì)的指標(biāo)和數(shù)據(jù)變量較多時(shí),數(shù)據(jù)使用橫排展示在視覺上很難看清,這時(shí)可以使用unstack()函數(shù)優(yōu)化展示。

3、常見應(yīng)用2:多類分組
多類統(tǒng)計(jì)是統(tǒng)計(jì)時(shí)有一個(gè)以上的變量,在實(shí)際工作中應(yīng)用就是多個(gè)變量多個(gè)統(tǒng)計(jì)指標(biāo)的統(tǒng)計(jì)方式,如下:


4、groupby中匿名函數(shù)的應(yīng)用
這種應(yīng)用場景主要是針對(duì)在統(tǒng)計(jì)數(shù)據(jù)中某個(gè)字段時(shí),僅統(tǒng)計(jì)字段中某一部分的內(nèi)容,這個(gè)時(shí)候需要對(duì)字段進(jìn)行自定義處理,如下:
