數(shù)據(jù)分析—Pandas官方重要知識(shí)點(diǎn)速查表

【導(dǎo)語(yǔ)】在做數(shù)據(jù)分析時(shí)都會(huì)用到 Pandas。雖然 Pandas 的功能十分強(qiáng)大。但是實(shí)際用的時(shí)候,并不能快速的找到對(duì)應(yīng)的解決方案,那么其實(shí)Pandas官方早就提供了一份知識(shí)框架,放在了Github上。
地址:https://github.com/pandas-dev/pandas/tree/master/doc/cheatsheet

這兩張圖片一共歸納了13類常用的Pandas操作,下面我們就來(lái)簡(jiǎn)單看一看。

1、數(shù)據(jù)創(chuàng)建

介紹了幾種常用的DataFrame創(chuàng)建語(yǔ)法


2、數(shù)據(jù)重塑

這部分主要是一些在數(shù)據(jù)清洗中常用的方法,比如數(shù)據(jù)連接、數(shù)據(jù)排序、數(shù)據(jù)刪除等,并且還對(duì)四個(gè)常用的操作給出了圖示,理解起來(lái)簡(jiǎn)直不要太方便!


3、數(shù)據(jù)篩選

這一塊區(qū)域主要是分別用行/列來(lái)講解一些常用的數(shù)據(jù)查看、抽樣、切片等操作,包含了tail、headloc、iloc等非常重要的方法,并且同樣給出了部分動(dòng)畫便于理解

4、數(shù)據(jù)探索

這一塊主要給出了一些在進(jìn)行探索性分析時(shí)常用的方法,比如max、min、count等,不過(guò)官方將apply放在這里,并沒(méi)有展開講解

5、數(shù)據(jù)修改

這兩個(gè)區(qū)域?yàn)槿笔е堤幚砗蛣?chuàng)建新的列,重點(diǎn)用動(dòng)畫示例了assignqcut方法,缺失值處理部分僅給出了兩個(gè)方法,應(yīng)該是偷懶了

6、數(shù)據(jù)分組

主要就是groupby和相關(guān)方法

7、數(shù)據(jù)連接

這里介紹的還是非常詳細(xì)!用圖片例子來(lái)展示pd.merge中的各種參數(shù)變化的不同,一看就懂

8、繪制圖表

繪制可視化圖表是Pandas的一個(gè)重要功能。不過(guò)受限于篇幅,官方在這里僅僅是一筆帶過(guò)。


大家應(yīng)該能看出來(lái),這是一份提綱挈領(lǐng)的“學(xué)習(xí)線索”,為你理清思路,指明方向。但是僅僅靠著兩張圖片是不可能把所有內(nèi)容就弄明白的,它更像是我們考試前劃的“復(fù)習(xí)重點(diǎn)”。通過(guò)這兩張表,我們可以了解哪些操作可以用Pandas完成,以及在你不確定用什么方法處理數(shù)據(jù)時(shí),快速查到Pandas中的哪個(gè)函數(shù)可以做到。因?yàn)槲⑿艜?huì)對(duì)圖片進(jìn)行壓縮,所以可以直接訪問(wèn)項(xiàng)目地址。

希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來(lái)一定的幫助,每天進(jìn)步一點(diǎn)點(diǎn),加油?。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容