在學(xué)習(xí) Pandas 的過程中,整理了一份學(xué)習(xí)圖譜,希望也能夠幫助到同樣想入門 pandas 的同學(xué)。
Pandas 是基于 Numpy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。pandas 提供了大量快速便捷地處理數(shù)據(jù)的函數(shù)和方法,是使 Python 成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。
構(gòu)建和處理兩個或更多個維數(shù)組是一項(xiàng)繁瑣的任務(wù),用戶在編寫函數(shù)時要考慮數(shù)據(jù)集的方向。 但是使用Pandas數(shù)據(jù)結(jié)構(gòu),減少了用戶的思考。例如,使用表格數(shù)據(jù)(DataFrame),在語義上更有用于考慮索引(行)和列,而不是軸0和軸1。
Pandas 兩個重要的數(shù)據(jù)結(jié)構(gòu),Seriers 和 DataFrame,多個 Seriers 組成了 DataFrame,就像 ndArray 一樣,是我們使用 pandas 操作數(shù)據(jù)的基本數(shù)據(jù)結(jié)構(gòu)。我們在掌握了 Pandas 的數(shù)據(jù)之后,重點(diǎn)關(guān)注各種數(shù)據(jù)分析的方法,以工具的角度來學(xué)習(xí) Pandas,將常用的方法整理出來,后面用到時查找即可。
