隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘和分析從原來(lái)單調(diào)的技能棧開(kāi)始走向多元化,很多excel可以勝任的工作開(kāi)始變得力不從心,office2010以來(lái),單sheet可以處理的行數(shù)從2的16次方(65536)變成了現(xiàn)在的2的20次方(1048576),但是面對(duì)動(dòng)輒GB\TB乃至PB級(jí)別的數(shù)據(jù),在很多情況下顯得無(wú)能為力。
鑒于此,hadoop,hive,mysql,【R,SAS,Python,spss】均成為一個(gè)合格的數(shù)據(jù)分析師所必備的技能,而pandas則使得Python在數(shù)據(jù)分析領(lǐng)域中成為璀璨的一顆明星,筆者通讀了pandas官方文檔,結(jié)合自己的數(shù)據(jù)分析經(jīng)驗(yàn),對(duì)文檔做了翻譯工作,一方面加深自己的印象,一方面造福廣大網(wǎng)友,也算是GNU精神的一種傳承吧。
翻譯計(jì)劃如下:打算用10篇文章來(lái)完成 Python Cookbook的整體翻譯工作,接下來(lái)會(huì)有10篇左右的博客來(lái)結(jié)合具體分析案例呈獻(xiàn)給數(shù)據(jù)分析的同仁們。
閑言少敘,書(shū)歸正傳。

**ok,讓我們一起走進(jìn)Pandas的世界吧!**