Python有許多可以讀寫(xiě)常見(jiàn)的HTML和XML格式數(shù)據(jù)的庫(kù),包括lxml、Beautiful Soup和html5lib。lxml的速度比較快...
JSON(JavaScript Object Notation的簡(jiǎn)稱)已經(jīng)成為通過(guò)HTTP請(qǐng)求在Web瀏覽器和其他應(yīng)用程序之間發(fā)送數(shù)據(jù)的標(biāo)準(zhǔn)格式...
大部分存儲(chǔ)在磁盤(pán)上的表格型數(shù)據(jù)都能用pandas.read_table進(jìn)行加載。然而,有時(shí)還是需要做一些手工處理。由于接收到含有畸形行的文件而使...
pandas提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對(duì)象的函數(shù)。表6-1對(duì)它們進(jìn)行了總結(jié),其中read_csv和read_table可...
還有一類方法可以從一維Series的值中抽取信息??聪旅娴睦樱?第一個(gè)函數(shù)是unique,它可以得到Series中的唯一值數(shù)組: 返回的唯一值...
有些匯總統(tǒng)計(jì)(如相關(guān)系數(shù)和協(xié)方差)是通過(guò)參數(shù)對(duì)計(jì)算出來(lái)的。我們來(lái)看幾個(gè)DataFrame,它們的數(shù)據(jù)來(lái)自Yahoo!Finance的股票價(jià)格和成...
pandas對(duì)象擁有一組常用的數(shù)學(xué)和統(tǒng)計(jì)方法。它們大部分都屬于約簡(jiǎn)和匯總統(tǒng)計(jì),用于從Series中提取單個(gè)值(如sum或mean)或從DataF...
根據(jù)條件對(duì)數(shù)據(jù)集排序(sorting)也是一種重要的內(nèi)置運(yùn)算,要對(duì)行或列索引進(jìn)行排序(按字典順序),可使用sort_index方法,它將返回一個(gè)...
NumPy的ufuncs(元素級(jí)數(shù)組方法)也可用于操作pandas對(duì)象: 另一個(gè)常見(jiàn)的操作時(shí),將函數(shù)應(yīng)用到由各列或行所形成的一維數(shù)組上。Data...