Python有許多可以讀寫常見的HTML和XML格式數(shù)據(jù)的庫,包括lxml、Beautiful Soup和html5lib。lxml的速度比較快...
JSON(JavaScript Object Notation的簡稱)已經(jīng)成為通過HTTP請求在Web瀏覽器和其他應(yīng)用程序之間發(fā)送數(shù)據(jù)的標(biāo)準(zhǔn)格式...
大部分存儲在磁盤上的表格型數(shù)據(jù)都能用pandas.read_table進(jìn)行加載。然而,有時還是需要做一些手工處理。由于接收到含有畸形行的文件而使...
pandas提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對象的函數(shù)。表6-1對它們進(jìn)行了總結(jié),其中read_csv和read_table可...
還有一類方法可以從一維Series的值中抽取信息??聪旅娴睦樱?第一個函數(shù)是unique,它可以得到Series中的唯一值數(shù)組: 返回的唯一值...
有些匯總統(tǒng)計(如相關(guān)系數(shù)和協(xié)方差)是通過參數(shù)對計算出來的。我們來看幾個DataFrame,它們的數(shù)據(jù)來自Yahoo!Finance的股票價格和成...
pandas對象擁有一組常用的數(shù)學(xué)和統(tǒng)計方法。它們大部分都屬于約簡和匯總統(tǒng)計,用于從Series中提取單個值(如sum或mean)或從DataF...
根據(jù)條件對數(shù)據(jù)集排序(sorting)也是一種重要的內(nèi)置運(yùn)算,要對行或列索引進(jìn)行排序(按字典順序),可使用sort_index方法,它將返回一個...
NumPy的ufuncs(元素級數(shù)組方法)也可用于操作pandas對象: 另一個常見的操作時,將函數(shù)應(yīng)用到由各列或行所形成的一維數(shù)組上。Data...