Pandas是python的一個(gè)數(shù)據(jù)分析包,納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。
pandas包括三個(gè)數(shù)據(jù)結(jié)構(gòu)Series、DataFrame和Panel。其中Series是具有均勻數(shù)據(jù)的一維數(shù)組結(jié)構(gòu),DataFrame是一個(gè)具有異構(gòu)數(shù)據(jù)的二維數(shù)組。
通過數(shù)組創(chuàng)建DataFrame
數(shù)據(jù)以行和列表示。每列表示一個(gè)屬性和屬性值,每行代表對(duì)應(yīng)所有屬性的一行數(shù)據(jù)。DataFrame可以使用以下構(gòu)造函數(shù)創(chuàng)建 -
pandas.DataFrame( data, index, columns, dtype, copy)
構(gòu)造函數(shù)的參數(shù)如下
| 編號(hào) | 參數(shù) | 描述 |
|---|---|---|
| 1 | data | 數(shù)據(jù)采取各種形式,如:ndarray,series,map,lists,dict,constant和另一個(gè)DataFrame。 |
| 2 | index | 對(duì)于行標(biāo)簽,要用于結(jié)果幀的索引是可選缺省值np.arrange(n),如果沒有傳遞索引值。 |
| 3 | columns | 對(duì)于列標(biāo)簽,可選的默認(rèn)語法是 - np.arange(n)。 這只有在沒有索引傳遞的情況下才是這樣。 |
| 4 | dtype | 每列的數(shù)據(jù)類型。 |
| 5 | copy | 如果默認(rèn)值為False,則此命令(或任何它)用于復(fù)制數(shù)據(jù)。 |
通過數(shù)組創(chuàng)建DataFrame
import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
#df = pd. DataFrame(data)#其他參數(shù)默認(rèn)
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
DataFrame基本功能
| 編號(hào) | 屬性或方法 | 描述 |
|---|---|---|
| 1 | T | 轉(zhuǎn)置行和列。 |
| 2 | axes | 返回一個(gè)列,行軸標(biāo)簽和列軸標(biāo)簽作為唯一的成員。 |
| 3 | dtypes | 返回此對(duì)象中的數(shù)據(jù)類型(dtypes)。 |
| 4 | empty | 如果NDFrame完全為空[無項(xiàng)目],則返回為True; 如果任何軸的長(zhǎng)度為0。 |
| 5 | ndim | 軸/數(shù)組維度大小。 |
| 6 | shape | 返回表示DataFrame的維度的元組。 |
| 7 | size | NDFrame中的元素?cái)?shù)。 |
| 8 | values | NDFrame的Numpy表示。 |
| 9 | head() | 返回開頭前n行。 |
| 10 | tail() | 返回最后n行。 |
| 11 | columns | 獲取所有屬性。 |