pandas: Python數(shù)據(jù)分析庫
pandas是一個專門用于數(shù)據(jù)分析的開源python庫,是使用python語言研究和分析數(shù)據(jù)集的基礎(chǔ)工具。pandas是以numpy為基礎(chǔ)進(jìn)行設(shè)計的,因而使得pandas可以和其他大多數(shù)模塊兼容,還能借助numpy模塊在計算方面性能高的優(yōu)勢。
安裝
- 使用pypi安裝
pip install pandas
- 在linux系統(tǒng)上安裝
debian類系統(tǒng):
sudo apt-get install python3-pandas
SUSE類系統(tǒng):
sudo zypper install python3-pandas
- 使用Anaconda安裝
conda list pandas --檢查是否安裝pandas
conda install pandas -- 安裝pandas
conda update pandas -- 更新pandas
- 使用源代碼安裝
git clone git://github.com/pydata/pandas.git -- 鏈接可能失效,可以在GitHub中搜索
cd pandas
python3 setup.py install
如果想獲取安裝最新的安裝包或者避開依賴問題,可以在Christoph Gohlke 的Window系統(tǒng)python擴(kuò)展包倉庫下載相應(yīng)的whl文件,安裝方法如下:
pip install xxxxxxx.whl
- 驗證pandas是否安裝成功
>>>import pandas
pandas一共有兩大核心數(shù)據(jù)結(jié)構(gòu),所有的數(shù)據(jù)分析相關(guān)的事物都是圍繞這兩種數(shù)據(jù)結(jié)構(gòu)進(jìn)行的.這兩種數(shù)據(jù)結(jié)構(gòu)分別是:
Series(序列)
DataFrame(數(shù)據(jù)框)
Series這類數(shù)據(jù)結(jié)構(gòu)用于存儲一個序列這樣的一維數(shù)據(jù),DataFrame用于存儲多維數(shù)據(jù)
- Series對象和DataFrame對象內(nèi)部都有一個Index對象,這種結(jié)構(gòu)使得兩種數(shù)據(jù)結(jié)構(gòu)具有很強(qiáng)的可操作性.