pandas簡介

pandas: Python數(shù)據(jù)分析庫

pandas是一個專門用于數(shù)據(jù)分析的開源python庫,是使用python語言研究和分析數(shù)據(jù)集的基礎(chǔ)工具。pandas是以numpy為基礎(chǔ)進(jìn)行設(shè)計的,因而使得pandas可以和其他大多數(shù)模塊兼容,還能借助numpy模塊在計算方面性能高的優(yōu)勢。

安裝

  • 使用pypi安裝
pip install pandas 
  • 在linux系統(tǒng)上安裝
debian類系統(tǒng):
sudo apt-get install python3-pandas
SUSE類系統(tǒng):
sudo zypper install python3-pandas
  • 使用Anaconda安裝
conda list pandas    --檢查是否安裝pandas
conda install pandas  -- 安裝pandas
conda update pandas  -- 更新pandas
  • 使用源代碼安裝
git clone git://github.com/pydata/pandas.git   -- 鏈接可能失效,可以在GitHub中搜索
cd pandas 
python3 setup.py install

如果想獲取安裝最新的安裝包或者避開依賴問題,可以在Christoph Gohlke 的Window系統(tǒng)python擴(kuò)展包倉庫下載相應(yīng)的whl文件,安裝方法如下:

pip install xxxxxxx.whl
  • 驗證pandas是否安裝成功
>>>import pandas

pandas一共有兩大核心數(shù)據(jù)結(jié)構(gòu),所有的數(shù)據(jù)分析相關(guān)的事物都是圍繞這兩種數(shù)據(jù)結(jié)構(gòu)進(jìn)行的.這兩種數(shù)據(jù)結(jié)構(gòu)分別是:
Series(序列)
DataFrame(數(shù)據(jù)框)

Series這類數(shù)據(jù)結(jié)構(gòu)用于存儲一個序列這樣的一維數(shù)據(jù),DataFrame用于存儲多維數(shù)據(jù)

  • Series對象和DataFrame對象內(nèi)部都有一個Index對象,這種結(jié)構(gòu)使得兩種數(shù)據(jù)結(jié)構(gòu)具有很強(qiáng)的可操作性.
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容