-
Series類型:由一組數(shù)據(jù)與之相對應的索引組成
使用:(python列表創(chuàng)建)
自動索引:d=pd.Series(range(20))
自定義索引:b=pd.Series([9,8,7,6],index=['a','b','c','d'])
自動索引和自定義索引并存,但不能混用
創(chuàng)建Series- 標量值:
s=pd.Series(25,index=['a','b','c']) - 字典類型:
d=pd.Series({'a': 9,'b': 8}) - ndarray:
n=pd.Series(np.arange(5))或者n=pd.Series(np.arange(5),index=np.arange(9,4,1))
基本操作b是一個Series類型 - b.index得到索引值
- b.values得到數(shù)據(jù)值
- np.exp(b) 只對b的value部分計算
- 對齊操作:Series+Series
例如:a=pd.Series([1,2,3],['c','d','e'])和b=pd.Series([9,8,7,6],['a','b','c','d'])-->a+b結果中存在的相加,不存在的直接為NaN
修改后立即生效
- 標量值:
-
DataFrame類型
表格型數(shù)據(jù)類型,每列值類型可能不同。既有行索引,又有列索引。
創(chuàng)建DataFrame- 二維ndarray對象
d=pd.DataFrame(np.arange(10).reshape(2,5)) - 從一維ndarray對象字典創(chuàng)建
dt={'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([9,8,7,6],index=['a','b','c','d'])}
d=pd.DataFrame(dt) - 列表類型的字典創(chuàng)建
dl={'one':[1,2,3,4],'two':[9,8,7,6]}
d=pd.DataFrame(dl,index=['a','b','c','d'])
操作:
獲取一列元素:d['列標簽']
獲取一行元素:d.ix['行號']
獲取某個元素:d['列號']['行號']
重新索引:增加和重排--reindex
在行方向重排:d=d.reindex(index=['d','c','b','a'])
在縱向上重排:d=d.reindex(columns=['城市','同比'...])
重新索引
增加新列:newc=d.columns.insert(4,'新增'),newd=d.reindex(columns=new,fill_value=200)
Series與DataFrame的索引都是Index類型,Index對象不可修改刪除指定索引對象索引類型的常用方法
.drop()能夠刪除Series和DataFrame指定行或列索引、
刪除行:a.drop('c1') a.drop(['c1','c2'])
刪除列:a.drop('同比',axis=1)
- 二維ndarray對象
-
運算
- 算術運算(四則運算):根據(jù)索引運算,二維和一維、一維和零維間為廣播運算,產(chǎn)生的運算結果為浮點型
- 算術運算的另一種形式--【.add(d,argws) .sub(d,argws) .mul(d,argws) .div(d,argws)】
例如:a.add(b,fill_value=100) 即a+b,不存在的部分使用100填充相加 - 不同維運算,其結果發(fā)生在行方向上(軸1),可指定axis=0使其發(fā)生在軸0上運算。
- 比較運算--比較運算只能比較相同索引的元素,不進行補齊,二維和一維、一維和零維間為廣播運算,采用大于、小于、大于等于、等于、不等于產(chǎn)生布爾對象。多維之間的比較尺寸相同,不同會報錯
python數(shù)據(jù)分析(五)--Pandas
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
相關閱讀更多精彩內(nèi)容
- 目錄: 5.1 pandas 的數(shù)據(jù)結構介紹 5.1.1 Series 5.1.2 DataFrame 5.1.3...
- 最近在寫個性化推薦的論文,經(jīng)常用到Python來處理數(shù)據(jù),被pandas和numpy中的數(shù)據(jù)選取和索引問題繞的比較...
- 數(shù)據(jù)分析和建模方面的大量編程工作都是用在數(shù)據(jù)準備上的:加載、清理、轉換、重塑。是因為,多數(shù)時候存放在文件或數(shù)據(jù)庫中...
- # -*- coding: utf-8 -*- from __future__ import division i...
- 5.3匯總和計算描述性統(tǒng)計 pandas對象擁有一組常用的數(shù)學和統(tǒng)計方法。他們大部分都屬于約簡和匯總統(tǒng)計,用于從S...

