python 之 data.frame

data.frame 實用方法

  1. pd.read_csv 讀入文件作為data.frame
    ?header:指定是否有標(biāo)題,None無標(biāo)題
    ?sep:指定文件分隔符 超級實用
  2. df.shape 返回df的行數(shù)和列數(shù) 超級實用
  3. df.columns 返回列名
  4. df.info() 返回df各變量的信息
  5. df["列名"] 選取某列數(shù)據(jù)
  6. df.describe()返回數(shù)值類型列的描述性統(tǒng)計結(jié)果,包含均值、標(biāo)準(zhǔn)差、范圍等。
  7. df.head()顯示數(shù)據(jù)前5行 超級實用
  8. df.sort_values(by= , ascending=False) 按照by指定列進行排序,默認(rèn)為升序,使用ascending=False改為降序。 超級實用
  9. df['列名'].mean 對任意一列計算均值
  10. df['列名'].min 對任意一列計算最小值
  11. df['列名'].max 對任意一列計算最大值
  12. df['列名'].sum 對任意一列求和。,此外,可對bool行求和,以獲得True的個數(shù)
  13. df['列名'] == 1 索引,該列值是否等于1 ,返回True或False
  14. df[df['列名'] == 1] 返回符合索引條件的行,屬性依舊是data.frame。超級實用
  15. df[(df['列名a'] == 1) & (df['列名b'] == 1)] 結(jié)合邏輯判斷使用多個索引條件。超級實用

data.frame 子集提取命令 loc, iloc

loc為名稱索引,iloc為數(shù)字索引

  1. df.loc['行名'] 按行名提取子集
  2. df.loc['行名','列名'] 提取指定行,列的內(nèi)容
  3. df.loc['行名','列名'] = 1 修改指定行,列內(nèi)容。取一行或一列時用列表。
  4. df.iloc[0:2, 0:2] 提取前兩行、前兩列的內(nèi)容

使用哈希替換某列的值

  1. map
d = {'No': False, 'Yes': True}
df['列名'] = df['列名'].map(d)
  1. replace
d = {'No': False, 'Yes': True}
df = df.replace({'列名': d})
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容