2021-01-24 Python Pandas知識點整理

Pandas是基于Numpy的一種工具,主要是為了解決數(shù)據(jù)分析任務(wù)創(chuàng)建的。提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。pandas 基于兩種數(shù)據(jù)類型:Series和DataFrame。

1.Series。Series是pandas最基本的對象,只能存儲同樣的數(shù)據(jù)類型。類似于numpy的一維數(shù)組,沒有一般說的行或者列的概念。不同的是,Series可為索引自定義標簽。Series是DataFrame的某一行或某一列。

2.DataFrame.DataFrame是一個二維的表結(jié)構(gòu),類似于excel的數(shù)據(jù)表,可以存儲不同的數(shù)據(jù)類型。橫向和縱向都會有自己的標簽。

3.數(shù)據(jù)合并

除了concat外,還可以通過join和merge進行數(shù)據(jù)的合并。

4.數(shù)據(jù)預處理

????????數(shù)據(jù)預處理,一般包括對缺失數(shù)據(jù)(dropna())、重復數(shù)據(jù)(drop_duplicates())的處理。

5.數(shù)據(jù)處理(分組聚合等)

初級的數(shù)據(jù)處理,主要是指通過groupby()分組和pivot()透視對數(shù)據(jù)進行分組,以及通過各聚合函數(shù)對分組后的數(shù)據(jù)進行聚合的操作。

知識點1:分組。數(shù)據(jù)分組后生成為DataFrameGroupBy類型。

知識點2:數(shù)據(jù)透視表。pivot和groupby都是用來進行分組,功能差不多。

知識點3:聚合函數(shù)

知識點4:匿名函數(shù)

知識點5:map,apply和applymap。apply函數(shù)是pandas所有函數(shù)中自由度最高的函數(shù)。

知識點6:where和mask

補充:多層索引

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文的Pandas知識點包括:1、合并數(shù)據(jù)集2、重塑和軸向旋轉(zhuǎn)3、數(shù)據(jù)轉(zhuǎn)換4、數(shù)據(jù)聚合 1、合并數(shù)據(jù)集 Panda...
    文哥的學習日記閱讀 9,486評論 0 13
  • 寫在前面,我也是一名python學習小白,從最近開始學習Python,由于之前沒有編程基礎(chǔ),學習起來比較費勁...
    Gabrielff閱讀 517評論 0 2
  • 寫在前面的話 Pandas是專門做數(shù)據(jù)處理和分析的,擁有許多各種復雜的函數(shù)。Pandas功能強大,支持類似于SQL...
    四毛m閱讀 2,278評論 0 7
  • pandas知識點 創(chuàng)建對象 一維對象 多維對象 語法如下: data:numpy ndarray(結(jié)構(gòu)化或同類)...
    大鐵strong閱讀 515評論 0 0
  • 久違的晴天,家長會。 家長大會開好到教室時,離放學已經(jīng)沒多少時間了。班主任說已經(jīng)安排了三個家長分享經(jīng)驗。 放學鈴聲...
    飄雪兒5閱讀 7,847評論 16 22

友情鏈接更多精彩內(nèi)容