零基礎(chǔ)入門到精通:Python大數(shù)據(jù)與機(jī)器學(xué)習(xí)之Pandas小技巧

上一篇文章帶大家一起了解了Pandas庫中的DataFrames的多級索引,本文是Python大數(shù)據(jù)與機(jī)器學(xué)習(xí)系列文章中的第13篇,將帶大家一起了解一下Pandas的小技巧——數(shù)據(jù)補全。在這里還是要推薦下我自己建的Python開發(fā)學(xué)習(xí)群:483546416,群里都是學(xué)Python開發(fā)的,如果你正在學(xué)習(xí)Python ,小編歡迎你加入,大家都是軟件開發(fā)黨,不定期分享干貨(只有Python軟件開發(fā)相關(guān)的),包括我自己整理的一份2018最新的Python進(jìn)階資料和高級開發(fā)教程,歡迎進(jìn)階中和進(jìn)想深入Python的小伙伴

實戰(zhàn)練習(xí)

在Jupyter Notebook上執(zhí)行以下代碼:

import numpy as np

import pandas as pd

df = pd.DataFrame({'A':[1,2,np.nan],

'B':[5,np.nan,np.nan],

'C':[1,2,3]})

df

刪除具有控制的行

df.dropna()

刪除掉含有空值的列

df.dropna(axis=1)

刪除掉空值數(shù)大于等于2的行。

df.dropna(thresh=2)

將某個值填充到空值中。

df.fillna(value='FILL VALUE')

還可以將A列的平均值填充到空值中。

df['A'].fillna(value=df['A'].mean())

進(jìn)度介紹

本系列文章共分為26個部分目前已經(jīng)進(jìn)行到了第6部分,所有內(nèi)容計劃如下:

預(yù)熱

環(huán)境搭建

Jupyter教程

Python速成

Python數(shù)據(jù)分析,NumPy庫的使用

Python數(shù)據(jù)分析,Pandas庫的使用

Python數(shù)據(jù)分析,Pandas庫練習(xí)

Python數(shù)據(jù)可視化,Matplotlib

Python數(shù)據(jù)可視化,Seaborn

Python數(shù)據(jù)可視化,Pandas內(nèi)建數(shù)據(jù)可視化

Python數(shù)據(jù)可視化,Plotly和Cufflinks

Python數(shù)據(jù)可視化,Geographical Plotting

數(shù)據(jù) Capstone 項目

機(jī)器學(xué)習(xí)介紹

線性回歸

交叉驗證與偏方差

邏輯回歸算法

k-近鄰算法

決策樹與隨機(jī)森林

支持向量機(jī)

k-means聚類

主成分分析

推薦系統(tǒng)

自然語言處理(NLP)

Python大數(shù)據(jù)與Spark

神經(jīng)網(wǎng)絡(luò)(NN)與深度學(xué)習(xí)(DL)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容