2.1 重復(fù)值處理
2.2 缺失值識別與處理
2.2.1 缺失值識別
2.2.2 缺失值處理
2.3 異常值識別與處理
2.3.1 異常值識別
2.3.2 可視化圖形分布
2.3.3 z-score
2.3.4 局部異常因子法
2.3.5 異常值處理
2.4 特征編碼
2.4.1 獨熱編碼/啞編碼
2.4.2 標(biāo)簽編碼
2.4.3 手動編碼
2.4.4 日期特征轉(zhuǎn)換
2.5 規(guī)范化與偏態(tài)數(shù)據(jù)
2.5.1 0-1規(guī)范化
2.5.2 Z-score標(biāo)準(zhǔn)化
2.5.3 對數(shù)轉(zhuǎn)換(log transform)
2.5.4 Box-Cox