分類不平衡問題

數(shù)據(jù)不平衡問題

? ? ? ? 答案取決于數(shù)據(jù)

? ? ? ? 平衡數(shù)據(jù)

? ? ? ? ? ? ????少數(shù)樣本過采樣

????????????????多數(shù)樣本欠采樣

? ? ? ? ? ? ????合成少數(shù)類樣本

? ? ? ? 舍棄少數(shù)類,切換成異常檢測框架

? ? ? ? 算法層面

? ? ? ? ? ? ? ? 調(diào)整分類權(quán)重? ? ? ? ? ? ? ? ? ? ? ??

? ? ? ? ? ? ? ? 調(diào)整決策閾值

? ? ? ? ? ? ? ? 使現(xiàn)有算法對少數(shù)類更敏感????

? ? ? ? 構(gòu)造一個在不平衡數(shù)據(jù)上表現(xiàn)更好的全新算法


如何正確評估

? ? ? ? 不要使用準(zhǔn)確度(錯誤率)來評估分類器

? ? ? ? 使用ROC曲線、準(zhǔn)確率召回曲線(precision-recall curve)、Lift曲線或利潤(收益)曲線(profit(gain)curve)對分類器表現(xiàn)進行可視化

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容