特征選擇小結(jié)_簡(jiǎn)版

前團(tuán)隊(duì)的博士同學(xué)研究特征選擇,受他影響,有所關(guān)注,總結(jié)如下。

一、評(píng)分卡傳統(tǒng)方法

IV排序、PSI穩(wěn)定性。

二、sklearn框架

略。

三、其他算法

Boruta 特征選擇

python實(shí)現(xiàn),https://github.com/scikit-learn-contrib/boruta_py。

可以結(jié)合參考資料1詳細(xì)看下,個(gè)人理解,有點(diǎn)類似lime可解釋性算法的思路。Boruta 會(huì)將真實(shí)特征隨機(jī)打亂順序,一起去訓(xùn)練可以輸出模型重要性的算法,如RandomForest, lightgbm,xgboost等,并標(biāo)記特征重要性、進(jìn)行假設(shè)檢驗(yàn)。

附,參考資料:

1、Boruta 特征選擇,http://www.itdecent.cn/p/fdc8f6a94816

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容