前團(tuán)隊(duì)的博士同學(xué)研究特征選擇,受他影響,有所關(guān)注,總結(jié)如下。
一、評(píng)分卡傳統(tǒng)方法
IV排序、PSI穩(wěn)定性。
二、sklearn框架
略。
三、其他算法
Boruta 特征選擇
python實(shí)現(xiàn),https://github.com/scikit-learn-contrib/boruta_py。
可以結(jié)合參考資料1詳細(xì)看下,個(gè)人理解,有點(diǎn)類似lime可解釋性算法的思路。Boruta 會(huì)將真實(shí)特征隨機(jī)打亂順序,一起去訓(xùn)練可以輸出模型重要性的算法,如RandomForest, lightgbm,xgboost等,并標(biāo)記特征重要性、進(jìn)行假設(shè)檢驗(yàn)。
附,參考資料:
1、Boruta 特征選擇,http://www.itdecent.cn/p/fdc8f6a94816