參考【1】https://zhuanlan.zhihu.com/p/106320452
? ? ? ?【2】https://zhuanlan.zhihu.com/p/364919024
? ? ? ?【3】https://zhuanlan.zhihu.com/p/85791430??
? ? ? ?【4】https://zhuanlan.zhihu.com/p/186204351
1.概括圖,即 summary plot,該圖是對全部樣本全部特征的shaple值進(jìn)行求和,可以反映出特征重要性及每個特征對樣本正負(fù)預(yù)測的貢獻(xiàn)。
shap.summary_plot(shap_values, data[use_cols])

2.summary_plot圖,是把所有的樣本點都呈現(xiàn)在圖中,顏色代表特征值的大小,而橫坐標(biāo)為shap值的大小,從圖中可以看到 days_credit這一特征,值越小,shap值越大,換句話來說就是days_credit越大,風(fēng)險越高。

3.特征影響圖
X - 橫軸是樣本數(shù)量,
Y - 縱軸是shap值加總(每個特征值 * 每個特征的shap值)
這里橫軸的排列是非常有講究的,因為不是按順序排列的,該圖會把受相同特征影響大的放一起,
比如觀察最左邊,藍(lán)色扎堆是負(fù)向shap增益區(qū),劃過可以看到基本是0/4/5/12這幾個特征對大多數(shù)樣本都有負(fù)向增益; 當(dāng)然同樣,右邊,紅色扎堆,12/5/10對一些樣本是正向增益的
整體來說,該圖是一個宏觀的了解,諸多樣本不同的特征對其的影響
