R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十五)隨機(jī)森林生存預(yù)后模型+SHAP值 (Random Survival Forest + SHAP)

禁止商業(yè)或二改轉(zhuǎn)載,僅供自學(xué)使用,侵權(quán)必究,如需截取部分內(nèi)容請(qǐng)后臺(tái)聯(lián)系作者!

image.png
  1. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(一)XGBoost算法+SHAP值(eXtreme Gradient Boosting)
  2. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(二) SVM算法+重要性得分(Support Vector Machine)
  3. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(三)lightGBM算法+SHAP值(Light Gradient Boosting Machine)
  4. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(四)隨機(jī)森林算法+SHAP值 (Random Forest)
  5. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(五)GBM算法+SHAP值 (Gradient Boosting Machines)
  6. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(六)K-鄰近算法 (K-Nearest Neighbors)
  7. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(七)樸素貝葉斯分類(lèi)算法 (Na?ve Bayes Classifier)
  8. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(八)邏輯回歸算法 (logistic regression)
  9. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(九)決策樹(shù)分類(lèi)算法 (Decision Trees Classifier)
  10. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十)自適應(yīng)提升分類(lèi)算法 (Adaptive Boosting)
  11. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十一)MLP分類(lèi)算法 (Multi-Layer Perceptrons)
  12. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十二)線性判別分析分類(lèi)算法 (Linear Discriminant Analysis)
  13. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十三)隨機(jī)森林生存分析構(gòu)建預(yù)后模型 (Random Survival Forest)
  14. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十四): CatBoost分類(lèi)算法+SHAP值 (categorical data gradient boosting)
  15. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十五)隨機(jī)森林生存預(yù)后模型+SHAP值 (Random Survival Forest + SHAP)
  16. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十六)隨機(jī)森林算法回歸模型+SHAP值(Random Forest Regression + SHAP)
  17. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十七)特征選擇之彈性網(wǎng)絡(luò)回歸算法(Elastic Net Regression)
  18. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十八)特征選擇之LASSO算法(Least Absolute Shrinkage and Selection Operator Regression)
  19. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十九)特征選擇之Monte Carlo算法(Monte Carlo Feature Selection)
  20. R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(二十)特征選擇之Boruta算法

機(jī)器學(xué)習(xí)論文

  1. R語(yǔ)言機(jī)器學(xué)習(xí)論文(一):研究背景
  2. R語(yǔ)言機(jī)器學(xué)習(xí)論文(二):數(shù)據(jù)準(zhǔn)備
  3. R語(yǔ)言機(jī)器學(xué)習(xí)論文(三):特征提取
  4. R語(yǔ)言機(jī)器學(xué)習(xí)論文(四):模型構(gòu)建
  5. R語(yǔ)言機(jī)器學(xué)習(xí)論文(五):解釋模型
  6. R語(yǔ)言機(jī)器學(xué)習(xí)論文(六):總結(jié)

介紹

隨機(jī)森林生存分析(Random Survival Forest,簡(jiǎn)稱(chēng)RSF)是一種用于處理右刪失數(shù)據(jù)(即生存時(shí)間數(shù)據(jù))的機(jī)器學(xué)習(xí)方法,它是傳統(tǒng)隨機(jī)森林算法在生存分析領(lǐng)域的擴(kuò)展。RSF的目標(biāo)變量是生存時(shí)間,它考慮了每個(gè)樣本的生存時(shí)間(T)和刪失時(shí)間(C),其中刪失時(shí)間指的是在觀察期間內(nèi)未發(fā)生感興趣事件的時(shí)間。RSF框架的核心步驟包括:

  1. 數(shù)據(jù)重采樣:從原始數(shù)據(jù)中抽取多個(gè)bootstrap樣本,每個(gè)樣本平均排除一定比例的數(shù)據(jù),稱(chēng)為袋外數(shù)據(jù)(Out-Of-Bag, OOB)。
  2. 構(gòu)建生存樹(shù):對(duì)每個(gè)bootstrap樣本構(gòu)建一棵二叉生存樹(shù)。在樹(shù)的每個(gè)節(jié)點(diǎn)上,隨機(jī)選取一定數(shù)量的候選變量,并使用最大化子節(jié)點(diǎn)之間生存差異的候選變量進(jìn)行拆分。
  3. 生長(zhǎng)限制:在葉節(jié)點(diǎn)不少于一定數(shù)量死亡事件的約束下,將樹(shù)生長(zhǎng)到完整大小。
  4. 累積風(fēng)險(xiǎn)函數(shù):對(duì)每棵樹(shù)計(jì)算累積風(fēng)險(xiǎn)函數(shù)(Cumulative Hazard Function, CHF),得到集成累積風(fēng)險(xiǎn)函數(shù)的均值。
  5. 預(yù)測(cè)誤差計(jì)算:使用OOB數(shù)據(jù),計(jì)算集成累積風(fēng)險(xiǎn)函數(shù)預(yù)測(cè)誤差。

教程

本文旨在通過(guò)R語(yǔ)言實(shí)現(xiàn)Random Survival Forest,總共包含:

  1. 加載R包
  2. 案例數(shù)據(jù)
  3. 數(shù)據(jù)預(yù)處理
  4. 數(shù)據(jù)描述
  5. 構(gòu)建randomForestSRC模型
  6. 評(píng)估模型
  7. 特征重要性(篩選特征)
  8. 構(gòu)建新模型
  9. 模型解釋SHAP
  10. 保存模型
  11. 總結(jié)
  12. 系統(tǒng)信息

更多內(nèi)容請(qǐng)前往

R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十五)隨機(jī)森林生存預(yù)后模型+SHAP值 (Random Survival Forest + SHAP)

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容