禁止商業(yè)或二改轉(zhuǎn)載,僅供自學(xué)使用,侵權(quán)必究,如需截取部分內(nèi)容請(qǐng)后臺(tái)聯(lián)系作者!

image.png
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(一)XGBoost算法+SHAP值(eXtreme Gradient Boosting)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(二) SVM算法+重要性得分(Support Vector Machine)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(三)lightGBM算法+SHAP值(Light Gradient Boosting Machine)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(四)隨機(jī)森林算法+SHAP值 (Random Forest)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(五)GBM算法+SHAP值 (Gradient Boosting Machines)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(六)K-鄰近算法 (K-Nearest Neighbors)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(七)樸素貝葉斯分類(lèi)算法 (Na?ve Bayes Classifier)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(八)邏輯回歸算法 (logistic regression)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(九)決策樹(shù)分類(lèi)算法 (Decision Trees Classifier)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十)自適應(yīng)提升分類(lèi)算法 (Adaptive Boosting)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十一)MLP分類(lèi)算法 (Multi-Layer Perceptrons)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十二)線性判別分析分類(lèi)算法 (Linear Discriminant Analysis)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十三)隨機(jī)森林生存分析構(gòu)建預(yù)后模型 (Random Survival Forest)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十四): CatBoost分類(lèi)算法+SHAP值 (categorical data gradient boosting)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十五)隨機(jī)森林生存預(yù)后模型+SHAP值 (Random Survival Forest + SHAP)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十六)隨機(jī)森林算法回歸模型+SHAP值(Random Forest Regression + SHAP)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十七)特征選擇之彈性網(wǎng)絡(luò)回歸算法(Elastic Net Regression)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十八)特征選擇之LASSO算法(Least Absolute Shrinkage and Selection Operator Regression)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(十九)特征選擇之Monte Carlo算法(Monte Carlo Feature Selection)
- R語(yǔ)言機(jī)器學(xué)習(xí)算法實(shí)戰(zhàn)系列(二十)特征選擇之Boruta算法
機(jī)器學(xué)習(xí)論文
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(一):研究背景
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(二):數(shù)據(jù)準(zhǔn)備
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(三):特征提取
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(四):模型構(gòu)建
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(五):解釋模型
- R語(yǔ)言機(jī)器學(xué)習(xí)論文(六):總結(jié)
介紹
隨機(jī)森林生存分析(Random Survival Forest,簡(jiǎn)稱(chēng)RSF)是一種用于處理右刪失數(shù)據(jù)(即生存時(shí)間數(shù)據(jù))的機(jī)器學(xué)習(xí)方法,它是傳統(tǒng)隨機(jī)森林算法在生存分析領(lǐng)域的擴(kuò)展。RSF的目標(biāo)變量是生存時(shí)間,它考慮了每個(gè)樣本的生存時(shí)間(T)和刪失時(shí)間(C),其中刪失時(shí)間指的是在觀察期間內(nèi)未發(fā)生感興趣事件的時(shí)間。RSF框架的核心步驟包括:
- 數(shù)據(jù)重采樣:從原始數(shù)據(jù)中抽取多個(gè)bootstrap樣本,每個(gè)樣本平均排除一定比例的數(shù)據(jù),稱(chēng)為袋外數(shù)據(jù)(Out-Of-Bag, OOB)。
- 構(gòu)建生存樹(shù):對(duì)每個(gè)bootstrap樣本構(gòu)建一棵二叉生存樹(shù)。在樹(shù)的每個(gè)節(jié)點(diǎn)上,隨機(jī)選取一定數(shù)量的候選變量,并使用最大化子節(jié)點(diǎn)之間生存差異的候選變量進(jìn)行拆分。
- 生長(zhǎng)限制:在葉節(jié)點(diǎn)不少于一定數(shù)量死亡事件的約束下,將樹(shù)生長(zhǎng)到完整大小。
- 累積風(fēng)險(xiǎn)函數(shù):對(duì)每棵樹(shù)計(jì)算累積風(fēng)險(xiǎn)函數(shù)(Cumulative Hazard Function, CHF),得到集成累積風(fēng)險(xiǎn)函數(shù)的均值。
- 預(yù)測(cè)誤差計(jì)算:使用OOB數(shù)據(jù),計(jì)算集成累積風(fēng)險(xiǎn)函數(shù)預(yù)測(cè)誤差。
教程
本文旨在通過(guò)R語(yǔ)言實(shí)現(xiàn)Random Survival Forest,總共包含:
- 加載R包
- 案例數(shù)據(jù)
- 數(shù)據(jù)預(yù)處理
- 數(shù)據(jù)描述
- 構(gòu)建randomForestSRC模型
- 評(píng)估模型
- 特征重要性(篩選特征)
- 構(gòu)建新模型
- 模型解釋SHAP
- 保存模型
- 總結(jié)
- 系統(tǒng)信息
更多內(nèi)容請(qǐng)前往

image.png