Q:老師,請教您個問題,我想對多個變量做多因素生存分析,有兩個想法:1.上述單因素生存分析中,有顯著差別的因素單獨收集起來,對這些在單因素生存分析中有差異的因素進(jìn)行多因素分析,方法是COX回歸;2.無視單因素分析結(jié)果,所有臨床指標(biāo)進(jìn)行多因素生存分析,方法仍然是COX分析?到底哪個正確,小張該怎么辦呢
A:cox模型,先做單變量,然后做multivariate即可
大神一句話,菜鳥跑斷腿——所以,開始吧,少年
1.單因素分析:用kaplan-meier生存分析中的log rank test 中的P值
步驟1:錄入數(shù)據(jù),KM分析需要一個分組變量(即你需要分析的單因素)+一個分組變量(結(jié)局)+一個數(shù)值變量(即時間)


結(jié)果如上,log rank test 中的P值即為所求單因素生存分析的P值
步驟2:我會得到好多個P值。如有有漂亮的生存曲線圖,選擇OUTPUT相應(yīng)格式的圖,放到文章中,此即為單因素的生存分析

多因素分析:單因素生存分析中,有顯著差別的因素單獨收集起來,對這些在單因素生存分析中有差異的因素進(jìn)行多因素分析,方法是COX回歸
但是做之前,我們需要明確,COX回歸需要滿足的條件


然后采用這個方法

但是,丁香園有個老師說:
cox對樣本量是有要求的,樣本中完整病例(如果以死亡為終點,也就是已經(jīng)死了的病例)數(shù)要大于因素數(shù)的10倍。還要求各因素之間沒有相互作用,也沒有共線性。
如果按照這個要求,我篩選了4個變量,是不是死亡例數(shù)應(yīng)該大于40?
后記彩蛋:
1.一般需要在文中需要描述的值,小張一開始錯誤認(rèn)為median是生存時間的中位數(shù),不是的呢,超開心。

2.還有一個問題就是,小張選取的自變量是連續(xù)變量(比如年齡什么的),像性別肯定是分類變量,但是在單因素分析時,用ROC曲線中得到的臨界值分組了,那么是否分組變量會比連續(xù)變量損失了一部分?jǐn)?shù)據(jù)呢?那我做COX回歸的時候,到底該用連續(xù)變量還是分組呢?這個問題,也值得我后續(xù)在思考
