多元線性回歸、logistics回歸分析和Cox回歸分析區(qū)別

多元線性回歸

一、原理:

多元線性回歸分析就是研究一個(gè)因變量和多個(gè)自變量之間的關(guān)系。公式如下:

?=a+b1x1+ b2x2。x1和x2為兩個(gè)自變量,y為因變量。

二、要素:

1、因變量:必須為連續(xù)型變量

2、自變量:可為多個(gè)變量

3、方法:應(yīng)用最多的為逐步法(stepwise),即對自變量按照一定的納入和排除標(biāo)準(zhǔn)反復(fù)進(jìn)行引入、剔除過程,直到?jīng)]有變量被引入,也沒有變量被剔除為止。

該回歸方法與logistics回歸分析和Cox回歸分析最顯著的區(qū)別就是,其因變量(y)是連續(xù)變量。舉例:你可以使用該回歸去研究哪些因素可以影響腫瘤的大?。ㄟB續(xù)變量),但不能使用該回歸去研究那些因素可以影響老年人的是否患高血壓?。ǚ诸愖兞浚?/p>

logistics回歸分析

一、原理

多元回歸分析研究一個(gè)正太隨機(jī)因變量Y與一組自變量X(x1,x2,x3,...,xp)的數(shù)量關(guān)系,但我們經(jīng)常遇到因變量為二分類變量的情況,如發(fā)病與否、死亡與否等。需要研究該分類變量與一組自變量之間的關(guān)系,則采用二分類Logistic回歸,又稱非條件Logistic回歸。

Logistic回歸是一種概率分析,即分析當(dāng)暴露因素為x時(shí),個(gè)體發(fā)生某事件(y)的概率的大小。Logistic的方程式為y=β0+β1X1+β2X2+…βmXm。β1,β2…βm稱為回歸系數(shù),反映了在其他變量固定后,x=1與x=0相比發(fā)生y事件的概率。OR越大,發(fā)生結(jié)果的可能性越大

二、要素:

1、因變量:一個(gè)二分類因變量

2、協(xié)變量:所有的自變量

3、方法:自變量少時(shí)采用進(jìn)入法(enter),自變量太多時(shí),選用前進(jìn)法(forward)中的偏似然比(LR),前進(jìn)LR相當(dāng)于多元線性回歸中的逐步回歸

三、重點(diǎn):

1、Logistic回歸分析對樣本量是有一定要求的。簡單的估算方法:樣本量為自變量個(gè)數(shù)的10倍。例如有5個(gè)自變量(x1、x2、x3、x4、x5),則值少要有50個(gè)患者數(shù)據(jù)。

2、因變量(y)是分類變量

3、不允許有數(shù)據(jù)刪失

Cox回歸分析

一、原理:

Logistic回歸分析只考慮了終點(diǎn)事件的出現(xiàn)與否,但惡性腫瘤等隨訪研究中,還需要考慮觀察對象達(dá)到終點(diǎn)所經(jīng)歷的時(shí)間長短。

生存分析就是將終點(diǎn)事件的出現(xiàn)與否和達(dá)到終點(diǎn)所經(jīng)歷的時(shí)間長短結(jié)合起來分析的一類統(tǒng)計(jì)分析方法。其包含的具體統(tǒng)計(jì)過程如下:

l、壽命表 用于分析分組生存資料,求出不同組段的生存率?;蛘弋?dāng)樣本量較大時(shí)(如n> 50) ,可以把資料按不同時(shí)間段分成幾組,觀察不同時(shí)間點(diǎn)的生存率。

2、Kaplan-Meier 用于樣本含量較小時(shí),不能給出特定時(shí)間點(diǎn)的生存率,這樣就不用擔(dān)心每個(gè)時(shí)間段內(nèi)只有很少的幾個(gè)觀測,甚至沒有觀測的尷尬局面。 單因素生存曲線比較(Kaplan-Meier 法)采用乘積極限法( Product-limit estimates) 來估計(jì)生存率,同時(shí)還可以對一個(gè)影響因素進(jìn)行檢驗(yàn)。它適用于以個(gè)體為單位收集信息的精確生存時(shí)間的生存資料,是最為基本的一種生存分析方法。

3、Cox 回歸 用于擬合Cox 比例風(fēng)險(xiǎn)模型,這是生存分析中最重要的一種分析方法,它的出現(xiàn)具有劃時(shí)代的意義,是多因素分析方法中最為常用的一種。

4、Cox 依時(shí)協(xié)變量 是Cox 比例模型的進(jìn)一步發(fā)展。當(dāng)所研究的危險(xiǎn)因素其取值隨時(shí)間而不斷變化,或者其作用強(qiáng)度隨時(shí)間而不斷變化時(shí),Cox 模型的適用條件被違反, 此時(shí)需要對模型加以修正,就必須用到這個(gè)過程。舉一個(gè)典型的例子,臨床試驗(yàn)隨訪資料中經(jīng)常碰到某研究對象從安慰劑組退出,跳轉(zhuǎn)至治療組的資料就應(yīng)當(dāng)用此過程來分析。

K-M法只能研究一個(gè)因素對生存時(shí)間的影響,當(dāng)對生存時(shí)間的影響因素有多個(gè)時(shí)便無能為力,而Cox比例風(fēng)險(xiǎn)模型則可以估計(jì)多個(gè)研究因素對風(fēng)險(xiǎn)率的影響,該過程稱為Cox回歸(Cox regression)

二、要素:

1、因變量:生存時(shí)間

2、協(xié)變量:所有的自變量

3、方法:一般采用前進(jìn)條件法(forward_LR)相當(dāng)于多元線性回歸中的逐步回歸法

4、允許數(shù)據(jù)刪失:即截尾數(shù)據(jù)。產(chǎn)生截尾的原因一般為患者失訪、患者生存期超過了研究的終止期;但截尾數(shù)據(jù)的價(jià)值在于提供了觀察期間的信息,生存時(shí)間不會短于觀察時(shí)間。截尾數(shù)據(jù)常在其右上角標(biāo)記“+”

三、結(jié)果解讀:

B:回歸系數(shù)估計(jì)值

SE:回歸系數(shù)的標(biāo)準(zhǔn)誤

Exp(B):相對危險(xiǎn)度RR值

y是生存時(shí)間;舉例:年齡、性別、分級、分期、geneA的表達(dá)量,那些是影響腫瘤患者生存時(shí)間的因素

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容