單因素方差分析和多因素方差當出現(xiàn)矛盾時

原始研究:
我們在做統(tǒng)計分析時,很多人都習慣這樣的分析套路:先進行統(tǒng)計描述,然后做單因素分析,最后再進行多因素分析。在閱讀文獻時,我們也會發(fā)現(xiàn),不管是一般的統(tǒng)計描述還是單因素分析,往往能夠支持研究人員作出結(jié)論的,還是要看最終的多因素分析結(jié)果。

在前期推送的內(nèi)容中我們也講過,多因素分析的目的是通過控制其它多個混雜因素的影響,找出具有獨立作用的影響因素,并估計其效應大小。

既然這樣的話,做單因素分析還有什么用呢,直接做多因素分析不就好啦?

多因素分析的地位固然重要,但是單因素分析也必不可少,單因素分析可以為多因素分析提供很多有效的信息,將單因素和多因素分析的結(jié)果進行比較,也能發(fā)現(xiàn)很多問題。如果單因素和多因素分析的結(jié)果一致的話,結(jié)論就比較穩(wěn)定且容易解釋,但是我們常常會遇到單因素和多因素分析的結(jié)果不一致,甚至是出現(xiàn)相互矛盾的尷尬情況,此時又該怎么辦,該如何去解釋呢?

今天我們就來一起聊一聊單因素分析和多因素分析之間的愛恨情仇。

首先我們根據(jù)單因素分析和多因素分析的結(jié)果對比,將可能出現(xiàn)的情況做一個四格表,如表1所示,分為A、B、C、D一共4種情況,下面我們分別對這四種情況進行討論。

img

情況A

單因素分析和多因素分析的結(jié)果都顯示無統(tǒng)計學顯著性,兩者結(jié)果一致,均為陰性結(jié)果

在這種情況下,結(jié)果還是相對比較好解釋的,一般基本上可以認為該因素對于結(jié)局事件來說,不是一個有意義的影響因素。

但是事情也并非這么簡單,如果該因素作為一個混雜因素,在多因素分析中只是用來起到調(diào)整混雜作用的目的,那么雖然它在單因素和多因素分析中都是陰性結(jié)果,可能也不會太引起研究人員的重視;但是如果該因素是研究中所重點關(guān)注的一個因素,例如暴露/處理因素,此時單因素和多因素分析都得出陰性結(jié)果的話,就會讓人感覺比較沮喪,不過也更值得我們好好去思考一下陰性結(jié)果背后的意義。

到底是該暴露/處理因素對結(jié)局事件真的沒有影響,還是說因為其他原因而導致它的實際效應沒有被顯示出來?到底是研究設計的問題,還是指標定義的問題,亦或是統(tǒng)計方法的問題呢?都需要我們認真去查找一下原因,可以參考前期推送的有關(guān)介紹“陰性結(jié)果”的系列文章,或許可以幫助你尋找一下產(chǎn)生陰性結(jié)果的原因,開拓一下分析思路。

情況B

單因素分析結(jié)果顯示統(tǒng)計學顯著性

多因素分析結(jié)果顯示統(tǒng)計學顯著性

這種情況可能并不常見,主要是因為在單因素分析中沒有統(tǒng)計學顯著性的因素,按照一般的做法就不會再將此變量納入到多因素分析中了,但其實上述做法小咖并不推薦,它是存在一定缺陷的。

我們在前期介紹《如何理解回歸模型中的“調(diào)整”和“獨立作用”》的內(nèi)容中講到,在單因素分析中,由于自變量之間存在一定的相互關(guān)聯(lián),自變量對因變量的影響反映的不僅僅單純是它本身的作用,而是包含了該變量自身作用以及其他變量的混雜作用之后,呈現(xiàn)出來的一個綜合的結(jié)果。而在多因素分析中,通過構(gòu)建回歸模型,調(diào)整了其他混雜因素的影響,從而才使該因素對因變量的真實效應顯示出來。

因此不難理解,當某因素在單因素分析結(jié)果中無統(tǒng)計學顯著性,而多因素分析結(jié)果有統(tǒng)計學顯著性時,此時可能的原因是,該因素與其他混雜因素之間可能存在一定的關(guān)聯(lián),在單因素分析時,該因素的真實效應被其他混雜因素的作用所掩蓋,通過多因素分析消除其他因素的影響后,才發(fā)現(xiàn)原來該因素對于結(jié)局事件來說是具有獨立作用的。

舉一個例子,例如某因素A是一個危險因素,而因素B是一個保護因素,由于具有因素A的個體,大部分人同時也具有因素B,因此在單因素分析中,因素A的作用并沒有顯現(xiàn)出來,這是因為因素A的危險作用被因素B的保護作用所掩蓋了,無法體現(xiàn)因素A的實際效應。而通過多因素分析,將因素B的保護作用進行調(diào)整,從而暴露出因素A真實的危險作用。

情況C

單因素分析結(jié)果顯示統(tǒng)計學顯著性

多因素分析結(jié)果顯示統(tǒng)計學顯著性

想必大家都會經(jīng)常遇見到這種情況,單因素分析時該因素有統(tǒng)計學顯著性,然后就很興奮地把它扔進多因素分析中,結(jié)果多因素分析結(jié)果卻顯示沒有統(tǒng)計學顯著性,感覺前功盡棄,很讓人頭痛,不知道是出了什么問題,到底該怎么辦了。

我們?nèi)匀灰郧巴扑偷摹?a target="_blank">傳統(tǒng)單因素分析和單因素回歸分析》一文中所引用的研究為例,如表2和表3所示。

表2. 研究對象基線特征

img

表3. 單因素和多因素Cox回歸結(jié)果

img

文章中傳統(tǒng)的單因素分析結(jié)果顯示,Non-HDL-C平均水平在發(fā)生心血管疾病組要高于對照組,兩組水平分別為124mg/dL和114mg/dL,差異有統(tǒng)計學顯著性(P<0.01);

然后作者進行了單因素回歸分析,其結(jié)果顯示Non-HDL-C對于心血管疾病的發(fā)生是一個危險因素,HR=1.45,95%CI為1.11-1.88(P<0.01);

最后作者又進行了多因素回歸分析,結(jié)果顯示Non-HDL-C對于心血管疾病發(fā)生的影響消失了,沒有統(tǒng)計學顯著性,HR=1.77,95%CI為0.98-3.15(P:No Significance)。為什么會出現(xiàn)這樣的情況呢?

如果你對情況B產(chǎn)生的原因已經(jīng)理解,那么情況C也是同樣的道理。在單因素分析中,自變量與因變量之間可能出現(xiàn)一定的假關(guān)聯(lián)或者是間接的關(guān)聯(lián),例如某因素A對結(jié)局事件并無影響,而因素B對于結(jié)局事件是一個影響因素,但是由于因素A只是單純的和因素B有強烈的相關(guān)性,兩者存在共線性的現(xiàn)象,那么在單因素分析中,就可能出現(xiàn)因素A也存在顯著差異的結(jié)果,從而導致因素A被誤認為是一個影響因素而納入到多因素分析中。

而在多因素分析中通過調(diào)整因素B的影響,因素A與因變量的“假關(guān)聯(lián)”就消失了,此時可以認為因素A實際上對于結(jié)局事件并非是一個影響因素。就如同上述研究中的Non-HDL-C這個指標,在單因素分析中,它與心血管疾病的關(guān)聯(lián)受到其它因素的影響,可能只是一種“假關(guān)聯(lián)”,這種“假關(guān)聯(lián)”在多因素分析中就很容易被調(diào)整而消失。

(注:針對Non-HDL-C這個指標,本文只從統(tǒng)計結(jié)果的角度將該研究作為例子進行講解,不對Non-HDL-C作專業(yè)上的解釋,具體意義需結(jié)合臨床)

情況D

單因素分析和多因素分析的結(jié)果都顯示統(tǒng)計學顯著性,兩者結(jié)果一致,均為陽性結(jié)果

這種情況應該是大家最愿意看到的情況吧,往往單因素和多因素分析都出現(xiàn)陽性結(jié)果,以此結(jié)果作出的結(jié)論還算是比較穩(wěn)定可靠,可以放心地寫文章投稿了,但前提是單因素和多因素分析的陽性結(jié)果的方向是一致的,比如單因素分析顯示病例組某因素的水平顯著高于對照組,多因素分析也顯示該因素為危險因素,兩者的結(jié)果都傾向于該因素對結(jié)局事件具有危險作用。

不過偶爾也會遇見這樣的情況,雖然單因素和多因素分析都得出陽性結(jié)果,但是有時單因素分析顯示為危險因素,而多因素分析顯示為保護因素,或者單因素分析顯示為保護因素,而多因素分析顯示為危險因素,兩者的結(jié)果是相互矛盾的。

出現(xiàn)這樣的情況,其實和上述的情況B和C是同樣的道理,這是在統(tǒng)計分析中經(jīng)常出現(xiàn)的一個陷阱,統(tǒng)計學上稱之為“辛普森悖論”(Simpson’s Paradox),是由英國統(tǒng)計學家E.H.Simpson于1951年提出。簡單理解就是,在某個條件下的兩組數(shù)據(jù),分別討論時都會滿足某種性質(zhì),可是一旦將兩組數(shù)據(jù)合并考慮,卻可能導致相反的結(jié)論。

我們今天討論的單因素分析和多因素分析的結(jié)果出現(xiàn)不一致的情況,就是一個典型的“辛普森悖論”的例子。在單因素分析中,由于沒有考慮到其他因素的影響,在一定情況下就會發(fā)生“辛普森悖論”,然而在多因素分析中,通過調(diào)整控制其他因素的影響,就可以解開“辛普森悖論”之謎,這也是一個很有意思的現(xiàn)象。有興趣的小伙伴可以先查閱一下有關(guān)“辛普森悖論”的資料,我們將在以后的內(nèi)容中向大家進行介紹。

來自:醫(yī)咖會(轉(zhuǎn)載)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容