[說(shuō)人話的統(tǒng)計(jì)學(xué)·協(xié)和八]第四章·下 方差分析(ANOVA)-多組平均數(shù)的比較

注:說(shuō)人話的統(tǒng)計(jì)學(xué)系列原連載于協(xié)和八微信公眾號(hào)。本文為筆者的學(xué)習(xí)筆記,每篇文章標(biāo)題已加入原文超鏈接。如侵權(quán)請(qǐng)告知。

07 沒(méi)聽(tīng)說(shuō)過(guò)多因素ANOVA?那你可就OUT了!| 協(xié)和八

多因素 ANOVA(multi-factor ANOVA)

多因素 ANOVA 顧名思義就是會(huì)同時(shí)檢驗(yàn)多個(gè)因素對(duì)測(cè)量值的影響,多因素 ANOVA 應(yīng)用非常廣泛,比如研究新型藥物對(duì)疾病的治愈能力往往還要考慮到患者的年齡性別等因素,研究學(xué)歷對(duì)薪水的影響也要考慮到家庭背景等其它社會(huì)因素才能讓結(jié)果更有說(shuō)服力。

多因素 ANOVA 不僅考慮每個(gè)因素單獨(dú)對(duì)要檢驗(yàn)的量的影響,還會(huì)考慮到因素之間的交互效應(yīng)
與單因素 ANOVA 一樣,多因素 ANOVA 需要每個(gè)條件下的數(shù)據(jù)都服從正態(tài)分布,且不同組的數(shù)據(jù)方差相等,也就是說(shuō)在我們?cè)谟?jì)算組內(nèi)平方和時(shí)用到的誤差項(xiàng)要服從正態(tài)分布。另外和之前講過(guò)的所有檢驗(yàn)方法一樣,每一個(gè)數(shù)據(jù)樣本也要相互獨(dú)立。
對(duì)每個(gè)實(shí)驗(yàn)分組都采集了相同數(shù)量的樣本,這又叫做等重復(fù)實(shí)驗(yàn)的方差分析( balanced design ANOVA)。

08 多因素ANOVA=好幾個(gè)單因素ANOVA?可沒(méi)這么簡(jiǎn)單!| 協(xié)和八

多因素 ANOVA ,可以用單獨(dú)的點(diǎn)來(lái)表示各組的平均值,再加上誤差棒,然后再用合適的標(biāo)記把不同因素區(qū)分開(kāi)來(lái),被很多統(tǒng)計(jì)學(xué)書籍稱為「輪廓圖」或「剖面圖」(profile plot)。我們認(rèn)為,這兩個(gè)中文譯法并不是特別好。英文 profile 有幾個(gè)不同的含義,在這里的意思更多是「主要特征」。

只需要看一下不在坐標(biāo)軸上的那個(gè)因素所對(duì)應(yīng)的不同水平的折線是否大致平行——如果平行,那么就很可能沒(méi)有交互效應(yīng),反之則表示可能有交互效應(yīng)。


09 兩個(gè)因素相互影響,ANOVA結(jié)果該如何判讀?| 協(xié)和八

自由度是每個(gè)因素分組的數(shù)量減去 1,比如性別共分男女兩組,所以性別自由度是 1;交互效應(yīng)的自由度是每個(gè)因素自由度的乘積。最后一行 residuals(殘差) 指的是不能被所研究的因素解釋的那部分波動(dòng)性,其自由度就是總樣本量 30 減去總分組數(shù)。各個(gè)因素排列組合共有 2*2=4 種情況,所以總分組數(shù)是 4,殘差的自由度是 26 。

殘差的總平方和就是我們之前提到的組內(nèi)平方和,而其他行的總平方和就是組間平方和。平均平方和就是總平方和除以自由度,而 F 值就是某個(gè)因素的平均平方和除以殘差的平均平方和。也就是說(shuō)知道了自由度和總平方和,可以計(jì)算出平均平方和以及 F 值。最后知道了 F 值還要自由度,就可以計(jì)算出 p 值。在自由度不變的情況下,F(xiàn) 值越大,P 值越小。

做多因素 ANOVA 分析的方法

首先,需要對(duì)數(shù)據(jù)進(jìn)行可視化,對(duì)可能出現(xiàn)的結(jié)果有一個(gè)預(yù)期,尤其要注意是否會(huì)有無(wú)序的交互作用;
然后對(duì)數(shù)據(jù)使用多因素 ANOVA 分析,如果沒(méi)有交互效應(yīng),可以通過(guò)主效應(yīng)判斷因素是否對(duì)測(cè)量值有顯著影響,如果發(fā)現(xiàn)有無(wú)序的交互效應(yīng), 則必須還要做事后檢驗(yàn),對(duì)結(jié)果的討論也要圍繞事后檢驗(yàn)兩兩比較的結(jié)果進(jìn)行。

10 ANOVA還能搞三四五因素?等等,我頭有點(diǎn)兒暈…… | 協(xié)和八

三因素ANOVA

因變量必須是連續(xù)型變量(continuous variable),比如身高、體重、收入、耗費(fèi)的時(shí)間、考試分?jǐn)?shù)等。
自變量(也就是 ANOVA 里的三個(gè)「因素」)得是離散型變量(discrete variable,或者叫分類變量 categorical variable),比如說(shuō)性別、種族、職業(yè)之類。
三個(gè)因素不同水平的組合對(duì)應(yīng)于互不相同的受試者——換言之,這是一個(gè)「受試間」設(shè)計(jì)(between-subjects design)。
「受試內(nèi)」設(shè)計(jì)(within-subjects design)要使用重復(fù)測(cè)量多因素 ANOVA(repeated-measures multi-factor ANOVA)。

服從正態(tài)分布
所有分組(三個(gè)因素不同水平的所有組合)內(nèi)的數(shù)據(jù)(近似)服從正態(tài)分布箱線圖、頻率直方圖、Q-Q 圖 Shapiro-Wilk 檢驗(yàn)數(shù)據(jù)變換
方差相等
Levene 氏檢驗(yàn)

當(dāng)我們使用三因素 ANOVA 時(shí),結(jié)果要從三維交互效應(yīng)看起:

如果三維交互效應(yīng)顯著,則要把整個(gè)數(shù)據(jù)集按照某一個(gè)因素不同取值拆開(kāi),然后在得到的多個(gè)「子數(shù)據(jù)集」(就好像上面例子中按職位分開(kāi)畫輪廓圖一樣)中做兩因素ANOVA,對(duì)另兩個(gè)因素的二維交互效應(yīng)進(jìn)行考察;

如果三維交互效應(yīng)不顯著,則進(jìn)一步考察整個(gè)樣本中三個(gè)因素兩兩組合得到的三個(gè)二維交互效應(yīng)的顯著性。同樣,如果二維交互效應(yīng)顯著,則需要繼續(xù)在一個(gè)因素不同取值下拆分?jǐn)?shù)據(jù)集,分別考慮另一因素的主效應(yīng);如果二維交互效應(yīng)不顯著,則直接考慮整個(gè)樣本中單個(gè)因素的主效應(yīng)。

11 要做ANOVA,樣本量多大才夠用? | 協(xié)和八

樣本量主要由三個(gè)因素決定:統(tǒng)計(jì)功效,效應(yīng)大小還有顯著性水平。這不僅在t檢驗(yàn)里面成立,在ANOVA里面也一樣成立。
統(tǒng)計(jì)功效顯著性水平按照慣例一般設(shè)為0.8和0.05
ANOVA的效應(yīng)大小常用Cohen氏 f 值或者η2衡量

非重復(fù)測(cè)量ANOVA

在單因素ANOVA檢驗(yàn)中,小效應(yīng)對(duì)應(yīng)f值在0.1左右,中效應(yīng)對(duì)應(yīng)的f值在0.25左右,大效應(yīng)在0.4左右。

有了統(tǒng)計(jì)功效,效應(yīng)大小,顯著性水平三個(gè)參數(shù)的值,我們便可以用之前推薦過(guò)的免費(fèi)功效分析軟件GPower(或者其他具有功效分析功能或模塊的統(tǒng)計(jì)學(xué)軟件)來(lái)確定樣本量。在GPower中,ANOVA與t 檢驗(yàn)的區(qū)別主要是test family要選擇f tests,在最常見(jiàn)的單因素ANOVA情況下statistical tests要選擇ANOVA:fixed effects, omnibus, one-way

重復(fù)測(cè)量ANOVA

計(jì)算重復(fù)測(cè)量ANOVA的效應(yīng)大小,我們同樣也要考慮到個(gè)體間的差異。


對(duì)比重復(fù)測(cè)量ANOVA和不考慮重復(fù)測(cè)量結(jié)構(gòu)ANOVA,我們可以看到前者得到的效應(yīng)會(huì)大一些,也就是說(shuō)獲得同樣的統(tǒng)計(jì)功效,前者所需要的樣本數(shù)量更小。

當(dāng)我們?cè)O(shè)計(jì)實(shí)驗(yàn)的時(shí)候,為了有更高的統(tǒng)計(jì)功效,減少實(shí)驗(yàn)所需的樣本量,要盡可能地利用重復(fù)測(cè)量的設(shè)計(jì)。比如我們?cè)谘芯啃∈蟮捏w重是否隨年齡變化,我們需要在三個(gè)月,四個(gè)月,五個(gè)月三個(gè)時(shí)間點(diǎn)測(cè)量小鼠的體重。實(shí)驗(yàn)方案一,從同樣的10只小鼠身上在這三個(gè)時(shí)間點(diǎn)分別獲得體重?cái)?shù)據(jù),共需要10只鼠;實(shí)驗(yàn)方案二,每個(gè)時(shí)間點(diǎn)采集10只小鼠的數(shù)據(jù),但是不同時(shí)間點(diǎn)采集的并不是同一批小鼠的體重,共需要30只鼠。方案一不僅用到的鼠的數(shù)量更少,而且得到的統(tǒng)計(jì)功效反而更高,所以會(huì)更優(yōu)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容