1-混合效應(yīng)模型

?????混合效應(yīng)模型(Mixed-effects model)最早應(yīng)用于教育領(lǐng)域,研究不同學(xué)生成績時,同一個班級的學(xué)生成績是不獨立的,呈現(xiàn)一定的相關(guān)性。具有層級結(jié)構(gòu)(hierarchy),在分析的時候,需要考慮該相關(guān)性。不同的層級為不同的水平,也叫做多水平模型(multilevel model)、隨機系數(shù)模型(random coefficient model)。
?????混合效應(yīng)模型可以用于分析連續(xù)性變量(linear mixed model),也可以用于分類變量(logistic mixed model)。這里主要討論線性混合效應(yīng)模型。

水平2???????水平1

班級1: ?????學(xué)生11,學(xué)生12,...,
班級2: ?????學(xué)生21,學(xué)生22,...,
班級3: ?????學(xué)生31,學(xué)生32,...,
... ...
班級J:?????學(xué)生J1,學(xué)生J2,...

方差分析或者線性回歸的基本假設(shè):正態(tài)性、獨立性、方差齊性。多水平數(shù)據(jù)不滿足獨立性。

對于分類變量,模型的校正意味著對不同的分類對應(yīng)不同的截距。

??????e.g. ??????y=β_0+β_1*age+β_2*gender+ε,假設(shè)男性對應(yīng)gender=0,女性gender=1,則
??????Gender=0:y=β_0+β_1*age+ε
??????Gender=1:y=β_0+β_2+β_1*age+ε
??????即不同性別為截距不同而斜率相同的平行回歸線。

??????當(dāng)上述數(shù)據(jù)當(dāng)采用常規(guī)的線性模型分析時,班級作為需要校正的分類變量,將轉(zhuǎn)換為虛擬變量放入模型,J個班級對應(yīng)J-1個虛擬變量,相應(yīng)需要估計J-1個系數(shù),50個班級則需要估計49個系數(shù),模型的效率低,且班級只是需要校正的因素,而不是真正關(guān)心的結(jié)局變量??紤]采用隨機效應(yīng)模型,將班級作為隨機變量放入模型,此時不需要估計各個班級的具體均值,而僅估計班級的方差成分。

??????可以通過-2Log 似然比統(tǒng)計量,對比加了隨機效應(yīng)與不加隨機效應(yīng)的似然比檢驗(自由度為兩個模型變量的差值)是否有意義來判斷是否需要放入隨機效應(yīng),也可以用于其他嵌套模型的對比。

- 模型的分類
  • 隨機效應(yīng)模型(random-effects model):僅包含隨機效應(yīng)
  • 固定效應(yīng)模型(fixed-effects model):僅包含固定效應(yīng)
  • 混合效應(yīng)模型(mixed model):同時包含固定效應(yīng)和隨機效應(yīng)
- 混合效應(yīng)模型
  • 隨機截距模型:僅考慮不同水平截距不同,但所有水平的斜率相同。即不同水平為截距不同的平行線。
  • 隨機系數(shù)模型:不同水平的截距不同,且不同水平的斜率不同。即不同水平為截距不同且不平行的回歸線。
- 模型的假設(shè)

線性混合效應(yīng)模型(linear mixed model)是傳統(tǒng)線性模型的拓展,線性模型的大部分假設(shè)也適用于線性混合效應(yīng)模型。但混合效應(yīng)模型進一步考慮了變量之間的相關(guān)性。


- 固定效應(yīng)與隨機效應(yīng)
  • ?????? 固定效應(yīng)(Fixed effect): 僅研究某幾個固定的處理或組別,不考慮將其結(jié)果推廣到更大的總體。變量不是從更大樣本中抽取的變量,如研究特定某幾個藥之間的區(qū)別,并不需要通過研究結(jié)果推廣到其他藥物。

?????固定效應(yīng)模型表示為y_{ij}=μ_j+e_{ij}y_{ij}=μ+a_j+e_{ij} (不存在協(xié)變量的情況下)
?????μ_j為各個組的均值,這里不存在變異,變異來源僅為e_{ij}
?????var(y_{ij})=var(μ_j+e_{ij})=var(e_{ij})=δ_e^2。
?????此時的var(μ_j)=var(μ+α_j)=0
?????對應(yīng)固定效應(yīng)模型

  • ?????? 隨機效應(yīng)(Random effect):當(dāng)變量為更大的總體中抽取的子集,此時關(guān)心的不再是某幾個組具體組之間的差異,而考慮其所代表的總體的差異。

?????H_0:δ_1^2=δ_2^2=...=δ_J^2, 原假設(shè)不再針對均值,而在于檢驗各個組之間的方差有無差異。
?????模型表示為 y_{ij}=μ+a_j+e_{ij},此時變異來源為α_j,e_{ij}
?????var(y_{ij})=var(μ+a_j+e_{ij})=var(a_j+e_{ij})=δ_α^2+δ_e^2。α_je_{ij}相互獨立。
?????對應(yīng)隨機效應(yīng)模型

????????隨機效應(yīng)的一個特性為可交換性(exchangeability),即這些效應(yīng)分類是否可以被替換。如研究某藥物時,受試者可以為總體中的這一個子集,但也可以用該總體的其他子集進行研究,或者研究不同地區(qū)醫(yī)院滿意度時,可以抽取醫(yī)院A、B,也可以抽取醫(yī)院C、D,醫(yī)院作為隨機效應(yīng),具有可交換性。而研究某幾種藥物時,藥物組別無法用其他組別進行替代。


  • 組內(nèi)相關(guān)系數(shù)(intra-class correlation,ICC)

?????δ_α^2 為 組間變異度(Within group variance),由不同水平(e.g. 醫(yī)院、中心、社區(qū))導(dǎo)致的變異
?????δ_e^2 為 組內(nèi)變異度(Between group variance),由低水平不同個體本身的差異造成的變異

?????不同變異對應(yīng)兩個不同的水平的隨機誤差。低水平的測量值具有一定的相關(guān)性,通過組內(nèi)相關(guān)系數(shù)(intra-class correlation,ICC)ρ衡量。
??????????????????????????????ρ=\frac{δ_a^2}{δ_a^2+δ_e^2}


  • 與其他分析方法的對比

對于嵌套的多水平數(shù)據(jù),可以的方法包括

  1. 采用常規(guī)的方差分析或回歸模型(disaggregation analysis),忽略了數(shù)據(jù)間的相關(guān)性
  2. 對各個高水平求均值之后進行分析( aggregation analysis),未考慮水平內(nèi)的變異。
  3. 采用多水平模型

文獻中關(guān)于幾種不同模型的結(jié)果對比(兩水平數(shù)據(jù),自變量為組別):

image.png

混合效應(yīng)模型的標(biāo)準(zhǔn)誤高于忽略數(shù)據(jù)相關(guān)性的方差分析方法。當(dāng)數(shù)據(jù)被視為互相獨立時,每個觀測能提供100%的信息,但實際上同一個水平中的不同觀測間數(shù)據(jù)具有相關(guān)性,相關(guān)性越高能提供的信息越少(低于100%),混合效應(yīng)模型標(biāo)準(zhǔn)誤增加(需要加上數(shù)據(jù)之間的協(xié)方差)。由此可見,針對這類數(shù)據(jù)如果采用常規(guī)的分析方法,假陽性增加。

聚類分析因為樣本量的減少(一個水平視為一個樣本求均值后進行分析),標(biāo)準(zhǔn)誤增加

Blanced結(jié)構(gòu)的數(shù)據(jù),截距效應(yīng)估計相同,但標(biāo)準(zhǔn)誤有差異。Unbalanced結(jié)構(gòu),均有差異


  • 參考:

醫(yī)學(xué)和公共衛(wèi)生研究常用多水平統(tǒng)計模型(李曉松)
Applied Mixed Model Analysis A Practical Guide (Jos W. R. Twisk)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容