重復(fù)測量數(shù)據(jù)建模與ICC
我們以兒童的生長發(fā)育為例,對ICC在重復(fù)測量數(shù)據(jù)中的作用進行解釋。
例如我們重復(fù)隨訪了1500個兒童在分娩時、1歲、2歲的體重,進而分析兒童體重隨年齡的變化趨勢,則可以建立以下兩水平模型:
$y_{ij}=\beta_{0}+Z_j+\beta_1 age+\varepsilon_{ij}$
水平j(luò):代表1500個兒童,
水平ij: 代表第j個兒童的第i次測量值
其中,$Z_j \sim N(0,\sigma^2_b),\varepsilon_{ij}\sim N(0,\sigma^2_e)$分別代表兒童水平和同一兒童不同年齡水平的隨機效應(yīng)。
此時,同一個兒童在不同年齡階段體重的相關(guān)可以通過層內(nèi)相關(guān)系數(shù)進行衡量:
$corr(y_{ij},y_{ij+1})=\frac{\sigma2_b}{\sigma2_b+\sigma^2_e}=\rho$
此時,總的方差為:$var(y_{ij})=\sigma2_b+\sigma2_e$,為常量,不隨時間的變化而變化。
ICC如何解釋
ICC接近0
在零模型中,ICC代表的不是預(yù)測變量之間的關(guān)聯(lián)性,而是反映模型中殘差之間的關(guān)聯(lián)性。
ICC非常接近0,此時,$\sigma^2_b$非常小,表示同一兒童不同時間點之間的體重測量數(shù)據(jù)變異非常大,而不同兒童體重之間的變異則相對較小。
ICC接近1
當(dāng)ICC非常接近1時,$\sigma^2_e$非常小,則表明同一兒童不同時間點之間的體重測量數(shù)據(jù)變異相對較小,而不同兒童之間的變異則相對較大。
當(dāng)ICC非常小時(一般為ICC<0.1),我們是否可以忽視每個兒童不同年齡階段體重的關(guān)聯(lián)性呢?
很遺憾,答案是不能。即使是ICC非常小時,我們?nèi)匀徊荒芎鲆曂粌和煌挲g階段體重之間的關(guān)聯(lián)性,因為即使這一關(guān)聯(lián)性非常小,我們的統(tǒng)計推斷結(jié)果仍然會受到影響。目前統(tǒng)計學(xué)家們?nèi)匀徊煌扑]把ICC作為決定是否處理層次效應(yīng)的依據(jù)。
層次效應(yīng)推斷的推薦方法之一
我們可以依據(jù)傳統(tǒng)的統(tǒng)計模型選擇方法對層次效應(yīng)進行統(tǒng)計推斷。通過構(gòu)建層次模型與一般線性模型之間擬合效果比較的似然比檢驗(零假設(shè):一般線性模型與層次模型具有同等的擬合效果),一個較高的似然比卡方值和一個較低的P值預(yù)示多水平模型的擬合效果優(yōu)于一般線性模型的擬合效果。