醫(yī)學(xué)生都想學(xué)的縱向隨訪數(shù)據(jù)分析,你學(xué)會了嗎?


? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 作者丨Lily

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?來源丨醫(yī)數(shù)思維云課堂(ID:Datamedi)? ?

在醫(yī)學(xué)臨床實驗研究中,我們經(jīng)常會收集到患者的多次重復(fù)測量縱向隨訪數(shù)據(jù),即每一個患者都有多次觀測值,這些觀測值是在不同時間記錄的,觀測次數(shù)、時間和間隔都不一定一樣,且多次觀測值都具有潛在相關(guān)性,往往在做分析時是我們更需要關(guān)注的。

那么問題來了,面對不同于我們經(jīng)常收集到的橫斷面數(shù)據(jù),該如何處理分析這些縱向數(shù)據(jù)呢?別急,聽小編慢慢道來。

針對縱向隨訪數(shù)據(jù),結(jié)合數(shù)據(jù)特點,應(yīng)利用線性混合效應(yīng)模型進(jìn)行建模。該模型包含了固定效應(yīng)以及隨機效應(yīng),其中隨機效應(yīng)描述的是在不同層次的不同水平中,各變量對總體觀察變量的貢獻(xiàn)。

那針對線性混合效應(yīng)模型,如何建模分析呢?今天小編推薦R語言當(dāng)中線性混合效應(yīng)模型的兩個包:

1、nlme包,這是相對成熟的R包,它除了可以分析分層的線性混合效應(yīng)模型,也可以處理非線性模型。在優(yōu)勢方面,個人認(rèn)為它可以處理相處復(fù)雜的線性和非線性模型,可以定義方差協(xié)方差結(jié)構(gòu),也可以在廣義線性模型中定義連接函數(shù)。缺點呢,隨機效應(yīng)的定義過于呆板,并且當(dāng)數(shù)據(jù)量很大時,速度很慢,也不能處理多元數(shù)據(jù)。

2、lme4包,相對于nlme包而言,它的運行速度快一點,對于固定效應(yīng)、隨機效應(yīng)的結(jié)構(gòu)也可以相對更復(fù)雜一點。但是不能處理協(xié)方差和相關(guān)系數(shù)結(jié)構(gòu)。

接下來通過案例,讓我們更好的理解這個模型:

例:牛奶蛋白質(zhì)含量這個數(shù)據(jù)是縱向數(shù)據(jù)的一個典型的例子。曾經(jīng)被Diggle,et.al.(2013)等研究過,這個數(shù)據(jù)關(guān)于79頭澳大利亞的奶牛牛奶蛋白質(zhì)含量和三種飼料的關(guān)系,對每一頭奶牛計劃觀測19次,每周一次,但是結(jié)果得到,有些奶牛觀測了19周,有些不到19周,還有最少的觀察了12次。

變量名稱變量解釋

id牛的編號

week第幾周

protein蛋白質(zhì)含量

diet飼料種類:1.barley;2.lunpins;3.mixed

01?數(shù)據(jù)的基本描述

library(lattice)

data_milk<-read.csv("milk.csv")

head(data)

xyplot(protein ~ week | diet, data = data_milk,

???????type = c("b", "smooth"), lwd = 2,

???????as.table = TRUE, ylab = "protein",

???????xlab = "Time (weeks)")

02?建立線性混合效應(yīng)模型

1、nlme包

library(nlme)

model1<-lme(protein~week+diet,random=~week|id,data_milk,method="ML")

summary(model1)

結(jié)果如下:

接下來我們可以用F檢驗來看各個變量的顯著性

anova(model1)

結(jié)果如下:

通過上述結(jié)果來看,兩個變量都顯著,但week的系數(shù)是負(fù)數(shù),這是由于總體上,一開始試驗時牛奶的蛋白質(zhì)含量大多相對較高,后面有幾周下降,然后有回升,所以總體來說似乎隨時間是下降的。

2、lme4包,但是推薦使用lmerTest包,它的結(jié)果可以輸出P值,即顯著性結(jié)果值。

library(lme4)

library(lmerTest)

model2<-lmer(protein~week+diet+(week|id),data_milk)

summary(model2)

結(jié)果如下:

通過上述兩個包建立的模型可以看出,得到的結(jié)果幾乎一樣,但是lmer()函數(shù)針對變量較多時建立模型較好,運行速度較快。同時也可以看得出,我們的響應(yīng)變量是定量變量,因此,我們選擇建立線性混合效應(yīng)模型,但若是我們的響應(yīng)變量是分類變量,那方法就不一樣咯。

怎么樣?是不是挺簡單的,希望大家多多練習(xí)。如果你有關(guān)于回歸分析方面的問題,可以及時聯(lián)系小編,小編一定不遺余力喲,期待我們的再次相約。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容