2. 填補的方法

????? SAS中給出了不針對不同類型的填補變量、協(xié)變量以及不同缺失模式下填補方法的匯總,具體可以參考SAS Help。填補的方法包括Monotone缺失模式下的Regression、Monotone和Non-monotone模式下都可以用的FCS和MCMC等。Regression方法用的較多,同時也比較好理解,F(xiàn)CS和MCMC則相對比較復雜一些。匯總了各個方法相應的填補過程及相關公式,可以幫助更好的理解方法。

1. Regression imputation

????? 該填補方法只能在Monotone缺失模式下使用。
????? 填補基于線性回歸,待填補變量作為因變量,其余認為可能與缺失數(shù)據(jù)有關的變量作為自變量。模型的回歸參數(shù)通過待填補變量完整的記錄估計,因此該模型假設的是缺失受試者與不缺失的受試者具有相同的趨勢。
????? 如訪視3缺失,在Monotone模式下,Y_1,...,Y_2均有數(shù)據(jù)。
????? 回歸模型將基于Y_1,Y_2,Y_3均有數(shù)據(jù)的記錄進行估計,即Y_{i,3,obs}=β_{0,3}+β_{1,3}Y_{i,1,obs}+β_{2,3}Y_{i,2,obs}+e_{i,3}
????? i:第i個受試者, 通過不缺失的記錄獲得模型參數(shù)。
????? Y_3缺失的受試者將通過上述模型進行估計。 訪視4、5、6、... ...、i 缺失的受試者,重復上述的過程,模型的自變量將包括對應的i-1個訪視的結果。
????? 實際填補時,由于需要隨機產(chǎn)生數(shù)據(jù),而每次填補將產(chǎn)生不同的數(shù)據(jù),填補結果并不直接來源于上述的回歸方程,而是通過該方程相關的參數(shù)產(chǎn)生一個多元正態(tài)分布,每次填補時從該分布中隨機產(chǎn)生一組β用于填補。
????? 公式幫助理解:

Source: Multiple Imputation and its Application

2. Full Conditional Specification

????? FCS可以同時用于Monotone和non-monotone兩種缺失模式。該方法使用一系列單變量模型(每個待填補變量對應一個模型,變量填補順序與Var中聲明順序相同),類似于前面提到的回歸填補。填補包括Fill-in和Imputation兩步:
????? 1. Fill-inY_1缺失,則通過已觀測到的Y_{1(obs)}產(chǎn)生條件概率分布P(θ_1|Y_{1(obs)}),從貝葉斯后驗分布中產(chǎn)生新的參數(shù){θ_1^{(0)}}\thicksim P(θ_1|Y_{1(obs)}),填補值Y_{1(*)}^{(0)}\thicksim P(Y_1|θ_1^{(0)})。填補完成后,再用已填補完的數(shù)據(jù)及已觀測到的數(shù)據(jù)Y_{1(obs)}+Y_{1(*)}^{(0)}重復上述步驟,填補第2個缺失變量,θ_2^{(0)}\thicksim P(θ_2|Y_{1(obs)}+Y_{1(*)}^{(0)},Y_{2(obs)}),Y_2^{(0)}\thicksim P(Y_2|θ_2^{(0)})。直到所有變量填補完成。
????? 2. Imputation:該步驟中進行填補。填補Y_1時,將Y_1未缺失的記錄及其他變量(Y_2^{(t)},...,Y_p^{(t)})均放入模型,從模型中獲得新的參數(shù)θ_1^{(t+1)} \thicksim P(θ_1|Y_{1(obs)},Y_2^{(t)},...,Y_p^{(t)} ),產(chǎn)生填補值Y_{1(*)}^{(t+1)}。填補Y_2時,同樣將已填補完的Y_1及未缺失的Y_1, Y_2放入模型填補Y_2。t為迭代次數(shù),t=0時即為第1步中產(chǎn)生的值,t>0時為第t次迭代的值。SAS中通過NBITER=控制迭代次數(shù),F(xiàn)CS命令來實現(xiàn)。
?????公式幫助理解:

Source: SAS Help
?????

3. Joint modeling

????? 該方法與FCS類似,可以同時用于monotone和non-monotone,但并不采用回歸填補,而是通過MCMC(Markov Chain Monte Carlo)法從貝葉斯后驗分布中抽樣以產(chǎn)生每次填補值。
????? SAS中通過MCMC命令來實現(xiàn)。
????? 當使用MCMC時,Class選項不能使用。分類變量需要以數(shù)值的形式進入模型,多分類變量以dummy code進入。


Source: SAS Help / Multiple Imputation and its Application / Clinical Trials with Missing Data
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容