- Holand AM, Steinsland I, Martino S, Jensen H. Animal models and integrated nested Laplace approximations. G3 (Bethesda). [Internet]. 2013;3:1241–51. Available from: http://www.g3journal.org/content/3/8/1241.short
動(dòng)物模型是在進(jìn)化生物學(xué)和動(dòng)物育種中使用的廣義線性混合模型,以鑒定性狀的遺傳部分。集成嵌套拉普拉斯逼近(INLA)是一種用于對(duì)分級(jí)高斯馬爾可夫模型進(jìn)行快速,基于非抽樣的貝葉斯推理的方法。在本文中,我們證明了INLA方法可以用于許多版本的貝葉斯動(dòng)物模型。我們使用INLA分析具有高斯,二項(xiàng)式和泊松似然性的合成案例研究和麻雀(Passer domesticus)群體病例研究的動(dòng)物模型。使用馬爾科夫鏈蒙特卡羅方法將推斷結(jié)果與結(jié)果進(jìn)行比較。對(duì)于模型選擇,我們使用偏差信息標(biāo)準(zhǔn)(DIC)的差異。我們建議并展示如何通過(guò)將它們與模擬研究的抽樣結(jié)果進(jìn)行比較來(lái)評(píng)估DIC中的差異。我們還引入了一個(gè)R包,AnimalINLA,為使用INLA的貝葉斯動(dòng)物模型容易和快速推理。
為了估計(jì)不同種類性狀的加性遺傳方差(以及遺傳力),生物學(xué)家和動(dòng)物育種者經(jīng)常使用稱為動(dòng)物模型的廣義線性混合模型(GLMM)。在動(dòng)物模型中,個(gè)體i的性狀具有遺傳部分ui。值ui被稱為個(gè)體i的育種值。假設(shè)育種值是許多基因的影響的總和,并且來(lái)自中心極限定理,育種值被假定為具有由譜系給出的依賴性結(jié)構(gòu)的高斯分布。自20世紀(jì)80年代初以來(lái),動(dòng)物育種者成功地使用了限制最大可能性(REML)的頻率方法,例如增加牛的肉或牛奶產(chǎn)量(Simm1998)。然而,對(duì)REML的推論對(duì)于GLMM模型不是微不足道的。非高斯性狀的模型在育種值和其他參數(shù)估計(jì)的不確定性方面尤其具有挑戰(zhàn)性(Tempelman和Gianola 1994; Sorensen和Gianola 2002; Bolker等人2009; Fong等人2010)。流行的方法是用于計(jì)算育種值的最佳線性無(wú)偏預(yù)測(cè)(BLUP)(Henderson 1950)(Wilson等人2009)。然而,BLUP忽略了與估計(jì)相關(guān)的所有不確定性,并且不適合在進(jìn)化問(wèn)題中的假設(shè)檢驗(yàn)**(Postma 2006; Wilson等人2009; Hadfield等人2010)。另一種方法是在貝葉斯框架中執(zhí)行建模。所有參數(shù)都被認(rèn)為是隨機(jī)變量,并且(在理論上)直接考慮參數(shù)估計(jì)中的所有不確定性。這解決了推斷非高斯性狀的問(wèn)題(Tempelman和Gianola 1994; Fong等人,2010),并解釋了育種值的估計(jì)不確定性。此外,貝葉斯建模還解決了關(guān)于育種值分析的許多問(wèn)題,在Postma(2006),Wilson等人(2009),和Hadfield et al。 (2010),因?yàn)橛N值和育種值的功能(例如,孵化年份的平均育種值)被認(rèn)為是隨機(jī)變量,因此考慮不確定性和依賴性。貝葉斯框架的這種靈活性使得貝葉斯動(dòng)物模型越來(lái)越受歡迎。它們從1990年代早期開(kāi)始用于動(dòng)物育種,而最近才引入進(jìn)化生物學(xué)(Kruuk et al。2008; O'Hara et al。2008; Ovaskainen et al。2008; Hadfield 2010; Steinsland and Jensen 2010) 。參見(jiàn)Gianola和Fernando(1986)和Sorensen和Gianola(2002)討論貝葉斯動(dòng)物模型。除了少數(shù)特殊情況,貝葉斯模型對(duì)于典型感興趣的數(shù)量(例如,后期均值)沒(méi)有閉合形式的分析表達(dá)式。因此,需要數(shù)值近似。貝葉斯模型的傳統(tǒng)近似程序是馬爾科夫鏈蒙特卡羅(MCMC)(Sorensen和Gianola 2002,Van De Wiel等人2013)。 MCMC是一種非常靈活的方法,可用于推斷任何貝葉斯模型,我們可以得到任何隨機(jī)變量或參數(shù)的后驗(yàn)估計(jì);少量,共同或功能。建立一個(gè)好的MCMC算法(快速收斂,良好的混合,計(jì)算速度快)和評(píng)估它(收斂和混合)是一個(gè)非專家的挑戰(zhàn)。最后,對(duì)于動(dòng)物模型,這已經(jīng)改善,因?yàn)楝F(xiàn)在有可用于在R中使用MCMC(MCMCglmm; Hadfield 2010)和BUGS(Lunn等人2000)推斷這些模型的包。對(duì)于層級(jí)潛在高斯馬爾科夫隨機(jī)場(chǎng)模型,最近已經(jīng)引入了基于非抽樣的數(shù)值近似過(guò)程(Rue et al。2009)的集成嵌套拉普拉斯逼近(INLA)。使用INLA,我們可以計(jì)算所有參數(shù)和每個(gè)隨機(jī)效應(yīng)的邊際后驗(yàn),以及隨機(jī)效應(yīng)的線性組合的后驗(yàn)。 INLA基于直接數(shù)字積分而不是模擬。 Rue和Martino(2007)展示了幾種模型和數(shù)據(jù)集,INLA比MCMC快得多,并且對(duì)于給定的計(jì)算預(yù)算更準(zhǔn)確。更快的推理鼓勵(lì)應(yīng)用研究者探索更多的模型。此外,這也打開(kāi)了新的機(jī)會(huì)進(jìn)行模擬研究,例如可用于探索識(shí)別性問(wèn)題和建立特定假設(shè)的測(cè)試。在GLMM之間執(zhí)行模型選擇不是一個(gè)簡(jiǎn)單的任務(wù)(Skrondal和Rabe-Hesketh 2004),并且使用偏差信息標(biāo)準(zhǔn)(DIC)的差異已被質(zhì)疑(Fong等人2010)。我們建議使用模擬研究來(lái)評(píng)估DIC是否是模型選擇的適當(dāng)度量??焖倌M和推理方法對(duì)于計(jì)算可行的模擬研究至關(guān)重要。 INLA已被用于統(tǒng)計(jì)學(xué)的若干領(lǐng)域,例如生存分析(Martino等人2011),空間GLMM(Eidsvik等人2009)和疾病繪圖(Roos和Held 2011,Schr?dle等人2011)。本文通過(guò)證明這些模型適合INLA框架并且通過(guò)提供用于進(jìn)行推斷的R包,AnimalInLA,對(duì)高斯和幾個(gè)非高斯動(dòng)物模型的更簡(jiǎn)單和更快的貝葉斯推理做出貢獻(xiàn)。在材料和方法部分,我們介紹案例研究中使用的數(shù)據(jù)。然后我們簡(jiǎn)要修改使用INLA的相關(guān)要求和INLA給出的可能性,并完全指定我們使用的動(dòng)物模型。我們還提出了一個(gè)基于模擬的測(cè)試的框架DIC的差異的能力選擇有遺傳效應(yīng)和沒(méi)有遺傳效應(yīng)的模型。接下來(lái),介紹了合成案例研究和麻雀案例研究的結(jié)果。使用INLA進(jìn)行推理,在一些情況下,將結(jié)果與MCMC進(jìn)行比較。文章以討論和結(jié)論為結(jié)束,討論了INLA框架在定量遺傳學(xué)中的結(jié)果以及機(jī)會(huì)和局限性。