Waldmann 2006 REML VS. Bayesian 多性狀

  1. Waldmann P, Ericsson ?T, Ericsson T. Comparison of REML and Gibbs sampling estimates of multi-trait genetic parameters in Scots pine. Theor. Appl. Genet. 2006;112:1441–51.

摘要
多性狀(協(xié))方差估計(jì)是植物和動(dòng)物育種的重要課題。在這項(xiàng)研究中,我們比較了從限制最大似然(REML)和貝葉斯Gibbs抽樣的模擬數(shù)據(jù)和三個(gè)性狀(直徑,高度和分支角度)從26年的部分雙列子代測(cè)試的蘇格蘭松(樟子松L.)?;谀M數(shù)據(jù)的結(jié)果,我們可以得出結(jié)論,REML估計(jì)是準(zhǔn)確的,但是吉布斯采樣的后驗(yàn)分布的模式可以高估,取決于遺傳力的水平。后代的平均值和中位數(shù)顯著高于遺傳力的預(yù)期值。用Δ法計(jì)算的置信區(qū)間向下偏移。最高概率密度(HPD)間隔提供更好的間隔估計(jì),但可以在較低水平上稍微偏置。對(duì)于蘇格蘭松數(shù)據(jù),發(fā)現(xiàn)REML和吉布斯樣本估計(jì)之間存在類(lèi)似的差異。我們得出結(jié)論,需要進(jìn)一步的模擬研究,以評(píng)估不同先驗(yàn)對(duì)遺傳個(gè)體模型中(共)方差分量的影響。


介紹
在最佳效益的育種中,通常存在受到最大關(guān)注的主要關(guān)鍵性狀。然而,還有其他經(jīng)常值得考慮的特征,因?yàn)樗鼈冊(cè)陉P(guān)鍵特征或其特性受到影響的情況下對(duì)最終或未來(lái)結(jié)果做出貢獻(xiàn)。實(shí)例是家畜的健康性狀和木材生產(chǎn)樹(shù)的樹(shù)干質(zhì)量性狀,其中數(shù)量生產(chǎn)能力通常是育種的主要特征。具有一定重要性的所有性狀的有利發(fā)展需要用于同時(shí)評(píng)估的方法,例如長(zhǎng)期以來(lái)在育種工業(yè)中已經(jīng)使用的多特征限制最大似然(REML)協(xié)方差估計(jì)(例如Meyer和Thompson 1986; Meyer 1991 )。主要目的是揭示相互關(guān)系是有利還是不利于未來(lái)選擇(即,根據(jù)研究的目的評(píng)估性狀是正相關(guān)還是負(fù)相關(guān))。多特征“動(dòng)物(或樹(shù)或個(gè)體)模型”由Henderson和Quaas(1976)在定量遺傳學(xué)中引入。基于個(gè)體模型的技術(shù)在估計(jì)方差分量和預(yù)測(cè)育種值方面比傳統(tǒng)的基于家庭的方法更好,因?yàn)樗鼈兛梢允褂脕?lái)自譜系的所有信息,并且對(duì)通過(guò)選擇引入的偏差較不敏感(Sorensen和Kennedy 1984; Henderson 1986; Borralho 1995)。
歷史上,大多數(shù)分析在定量遺傳學(xué)已經(jīng)用古典(也稱(chēng)為頻率)ANOVA方法進(jìn)行。概率在這里從在相同條件下假設(shè)地重復(fù)實(shí)驗(yàn)大量次的框架下觀察。現(xiàn)在,ANOVA方法已經(jīng)在很大程度上被REML方法取代,用于估計(jì)(共)方差分量和使用(近似)最佳線性無(wú)偏預(yù)測(cè)器(BLUP)預(yù)測(cè)育種值。最初由Patterson和Thompson(1971)描述的用于非平衡混合模型的REML方法已經(jīng)廣泛用于動(dòng)物育種。然而,REML方法需要一種迭代技術(shù),通常傾向于在計(jì)算上非常苛刻,特別是對(duì)于多變量數(shù)據(jù)集,因此已經(jīng)投入了大量的努力來(lái)開(kāi)發(fā)更有效的算法。已經(jīng)開(kāi)發(fā)了用于多特征模型中的REML估計(jì)的各種計(jì)算程序,例如, (Meyer 1991),期望最大化(EM)方法(Misztal和Perez-Encisco 1993)和平均信息(AI)方法(Jensen等人,1996)。通常,這些REML方法使用迭代算法來(lái)找到似然的最大值。遺憾的是,盡管很容易獲得所得參數(shù)估計(jì)值(方差分量)的估計(jì)值,但是要計(jì)算這些參數(shù)函數(shù)的可靠置信區(qū)間要困難得多(Harville和Fenech,1985; Burch和Iyer 1997; Soria等人1998)。
計(jì)算能力的當(dāng)前進(jìn)步實(shí)際上導(dǎo)致了在遺傳學(xué)中統(tǒng)計(jì)方法的發(fā)展中的貝葉斯革命(Shoemaker等人1999; Sorensen和Gianola 2002; Xu 2003; Beaumont和Rannala 2004)。在貝葉斯范式中,概率可以被理解為對(duì)不確定性或信念程度的度量。貝葉斯方法在復(fù)雜情況下特別有用,并且通常比普通頻率方法更容易解釋。鑒于許多遺傳問(wèn)題的復(fù)雜性,很明顯貝葉斯方法可以大大有助于改進(jìn)分析。貝葉斯馬爾科夫鏈蒙特卡羅(MCMC)方法在1990年代上半年在定量遺傳學(xué)中被引入(Wang等人1993; Sorensen等人1994),通過(guò)吉布斯采樣程序的發(fā)展促進(jìn)(Geman和Geman 1984; Gelfand和Smith 1990)。吉布斯采樣器連續(xù)地從模型中的所有參數(shù)的條件分布中采樣,以便產(chǎn)生邊際后驗(yàn)分布的隨機(jī)樣本,其是貝葉斯推理的目標(biāo)。吉布斯取樣已經(jīng)在動(dòng)物育種中廣泛實(shí)施,并且已經(jīng)開(kāi)發(fā)了用于多特征評(píng)價(jià)的不同算法(例如Jensen等人1994; van Tassel和Van Vleck 1996)。然而,在植物應(yīng)用中的吉布斯取樣仍然很少(例如Soria等人1998; Gwaze和Woolliams 2001; Zeng等人2004; Waldmann等人2005)。
這項(xiàng)研究的主要目標(biāo)是比較REML和吉布斯抽樣估計(jì)的遺傳參數(shù)從多個(gè)性狀個(gè)別樹(shù)模型。這些方法適用于來(lái)自瑞典北部的蘇格蘭松(Pinus sylvestris L.)二年級(jí)后代試驗(yàn)的模擬數(shù)據(jù)和數(shù)據(jù),測(cè)量三種性狀(博爾直徑,樹(shù)高和分枝角)。我們將分析限制為加性模型,因?yàn)榧有越M分最容易應(yīng)用于基于有性繁殖群體的輪回選擇的實(shí)際育種。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容