Genomic selection :A paradigm shift in animal breeding

基因組選擇:動物育種中范式的轉變

文章來源:[https://academic.oup.com/af/article/6/1/6/4638797?tdsourcetag=s_pcqq_aiomsg]
閱讀者:劉綿宇

摘要

傳統(tǒng)的標記輔助選擇(MAS)并未使DNA信息在動物育種中的廣泛使用。主要原因是畜牧生產中感興趣的性狀比預期的要復雜得多:它們由數千種對表型影響微小的基因決定。這些影響通常太小而沒有統(tǒng)計顯著(事物得以相互區(qū)別的能力),因此被忽略。

基因組選擇(GS)假定所有標記都可能與影響該性狀的基因相關聯(lián),并專注于估計其作用而不是測試其重要性。三項技術突破導致當前DNA信息在動物育種中得到廣泛使用:基因組選擇技術的發(fā)展,大量遺傳標記(單核苷酸多態(tài)性;SNP)的發(fā)現以及高通量技術以低成本的方式對動物(幾十萬)的snp進行基因分型。

本文回顧了GS的當前方法,包括它們如何處理基因型大量缺失的實際數據。預期了全基因組序列數據的使用,并描述其優(yōu)缺點。闡述了GS對奶牛和肉牛,豬以及家禽育種的當前和未來的影響。文末討論了GS的未來發(fā)展方向。

預計未來的gs應用可能是:在品種內(wbgs),通過保持龐大的近交參考種群獲得準確度;或在品種間(abgs),通過跨品種參考種群和高密度gs方法(專注于致病基因組區(qū)域)獲得準確度。我們認為,未來的GS應用將越來越多地轉向abGS。

前言

動物育種,即對重要經濟性狀的選擇育種,在傳統(tǒng)是以表型記錄數據為基礎的。最佳線性無偏預測(BLUP)將個體表型記錄和系譜信息結合起來估計育種值(EBV)。自1990年起,分子遺傳學的進展使人們相信,在DNA水平上信息的利用將比僅僅使用表型數據帶來更多的遺傳改良。這導致了對MAS的研究,包括兩個步驟:(1)檢測和(精確)定位感興趣性狀的基因,即所謂的數量性狀位點(QTL)(2)將QTL信息包括在BLUP-EBV中。

QTL定位步驟(1)中大多數檢測基因的定位研究是有意義的,但是定位研究的重復性較低,即在QTL的位置在不同的研究中可能會發(fā)生改變或消失,其中的一個原因是大多數QTL的效應很小,當這與測試中的大量標記結合時,存在明顯的“Beavis效應”,其中明顯標記的估計效應被高估(Beavis,1994)。比如,如果我們使用0.01的P值測試100個標記的統(tǒng)計顯著性,則即使所有真正的標記效應都為零,我們也期望得到一個(假)顯著結果。相反,如果所有標記都具有非常小的影響,則少數(隨機選取的)標記將達到更高的顯著性水平,并且大多數標記將達不到閾值并被判斷為不顯著。在全基因組關聯(lián)研究(GWAS)中,測試的數量等于基因型獨立SNP的數量,通常在家畜中有數千個,在人類遺傳學中有數十萬個。由于SNP的數量如此之多,多重測試問題變得越來越重要,以至于在人類遺傳學中,P值應小于5×10-8。此外,人類遺傳學期刊還要求在獨立的數據集種確認QTL。

這些非常嚴格的測試結果只發(fā)現了最顯著的QTL。對于一些性狀來說就檢測到了這樣的QTL,例如影響牛奶中脂肪含量的DGA T1(Grisart等,2001)和影響大西洋鮭魚傳染性胰腺壞死病毒(IPNV)抗性的CDH1(Moen等,2015)。然而,對于許多的其他性狀來說,沒有發(fā)現可靠的QTL,并且QTL解釋了不到10%的總體育種目標的變異,即所有重要經濟性狀的組合。甚至對于進行了很多強力QTL定位研究的奶牛來說也是如此,QTL解釋的育種目標的遺傳方差不到10%,意味著家畜之間90%以上的遺傳差異必須通過傳統(tǒng)選擇來處理。因此,直到2005年MAS在家畜育種中的應用也非常有限。在人類遺傳學中,非常龐大的GW AS研究(例如,160,000個個體對500,000個SNPs進行基因分型)只解釋了總遺傳變異中(非常)有限的一部分,這一結果被稱為缺失遺傳力悖論(Manolio等,2009),即這些龐大的gwas研究沒有解釋大部分遺傳變異。

關于遺漏遺傳力問題的許多解釋已經發(fā)表(Manolio等人,2009)。其中最有可能的解釋似乎是因為非常嚴格的統(tǒng)計檢驗和許多影響性狀的小效應基因兩方面結合的原因,即,盡管有大量的基因型個體,但基因效應太小而不能通過嚴格的統(tǒng)計檢驗。所有這些小基因共同解釋了大多數性狀的絕大多數遺傳變異(Yang等,2010)。2001年,Hayes和Goddard(2001)預測50-100個基因影響乳品性狀,這在當時被認為是一個很高的估計。而基于目前的GWAS和基因組選擇結果,我們認為乳品性狀受2,000-10,000個基因的影響。因此,被認為影響復雜性狀(如乳品性狀)的基因數量在過去15年中增加了100倍,即復雜性狀比一二十年前的預期要復雜得多。太多影響性狀的基因意味著單個基因的影響很小,這限制了MAS方法的效率。

三個突破導致目前DNA信息的廣泛應用:1)GS方法學(Meuwissen等,2001),2)數千個SNP標記的鑒定,3)SNP芯片基因分型技術,使所有這些SNP的基因分型的成本降低。在MAS中,使用了少量有意義的標記,其余的被視為零效應。在GS中,所有這些SNP的影響都是在不進行任何顯著性檢驗的情況下同時進行估計的。如果有大約10,000個基因影響一個性狀,那么基因組上到處都是基因,這可能與分布在整個基因組中的數千個SNP有關。因此,所有SNP都有效應的假設可能是有價值的,我們應該將我們的重點從顯著性測試轉移到估計所有標記的影響。(第二代)測序工作使許多家畜物種基因組序列的發(fā)現,同時揭示了數千個SNP標記。在牛中,1,000頭公牛的測序項目已經揭示了3000萬個SNP標記(Daetwyler等,2014)。SNP芯片基因分型技術主要由Illumina和Affymetrix開發(fā),第一代SNP芯片包含大多數家畜物種的典型約50,000個SNP。

在基因組選擇中,對參考群體進行基因分型并記錄性狀來估計SNP效應,接下來,對候選群體進行基因分型,并通過將其基因型與估計的效應相結合來估計候選群體的基因組估計育種值(GEBV),我們可以注意到GS方法并不需要系譜信息,而系譜信息在傳統(tǒng)的BLUP-EBV中是必須的,并且選優(yōu)家畜(候選群體)不一定要具有表型信息,在傳統(tǒng)育種中,選優(yōu)育種的家畜要盡可能準確地記錄表型性狀和系譜信息。這種將精準記錄與選優(yōu)育種群體分開的潛力使得完全重設育種方案成為可能,因此GS導致了動物育種的范式轉變。我們的目的是為非遺傳學家的讀者更詳細地描述GS方法。此外,我們還將描述當前和預測未來GS對奶牛和肉牛、豬和家禽養(yǎng)殖的影響。

基因組選擇方法

在參考群體中同時估算所有SNP效應,使用統(tǒng)計模型對它們的基因型和表型進行分析(假設有50,000個SNP)

公式1

yi是動物i的表型; μ是總體平均值; X1i是標記i的動物i的基因型; ei是殘差。通常我們有<50,000只的參考群體,如果使用傳統(tǒng)的統(tǒng)計方法,將50,000個SNP效應視為固定效應則無法估算它們的效應。在GS中,通過將SNP效應看作從已知分布中得出的隨機效應,可以解決此問題。這可以看作是一種貝葉斯方法,其中添加了有關SNP效應的先驗信息以使所有效應都可估計。一個常用的先驗假設是SNP效應呈正態(tài)分布,均值為0,且具有恒定的方差(即總遺傳方差除以50,000)。實際上,此方法使用BLUP來估計SNP的效應,有時稱為SNP-BLUP。
候選群體j的基因組育種值預測為:
公式2

其中1是對SNP1效應的估計;X1j是SNP1的動物j的基因型。

GBLUP方法

在傳統(tǒng)BLUP中,EBV使用表型和親緣關系進行估算,這些基于動物的系譜。在GBLUP中,GEBV使用表型和基因組關系進行估算,這些表型和基因組關系基于全基因組范圍內的密集標記數據。動物1和2之間的基因組關系被計算為它們的SNP基因型xj1和xj2在所有j的SNP之間的相關性。因此,GBLUP方法與傳統(tǒng)的BLUP非常相似,除了譜系關系被基因組關系代替。 GBLUP方法的一個實際優(yōu)勢是,所有傳統(tǒng)的BLUP方法和軟件仍然可以使用:我們只需要用基因組關系替換譜系即可。

兩個全同胞之間的系譜關系是0.5,這意味著兩個全同胞個體預期具有50%等位基因相同。然而,在現實生活中,兩個全同胞可能共享60%或40%的等位基因,并且這種與基于系譜的50%的期望的偏差將通過密集標記基因分型來檢測到。因此,GBLUP比傳統(tǒng)的BLUP更準確,因為基因組關系比基于譜系的關系更準確。前者需要基于足夠大數量的SNP進行基因組關系估計。對于一個品種中的牲畜和親緣關系,50000個SNP分布在整個基因組中似乎就足夠了(Goddard等人,2011)。品種間的親緣關系越小需要的SNP數量越多。
GBLUP方法的統(tǒng)計模型為:

公式3

ui是動物i的育種值。如果我們將ui定義為如下式子,則GBLUP和SNP-BLUP育種值是等效的。

公式4

ui的定義對兩個動物ui和uj之間的協(xié)方差有影響,其變?yōu)椋?/p>

公式5

假設總遺傳方差為1(為簡單起見),每個SNP的方差為Sb 2 = 1/50000。如果我們對基因型Xki進行標準化,以使其在每個SNP k中均值為0,標準差為1,則上述公式將計算SNP基因型之間的相關性,即動物i和j之間的基因組關系。 (此處不需要對相關系數計算中的均值和標準差進行通常的校正,因為對SNP基因型進行了縮放,以使其均值為0而標準差為1。)以這種方式進行參數化時,SNP-BLUP和GBLUP模型暗示動物之間具有相同的協(xié)方差,因此也具有相同的動物遺傳價值記錄回歸系數。后者意味著,當仔細調整參數時,SNP-BLUP和GBLUP產生相同的GEBV,即方法被認為是等效的。 GBLUP和SNP-BLUP等效性的更正式推論可以在文獻中找到(Habier等,2007; VanRaden,2008; Goddard,2009)。

GBLUP和SNP-BLUP的計算要求可能有很大的不同。 SNP-BLUP需要估計50,000個SNP效果,因此需要求解50,000個方程組,而GBLUP需要估計N個GEBV和求解N個方程,其中N是動物的數量。由于通?;蛐蛣游锏臄盗可儆?0,000,因此(在計算上)首選GBLUP方法。將來,基因型動物的數量預計會急劇增加,因此SNP-BLUP方法很可能成為首選方法。但是,其他非BLUP方法也可能會變得流行起來,如以下各節(jié)所示。

基因組選擇的非線性方法

SNP-BLUP(以及隱含的GBLUP)中的先驗信息假定每個SNP的SNP效應均以相同的方差分布。該假設導致對SNP效應的BLUP估計是所有觀察到的表型的線性組合。從生物學上講,我們可能希望某些接近基因的SNP起作用,而另一些則沒有效果。已經開發(fā)出許多方法,這些方法結合了先驗信息,這些信息假定SNP的分數π有作用,而分數(1-π)根本沒有作用。這些方法使用的模型是:

公式6

其中Ij是指示變量,其值為0或1,指示SNP j是否有效。 BayesC假定具有影響的SNP正態(tài)分布具有恒定的方差(Habier等,2011),因此最接近SNP-BLUP。 BayesB使用先驗效應的SNP的t分布,這使得某些SNP具有非常大的效應(Meuwissen等,2001)。 BayesR假設有效SNP的正態(tài)分布是混合的,這也允許一些SNP具有非常大的效應,即那些從具有最大方差的分布中提取的SNP(Erbe等人,2012)。這些方法估計的SNP效應不再是表型的線性組合。其他非線性估計方法是BayesA(Meuwissen等,2001),LASSO,Bayesian Lasso和彈性網(Hastie等,2009)。 (非線性方法有時被稱為“貝葉斯”方法,因為它們使用SNP效果的先驗分布,但是SNP-BLUP也使用先驗分布,假定為正態(tài)分布。)

非線性方法使用的SNP效應的先驗分布在生物學上比假設所有SNP都具有效應且所有效應都非常小要有意義。在計算機仿真研究中,非線性方法明顯優(yōu)于GBLUP(Meuwissen和Goddard,2010年),但在實際數據中,非線性方法在某些特征上優(yōu)于某些特征,但不是全部特征(Erbe等人,2012年)。這可能由以下解釋:(1) 有許多基因影響著重要的經濟性狀,因此假設所有SNP均具有作用是近似正確的。 (2) 連鎖不平衡(兩個基因座之間的非隨機關聯(lián))延伸到牲畜種群中較大的基因組距離,從而使許多SNP與一個基因相關聯(lián); (3) SNP密度不夠高,以至于每個QTL可以用一個SNP來解釋,因此需要許多SNP來共同解釋QTL的作用。所以,當將50k SNP芯片替換為高密度777k SNP芯片并且數據包含多個品種時,非線性方法相對于GBLUP的優(yōu)勢更加明顯(Br?ndum等人,2015)。(1)和(2)的組合,即有許多基因與連鎖不平衡的程度有關,主要解釋了GBLUP在品種內的良好表現。

序列數據

基于SNP芯片基因型的基因組選擇取決于QTL與SNP之間的連鎖不平衡(LD),即SNP與QTL之間的關聯(lián)。增加SNP的密度會增加任何QTL具有與其完美結合的SNP的可能性。最終密度是用全基因組序列(WGS)數據代替SNP基因型。在后一種情況下,預期致病突變會出現在序列數據中,但是,GS可以直接作用于致病突變,而不必依賴標記和致病突變之間的LD。然而,這些突變隱藏在數百萬個SNP中,沒有任何作用。由此預期和模擬研究表明(Meuwissen和Goddard,2010年),在使用WGS數據時,假設許多SNP沒有效應的非線性GS方法的準確度要比GBLUP高得多。

最近,Br?ndum等人。 (2015年)證明了具有序列數據的GEBV的準確性小幅增長(2-5%)。當前的WGS數據不會大大改善GEBV的準確性的原因可以解釋如下。首先,當從777k數據轉換為WGS數據時,GBLUP方法預期不會產生什么改進,因為用777k數據準確估計了基因組關系,而WGS幾乎不會提高關系的準確性,因此也無法提高GEBV。但是,非線性GS方法試圖識別因果SNP,并有望從WGS數據中受益。第二,當前的WGS數據不是很準確,可能是由于不完善的基因型調用,對SNP歸因的廣泛依賴(請參閱下一節(jié))或結構基因組變異(很難通過短讀序列進行評估)。WGS數據中的不準確之處可能會抵消更高的SNP密度帶來的好處。第三,遠距離LD在參考種群動物中可能廣泛存在,導致大的染色體片段或單倍型很常見。因此,將有許多SNP組合來解釋單倍型以及因果變體的作用。每種統(tǒng)計方法都會選擇最適合其先前假設的SNP效果組合,而它們都可能對單倍型效果給出相同的預測。但是,如果減小LD的范圍(例如,通過使用不那么緊密相關的參考群體),則專注于因果變體的非線性方法可能會比GBLUP(后者同樣使用所有序列變體)的準確性更高。另一個問題是,當今的計算機很難存儲和處理這些海量數據,特別是如果要在許多動物身上采集WGS的情況下。盡管有效利用WGS數據存在當前問題,但可以預期WGS數據將成為未來的基因型數據,因為如果測序成本繼續(xù)下降,WGS可能會成為最有效的基因分型方法(Gorjanc等人,2015年)。

基因型缺失的歸因

SNP芯片基因分型后,一些基因型將丟失。這種缺失可以通過稱為基因型插補的過程來解決。根據動物的已知基因型,可以識別在其他動物中也可以觀察到的相同單倍型。因此,可以從這些具有相同單倍型的其他動物的基因型中讀取缺失的基因型。用于插補的軟件包括Beagle(Browning and Browning,2007),Fimpute(Sargolzaei等人,2014)和Alphaimpute(Hickey等人,2012)。

插補方法也可以與稀疏但便宜的SNP芯片結合使用。對關鍵祖先進行基因分型,用致密但昂貴的芯片鑒定群體中的單倍型。接下來,使用稀疏的廉價SNP芯片對大量后代進行基因分型。稀疏芯片具有足夠的SNP以識別動物攜帶哪種單倍型。由于已經用高密度芯片鑒定出了單倍型,可以推斷缺失的基因型。

采用相同的策略來獲取許多動物的WGS數據:1,000個公?;蚪M項目收集了不同品種的一組測序公牛,用于鑒定牛單倍型及其序列。接下來,用SNP芯片對許多動物進行基因分型,識別它們攜帶的牛單倍型,并估算其WGS數據。另一個選擇是在低覆蓋范圍內對后代進行排序。在這種情況下,低覆蓋率序列應足以識別單體型。1,000個公?;蚪M計劃證明,對于具有較高次要等位基因頻率的SNP(和其他變體),序列基因型的準確估算是可能的。然而,對于次要等位基因頻率較低的SNP,估算的準確性較差。Druet等在模擬中證明,如果對大量祖先進行了測序,覆蓋率相對較低(四到六倍),則這些稀有SNP的估算基因型的準確性就會提高。van Binsbergen等。(2014年)清楚地證明,與直接將50K基因型插值到序列相比,先將50K基因型插值到800K,然后再進行測序,可以提高插補的準確性。

非基因型動物

在基因組選擇中,許多(可能大多數)動物沒有基因型,但我們需要在育種價值估算中包括它們的表型信息。至少,傳統(tǒng)選擇將使用此類信息。一種方法是通過多步驟GS:在步驟1中,為基因型動物計算假表型,其中動物i的假表型包括有關其非基因型家系的信息;在步驟2中,使用偽記錄和基因型進行基因組預測。第3步,將傳統(tǒng)的EBV和GEBV合并為一個總EBV(例如VanRaden,2008年)。這里可以用公牛子代的平均產奶量作為一個偽記錄的實例,公牛是基因型而不是表型,而他的女兒是表型而不是基因型。由于數據要分多個步驟處理,該方法并不是最佳選擇。但實際上,使用此方法已達到良好的GS精度。

在單步GBLUP(ssGBLUP)中,所有數據都在單個估算步驟中核算(請參見Legarra等,2014)。當從傳統(tǒng)的BLUP遷移到GBLUP時,我們用基因組關系替換整個系譜關系矩陣(見上文)。一個很好的想法是當能用基因組關系替換譜系時替換,不能時則保留譜系關系。然而,當基因分型顯示基于系譜的不同家系中的某些動物比預期的關聯(lián)性要高,那么這些家系中的其他未分型動物可能也比預期的關聯(lián)性更高??梢酝ㄟ^從基因型動物開始然后使用系譜來計算涉及這些基因型動物的非基因型后代的關系來獲得正確的關系矩陣,即沿著譜系向下并考慮該譜系祖先基于標記的關系。同樣的想法也可以用于系譜,即當祖先是非基因型時,盡管在這種情況下它不是最佳的想法(Meuwissen等人,2011)。在奶牛中,ssGBLUP產生的準確度比多步方法高出0-2%(Legarra等人,2014),但對于不太受父系支配的其他物種(即,在這些物種中子代平均數不能匯總家族信息),ssGBLUP和多步方法之間的精度差異可能更大。單步方法的一個缺點是:雖然文獻中已經提出了單步非線性估計的一些解決方案,但是目前它仍不適用于非線性估計(Liu等人,2014;Legarra和Ducrocq,2012)。

在大多數研究中,相對于純基因組模型,由單一步驟而增加的可靠性很?。↘oivula等人,2012年)。單步模型的一個更重要的特征是它可以對年輕基因型公牛進行預選,使得GEBV較為準確(Vitezica等,2011)。直到最近,必須直接反轉G矩陣的要求限制了ssBLUP可以應用到的數據集的大小。先祖,成熟,公牛算法(APY)使用遞歸直接構建G -1矩陣的較大組成部分,克服了這一限制,并將ssBLUP的應用擴展到了數百萬的基因型動物(Fragomeni等人,2015年),但以G -1的一些近似值為代價。對于未來,顯然需要一種在序列級數據上使用非線性統(tǒng)計方法的單步方法。

畜牧業(yè)中基因組選擇的實施

奶牛的基因組選擇

奶牛的基因組預測準確性在生產性狀上超過0.8,在生育力,壽命,體細胞計數和其他性狀上超過0.7(例如Wiggans等,2011;Lund等,2011)。這些高準確性反映了每個品種的大量參考種群,這些種群已經被組裝以能夠進行基因組預測,以及,參考種群中的許多個體都是經過后代測試的公牛,其子代表現高度準確的表型。此外,GEBV通常用于預測參考種群中動物的近親。奶?;蚪M預測的一個特點是,各國之間進行合作以組裝這些大型參考集,并建立了三個財團(歐洲財團,包括荷蘭,德國,法國,北歐國家,西班牙和波蘭;北美財團,包括美國,加拿大,意大利和英國;以及“世界其他國家”財團,由許多其他國家組成)。

基因組預測的高精度和通過低密度基因分型后進行插補獲得基因組預測的相對較低成本的方法已導致對大量選擇候選者進行基因分型。為了基因組預測,目前在全球范圍內已對約200萬頭奶牛進行了基因分型。僅在美國,就已經對934780只荷斯坦牛,120439只澤西牛,19,588瑞士褐牛和4767只Aryshire牛進行了基因分型。其他國家對相似數量的動物進行了基因分型,其中僅法國就有360,000種(Boichard,個人交流)。

在奶牛中進行基因組選擇提高了遺傳增益,已通過許多國家的遺傳趨勢分析得到證明。例如,在加拿大從引入基因組選擇以來遺傳獲得率大約增加了一倍。但一些人認為,基因組選擇增加了每年的近交率(Schenkel,2012)。因此,在限制近交率的同時,最大限度地提高基因組選擇的遺傳增益將成為未來研究的重要課題。

有趣的是,許多國家中大多數基因型動物現在都是小母牛。雖然對小公牛犢進行基因分型可帶來最大的遺傳收益,但現在進行基因分型已經足夠便宜,以至于為了選擇保留在牛群中的小母牛而對小牛犢進行基因分型是有利的(Pryce and Hayes 2012 ; Weigel等,2012)。當選擇與公牛配對的公牛時,也可以使用小母牛的基因型,這樣可以最大程度地減少小牛的近親繁殖。

當選定的小母牛進入牛群并具有牛群記錄數據時,它們可以在參考種群中用于基因組預測(Wiggans等,2011)。當目的是增加參考種群的大小以提高基因組預測的準確性時,對具有良好表型記錄的成熟母牛進行基因分型是有必要的。有報道說,將10,000和5,000頭母牛添加到用于評估Holstein和Jersey牛的參考集上,根據性狀的不同,其準確性提高了5–8%。與上述某些種群相比,這一相對較大的增長可能反映了較小的公牛參考集(分別為Holsteins和Jersey的4,000和1,000)。

肉牛的基因組選擇

現在在一些牛肉品種中,基因組選擇已得到大規(guī)模應用。例如,在美國現在已經對超過52,000只安格斯牛進行了基因分型以進行GEBV評估(Loureco 等,2015)。但是,一般來說肉牛的基因組預測準確性低于奶牛。例如,Van Eenennaam等在他們的評論中。(2014年)報告的準確度范圍為0.3到0.7。較低的準確性是因為奶牛的參考種群質量較高。在肉牛中,參考種群一個品種中的個體較少且這些個體尚未經過后代測試。另外,與奶牛相比,肉牛的目標種群和驗證動物與參考種群的聯(lián)系可能不太緊密。

為了補償一個品種中少量的參考動物,使用多品種參考種群是常見的方法。Bolormaa等人發(fā)現,使用種方法準確性略有提高(從0.33到0.38),但幅度不及來自相同品種的相同數量的動物。當Akanno等人使用美國幾個純種的參考種群來預測加拿大的雜種種群,其準確性較低。如果目標種群不包括在參考種群中,則準確性非常低。

這些跨品種預測的失望結果使人并不意外。De Roos等人。(2009年)發(fā)現除了在短的基因組距離(如,<10kb),LD的階段不會在所有品種中持續(xù)存在。因此,當使用50k SNP面板時,來自其他品種的信息不會提高準確性。即使使用高密度SNP,來自另一個品種的信息遠沒有來自目標品種的信息有用,因為不同品種的動物比相同品種的動物共享更小的染色體片段。當使用BLUP預測育種值時,假定染色體區(qū)段的方差與其長度(或SNP的數量)成正比,小區(qū)段的方差較低,估計的準確性不如大區(qū)段。通過使用貝葉斯方法可以稍微改善這種情況,該方法允許某些SNP(以及某些段)的影響大于其他SNP。使得在預測種可以更好地利用具有QTL的高LD中的SNP,并且該信息可能會在各個品種之間轉換(Bolormaa等,2013b; Khansefid等,2014)。

在參考種群中組合品種的價值在一定程度上取決于多個品種中QTL的分離。Bolormaa等。(2014年)報道了QTL在多個品種的相似位置,這表明QTL確實存在于多個Bos taurus品種中。但是,Bolormaa等人得出結論,QTL很少在B. taurus和B. indi-cus內分離,并且存在已知的例外,例如PLAG1和CAST。

基因組選擇沒有像奶牛育種那樣廣泛地用于牛肉中。部分原因是因為精度較低,而且還因為經濟優(yōu)勢不那么好?;蚪M選擇最適合傳統(tǒng)上難以選擇的性狀。它在牛肉中的優(yōu)勢不如奶牛,因為這些性狀不需要對子代進行后代測試,這些諸如生長率之類的性狀可以在年輕候選者身上進行測量。但是,很難選擇肉牛的幾個重要特性,例如飼料轉化效率和牛肉質量。記錄這些特征很昂貴,因此建立大量的訓練種群是昂貴的,并且沒有大型公司可以為自己的育種計劃證明這筆費用是合理的。對于這些特征,基于高密度SNP或基因組序列數據的多品種訓練種群和非線性分析可能是最好的方法。

盡管存在這些困難,但在肉牛中已經進行了基因組選擇。例如,澳大利亞和美國的安格斯EBV使用DNA信息進行計算。有兩種方法可以完成此操作。一種,可以將基因型提供給計算EBV的組織,然后由該組織計算預測方程。另一種,諸如Zoetis或GeneSeek之類的商業(yè)組織可以提供DNA測試服務,并使用其自己的預測方程式生成“標記育種值”,然后將其傳輸到遺傳評估服務中以并入EBV。兩種方法都在運行。

豬育種中的基因組選擇

在生豬育種中,最重要的選擇步驟是在核心群中選擇優(yōu)良公豬(如果是合作養(yǎng)豬的話,這可能是在公豬試驗站進行的。)公豬試驗記錄通常是在選擇精英公豬之前進行的,因此,由于世代間隔的減少是有限的,額外收益有限,但通過引入GS,世代間隔仍可能減少約25%(Bjarne Nielsen,2015)。因此,gs在豬育種中的應用主要是針對屠宰品質、母豬不能記錄的性狀和純種動物不能記錄的雜交性能等主要針對性狀

在母豬性狀方面,試驗公豬的雌性同胞是在核心群中飼養(yǎng)的,但母豬性狀記錄是在公豬選種后獲得,母豬性狀的GS可以基于測試野豬的阿姨。對于母性性狀的選擇,可以達到約50%的公豬選擇準確率(Lillehammer等人,2011年)。母豬性狀的選擇與生長速度、飼料轉化效率等生產性狀的選擇競爭,導致母豬性狀遺傳增益大幅度增加,同時生產性狀的增益略有降低總功績收益率適度提高,但收益率的方向與育種目標指示的方向更為接近。母本性狀的顯著提高,從而導致更平衡和可持續(xù)的選擇。

就屠宰性狀而言,在選擇試驗豬之前,試驗豬的同胞可被屠宰并記錄這些性狀。因此,gs可以基于非常接近選擇候選者的參考總體,從而可以實現高的選擇精度。此外,在這里,額外的收益將在一定程度上以犧牲傳統(tǒng)生產性狀的收益為代價,但遺傳變化的方向將更接近育種目標,因此可以在未來更長的時間內持續(xù)下去。

豬肉是由雜交豬生產的,但是精英育種核心個體是在有利的環(huán)境(例如核心群)中進行純種繁殖的。在非常好的環(huán)境中進行純種生產與在不太有利的環(huán)境中進行雜交表現之間的關系在0.4到0.7之間變化(Esfandyari等人,2015)。這意味著,只有40-70%的核心內實現的遺傳改良將在實踐中提高性能,例如,如果核心豬由于遺傳改良而生長速度加快100克/天,那么商業(yè)豬每天只增加40-70克。通過對雜交豬進行基因分型并記錄其在商業(yè)環(huán)境中的表現,gs可用于改善純種核心動物在商業(yè)環(huán)境下的雜交表現。這需要跨品種和雜交的基因組選擇,這一點尚未得到證實。

因此,需要開發(fā)最佳的跨品種/純種基因組選擇方法。目前,養(yǎng)豬公司正致力于在實際條件下,通過這種方法直接提高雜交豬的遺傳性能。同樣的方法可用于選擇與出口市場相關但未在國內市場記錄的性狀(例如,對某些疾病的抗性)該方法將需要一個基礎設施,收集(跨國家)實用動物的性能數據和基因型,轉移到育種價值評估中心,并用于核心選擇。

家禽基因組選擇

在蛋雞中,實際上已經進行了一項試驗,以測試基因組選擇是否可以比傳統(tǒng)選擇更快地獲得收益。在Wolc等。(2015年),將一個蛋雞群體分成兩個亞系,一個提交常規(guī)表型選擇,另一個根據基因組預測進行選擇。實驗歷時3年,共進行了4個基因組選擇周期和2個表型選擇周期。在為期3年的試驗結束時,對這兩個亞系的多個與商品蛋生產相關的性能性狀進行了比較。在用于選擇的索引中包含的16個性狀中,基因組選擇系的表現優(yōu)于表型選擇系。盡管這兩個計劃旨在實現相同的近交率每年,沃爾克等(2015)發(fā)現從系譜評估的每年實現的近交在基因組選擇系中比在常規(guī)選擇系中高。

在肉雞或肉禽中,gs的情況不如在蛋雞中明顯,因為大多數性狀都可以在幼年時記錄在兩性身上。不過,育種公司正在積極調查GS的使用情況可能的用途是選擇在商業(yè)環(huán)境中提高雜交后代的表現,以及用于不能記錄在細胞核中的性狀,如疾病挑戰(zhàn)試驗。

未來發(fā)展方向

DNA檢測的成本在許多情況下阻礙了其使用。如果這種成本繼續(xù)下降,DNA檢測的用途將會擴大。這將有助于產生更大和最新的參考種群。難以記錄的性狀可能使得單步評估方法成為常態(tài)。因為它們提供了更準確的EBV,并且因為更便宜的DNA測試將導致被測試動物比例更高。

將來可以使用兩種方法來計算基因組EBV。評估在品種內(在GS內; wbGS內)。在這種情況下,中密度或低密度SNP就足夠了,可以使用G或SNP-BLUP來計算預測方程?;蛘撸柧毞N群可能包括多個品種,甚至可能是雜交種(abGS)。在這種情況下,如果使用密集的SNP并使用非線性方法來計算預測方程,則EBV會更加準確。對于wbGS,除了獲得更大的參考人群外,似乎幾乎沒有機會改善預測。對于abGS,有許多改進的途徑?;蚪M序列數據可比高密度SNP產生的EBV更準確,因為數據中包含因果變異,我們不必依賴LD。關于基因組每個位點突變影響的生物學知識的增加,可被用于發(fā)現這些因果變體。

如果wbGS產生足夠準確的EBV(例如> 0.9),則無需探索abGS。但是,將來,GS將用于越來越多的性狀,其中一些將很難大規(guī)模記錄(例如,甲烷排放),并且這減少了wbGS的大量內部參考種群的機會。因此,從長遠來看,我們相信abGS可以為整個育種目標帶來更準確的EBV,對于隨時間和空間變化的種群來說是更穩(wěn)定的。如果GS的未來僅限于wbGS,則品種和品系中的數量將減少,因為只有最大的品系才會有足夠大的訓練種群來產生準確的EBV。

基因組選擇提供了兩個機會,迄今尚未充分利用。首先,GS與生殖技術相結合可以大大縮短世代長度,并結合多次排卵和胚胎移植(MOET),GS可以用來挑選最佳胚胎來生產下一代動物(而不是隨機胚胎)第二,我們可以創(chuàng)造商業(yè)動物的預測方程,而不是針對商業(yè)相關性狀進行測量的種畜。例如,商業(yè)動物通常是雜交的,在比純種種畜更嚴酷的環(huán)境下飼養(yǎng)。此外,我們還可以收集未在種畜水平上測量的性狀信息,如肉質和抗病性(例如,如果傳染病的爆發(fā)是罕見的事件)。這意味著由于較少的表型和系譜記錄以及生成參考數據集的成本增加,在種畜水平上的成本降低隨著基因分型和實際性狀記錄的成本不斷下降(例如,在自動擠奶系統(tǒng)中使用傳感器),這一變化也可能是意料之中的為這一變化提供資金的商業(yè)機制尚不明顯。

動物育種中的GS范式轉變似乎最終會導致基因改良產業(yè)的結構變化,但現在提出這些變化可能是什么還為時過早,還有一種可能性是,養(yǎng)牛、羊和豬的企業(yè)數量將減少,正如家禽中已經發(fā)生的那樣。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容