植物全基因組選擇(GS)研究進(jìn)展

徐揚(yáng)老師綜述得很到位,讀完此文基本能對目前植物GS有個大概的了解。


Schematic-drawing-of-a-generalised-genomic-selection-strategy-showing-the-training.png

全基因組選擇(GS)是根據(jù)訓(xùn)練群體全基因組上的分子標(biāo)記基因型和表型之間的關(guān)聯(lián)構(gòu)建統(tǒng)計(jì)模型, 進(jìn)而對表型未知的育種群體做出合理的預(yù)測和選擇(Meuwissen等2001)。

與分子標(biāo)記輔助選擇育種技術(shù)相比, GS育種技術(shù)無需鑒定與目標(biāo)性狀顯著相關(guān)的位點(diǎn), 即使單個位點(diǎn)的效應(yīng)很小, 導(dǎo)致表型變異的全部遺傳效應(yīng)也都能夠被高密度的遺傳標(biāo)記捕獲, 并且能夠在得到個體基因型時即對其育種值進(jìn)行評估, 可大大縮短育種周期, 提高育種效率, 實(shí)現(xiàn)從經(jīng)驗(yàn)育種到基因組精準(zhǔn)育種的飛躍, 已成為動植物育種的一項(xiàng)革命性技術(shù)(Hickey等2017)。GS在動物育種, 尤其是奶牛育種中取得了巨大成功, 自2009年開始奶牛的選育已由基因組選擇主導(dǎo)。

近年來隨著高通量測序技術(shù)的發(fā)展和測序成本的下降, 在植物育種中利用GS技術(shù)已成為可能, 特別是植物的雜種育種中, 雜交種的基因型可以由親本基因型進(jìn)行推斷, GS的優(yōu)勢更加突出。國內(nèi)外已開展了多種植物的全基因組選擇方法與應(yīng)用研究。

科迪華和拜耳等跨國企業(yè)在育種流程中應(yīng)用全基因組選擇技術(shù)提高玉米選育效率, 并配套研發(fā)了高通量和無損傷的單粒種子基因型鑒定技術(shù)設(shè)備。

CIMMYT已在全球玉米育種計(jì)劃中實(shí)施全基因組選擇技術(shù), José Crossa團(tuán)隊(duì)設(shè)計(jì)了一種多親本群體的快速輪回基因組選擇, 既能保持遺傳多樣性, 又能在短時間內(nèi)獲得高遺傳增益(Zhang等2017b)。

Fu等(2022)提出了在育種實(shí)踐中整合全基因組選擇育種技術(shù)與雙單倍體育種技術(shù)的方法。

Cui等(2020)提出了利用已知表型的雜交種作為訓(xùn)練群體跨群預(yù)測未知雜交種表型的水稻育種策略。

1 全基因組預(yù)測準(zhǔn)確性的影響因素

在實(shí)際育種中, 全基因組選擇的成功與否很大程度依賴于基因組預(yù)測的準(zhǔn)確性。影響預(yù)測準(zhǔn)確性的因素有很多, 如群體大小、標(biāo)記密度、親緣關(guān)系、目標(biāo)性狀遺傳力以及標(biāo)記和QTL間連鎖不平衡(LD)程度等(Crossa等2017)。

一般而言, 隨著訓(xùn)練群體和標(biāo)記密度的增加, 基因組預(yù)測的準(zhǔn)確性隨之增加, 但達(dá)到一定程度后準(zhǔn)確性難以提高。通過統(tǒng)計(jì)方法篩選訓(xùn)練群體和分子標(biāo)記, 能夠提高預(yù)測的準(zhǔn)確性, 并降低成本(Guo等2019)。有研究表明訓(xùn)練群體占整個群體的2%~13%可以建立有效的GS模型。訓(xùn)練群體和測試群體的親緣關(guān)系對基因組預(yù)測的準(zhǔn)確性也有一定影響, 對于遺傳上相似的群體能夠獲得較高的預(yù)測準(zhǔn)確性, 反之亦然(Lorenz和Smith 2015)。

在玉米雙親雜交群體中, 與隨機(jī)增加其他材料相比, 在訓(xùn)練群體中增加來自雙親的半同胞家系材料, 預(yù)測的準(zhǔn)確性更高(Riedelsheimer等2013)。然而, 如果親緣關(guān)系利用過度, 遺傳變異將受到限制, 進(jìn)而影響遺傳增益。

此外, 標(biāo)記和QTL之間的LD程度也會影響基因組預(yù)測的準(zhǔn)確性, 隨著世代的增加, 標(biāo)記和QTL間的LD會逐漸降低, 在基因型測定后的前兩個世代基因組預(yù)測的準(zhǔn)確性下降較快, 其他世代下降速度則相對減慢, 隨著世代的增加, 遺傳力較高性狀的基因組預(yù)測準(zhǔn)確性降低較慢(Meuwissen等2001)。不同性狀的基因組預(yù)測準(zhǔn)確性大不相同, 這主要是由遺傳力不同導(dǎo)致的, 遺傳力和預(yù)測準(zhǔn)確性通常呈正相關(guān)(Wang等2018b)。

除上述遺傳因素外, 統(tǒng)計(jì)模型是影響基因組預(yù)測準(zhǔn)確性的重要因素。進(jìn)行基因組預(yù)測時面臨的是“大P, 小n”問題, 即標(biāo)記數(shù)目遠(yuǎn)大于樣本量, 這種情況容易導(dǎo)致多重共線性和過度參數(shù)化。

為了解決這些問題, 已發(fā)展出了很多基因組預(yù)測模型,包括基因組最佳線性無偏估計(jì)(GBLUP)、貝葉斯方法、支持向量機(jī)、再生核希爾伯特空間(RKHS)、隨機(jī)森林、深度學(xué)習(xí)等多種方法。其中GBLUP從整體上分析樣本間的遺傳關(guān)系, 將所有位點(diǎn)賦予相同的遺傳方差, 因此在實(shí)際數(shù)據(jù)的分析中有較強(qiáng)的穩(wěn)健性, 對微效多基因控制的數(shù)量性狀分析更具優(yōu)勢(VanRaden 2008)。

BayesA、BayesB和Bayesian LASSO等選擇壓縮算法則對大部分位點(diǎn)的效應(yīng)進(jìn)行壓縮, 因此擅長捕獲基因組上的顯著效應(yīng)(González-Recio和Forni 2011; Pérez和Campos 2014)。各種貝葉斯方法的主要區(qū)別在于它們選擇了不同的先驗(yàn)分布, 繼而產(chǎn)生不同的壓縮程度。模擬研究表明,選擇壓縮算法對QTL的數(shù)目較為敏感, 當(dāng)性狀由較少數(shù)目的QTL控制時, 預(yù)測準(zhǔn)確性較高; 當(dāng)影響數(shù)量性狀的QTL數(shù)目很多時, 預(yù)測準(zhǔn)確性會下降(Wang等2015)。

隨機(jī)森林和RKHS方法更擅于捕獲非加性效應(yīng), RKHS利用高斯核函數(shù)擬合模型, 模型可通過貝葉斯框架下的抽樣方法求解, 也可根據(jù)混合線性模型求解(De los Campos等2010)。

支持向量機(jī)是一種典型的非參數(shù)方法, 核函數(shù)的選擇是支持向量機(jī)的關(guān)鍵, 需要反映訓(xùn)練樣本的分布特性(Maenhout等2007)。

深度學(xué)習(xí)則是包含多個隱藏層的多層感知器, 能夠捕捉數(shù)據(jù)中蘊(yùn)含的復(fù)雜非線性關(guān)系, 近年來在作物多環(huán)境、多組學(xué)預(yù)測研究中獲得了一定成效(Montesinos-López等2021)。

2 提升全基因組預(yù)測準(zhǔn)確性的主要策略

全基因組選擇雖然為作物育種提供了新的前景, 但是對受環(huán)境影響較大的產(chǎn)量及其相關(guān)的數(shù)量性狀來說, 基因組預(yù)測的準(zhǔn)確性仍較低(徐揚(yáng)等2021)。研究人員已嘗試采取以下一些策略來提高對復(fù)雜性狀的預(yù)測力。

(1)將功能標(biāo)記納入GS模型。在GS模型中加入已知基因或SNPs的先驗(yàn)信息, 有可能揭示復(fù)雜性狀的遺傳結(jié)構(gòu)。在缺乏基因先驗(yàn)信息時, GWAS鑒定的顯著位點(diǎn)也可以被視為固定效應(yīng)協(xié)變量。GWAS和GS聯(lián)合策略很大程度上依賴于特定性狀的遺傳結(jié)構(gòu), 該策略更適合少數(shù)大效應(yīng)QTL控制的性狀(Bian和Holland 2017)。

(2)構(gòu)建基因型與環(huán)境互作GS模型。作物育種中經(jīng)常進(jìn)行多環(huán)境試驗(yàn), 整合基因型和環(huán)境互作(G×E)可以利用環(huán)境之間的相關(guān)信息。多項(xiàng)研究表明, 與單一環(huán)境下的模型相比, 將G×E效應(yīng)納入模型能夠有效提高預(yù)測能力(Crossa等2016; Cuevas等2017)。徐云碧團(tuán)隊(duì)提出了基因組環(huán)境組集成預(yù)測(iGEP)新策略, 并指出未來育種應(yīng)當(dāng)在基因型、表型和環(huán)境型信息支撐下, 準(zhǔn)確預(yù)測特定基因型在特定環(huán)境下的表現(xiàn)(Xu等2022b)。

(3)開展多性狀聯(lián)合預(yù)測。多性狀聯(lián)合分析既可利用性狀之間的遺傳相關(guān)信息, 又可利用環(huán)境相關(guān)信息, 尤其利于一些低遺傳力性狀的選擇。Cheng等(2018)提出了一種通用的多性狀BayesCπ和BayesB方法, 同時開發(fā)了一個開源軟件JWAS來實(shí)現(xiàn)多性狀GS的分析。計(jì)算復(fù)雜度是多性狀模型的主要限制, 通過整合HAT方法與BLUP模型, 建立雙變量GS (2D GS)模型, 可大幅提高計(jì)算效率(Wang等2021b)。此外, 選擇指數(shù)可利用性狀間的遺傳相關(guān)性構(gòu)建一個綜合指標(biāo)進(jìn)行多性狀的聯(lián)合選擇, Wang等(2019b)提出了一種基于選擇指數(shù)的GS方法, 該方法能夠利用與目標(biāo)性狀相關(guān)的多個輔助性狀及其蘊(yùn)含的目標(biāo)性狀遺傳信息, 構(gòu)建選擇指數(shù)以實(shí)現(xiàn)對目標(biāo)性狀的輔助預(yù)測。

(4)整合多組學(xué)信息。傳統(tǒng)的基因組預(yù)測無法捕獲基因的復(fù)雜互作及其下游調(diào)控, 隨著多組學(xué)技術(shù)的快速發(fā)展, 利用轉(zhuǎn)錄組、代謝組等組學(xué)信息開展預(yù)測已逐漸得到關(guān)注。Meyer等(2007)首次在擬南芥中用代謝物預(yù)測生物量, 預(yù)測值與真實(shí)值的相關(guān)系數(shù)達(dá)到0.58。Riedelsheimer等(2012)利用285份玉米自交系的基因組和代謝組數(shù)據(jù)及570份測交種的表型數(shù)據(jù), 預(yù)測了7個農(nóng)藝性狀的一般配合力,發(fā)現(xiàn)130個代謝物的預(yù)測效果不亞于使用5萬個SNP標(biāo)記。Westhues等(2017)開展了玉米雜交種表型的多組學(xué)預(yù)測研究, 發(fā)現(xiàn)基因組和轉(zhuǎn)錄組數(shù)據(jù)的聯(lián)合預(yù)測效果最佳。徐辰武團(tuán)隊(duì)建立了利用雙親的多組學(xué)數(shù)據(jù)對雜種表型進(jìn)行預(yù)測的多組學(xué)模型, 并首次提出了將親本表型信息納入水稻雜交種表型預(yù)測的新策略(Xu等2020d)。李慧慧團(tuán)隊(duì)提出利用植物多組學(xué)數(shù)據(jù)進(jìn)行全基因組預(yù)測的深度學(xué)習(xí)方法(Wang等2023b)。

3 全基因組選擇育種面臨的挑戰(zhàn)

盡管GS技術(shù)擁有巨大應(yīng)用前景, 我國的GS育種發(fā)展仍面臨著眾多挑戰(zhàn), 主要包括以下幾點(diǎn):

(1)基因分型成本是GS技術(shù)推廣和應(yīng)用的重大障礙,許多研究機(jī)構(gòu)和育種企業(yè)由于高昂的基因分型成本而無法大規(guī)模應(yīng)用;

(2)前沿基因組選擇育種模型原創(chuàng)性不足, 育種決策支持軟件和平臺開發(fā)與應(yīng)用不足;

(3)高效表型精準(zhǔn)鑒定技術(shù)尚不完善, 轉(zhuǎn)錄組、代謝組、環(huán)境組等多維數(shù)據(jù)尚未有效應(yīng)用于基因組選擇育種;

(4)種業(yè)資源較為分散, 缺乏足夠的歷史數(shù)據(jù)積累和規(guī)范化的管理, 從而使不同研究的數(shù)據(jù)和結(jié)果難以相互利用, 限制了基因組選擇效率的提高。

因此, 未來可以考慮開發(fā)全基因選擇育種專用芯片, 降低單個基因分型成本至百元內(nèi); 進(jìn)一步強(qiáng)化人工智能、大數(shù)據(jù)等信息技術(shù)的交叉集成, 創(chuàng)新發(fā)展適用于多組學(xué)、多環(huán)境等多維數(shù)據(jù)的全基因組選擇模型; 制定多維度數(shù)據(jù)采集、分析、存儲與管理的標(biāo)準(zhǔn)與規(guī)范, 協(xié)同建立通用的育種大數(shù)據(jù)平臺, 實(shí)現(xiàn)育種信息的充分共享與利用。全基因組選擇育種技術(shù)的優(yōu)化升級將為作物育種的精準(zhǔn)化、高效化和規(guī)模化發(fā)展提供不竭動力。

本文摘自:蔣金金,蘇漢東,洪登峰,楊光琴,閆磊,徐揚(yáng),張陽,張立新,韓方普,金雙俠,夏蘭琴,王幼平.植物生物技術(shù)研究進(jìn)展[J/OL].植物生理學(xué)報. 網(wǎng)絡(luò)首發(fā)2023-06-16。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容