Trends in Plant Science | 國際玉米小麥改良中心揭示傳統(tǒng)機器學習與深度學習在基因組預測中的應用

2025年7月,國際玉米小麥改良中心的José Crossa等人在Trends in Plant Science上發(fā)表了題為Expanding genomic prediction in plant breeding: harnessing big data, machine learning, and advanced software的文章。該文章回顧了傳統(tǒng)機器學習與深度學習在基因組預測中的應用,揭示了復雜性狀預測中線性與非線性模型的性能差異與適用范圍,為植物育種提供了高效、精準的基因組選擇方法論。

傳統(tǒng)機器學習方法顯著提升了基因組選擇的預測效率,尤其擅長處理大數(shù)據(jù)和復雜性狀。在線性混合模型中,rrBLUP/GBLUP模型因其穩(wěn)定性成為多基因遺傳性狀預測的首選基礎模型;而LASSO模型則在遺傳力較低、相關(guān)位點較少的性狀中展現(xiàn)出顯著優(yōu)勢。

圖1. 不同預測模型中性狀表現(xiàn)的相關(guān)性分析

在預測非高斯性狀時,專業(yè)模型能比傳統(tǒng)數(shù)據(jù)轉(zhuǎn)換方法更精準地適配性狀的分布特性,從而提升預測準確性。例如,TGBLUP在病害抗性等序數(shù)性狀中表現(xiàn)出色;而針對計數(shù)型性狀,零膨脹泊松隨機森林和負二項回歸模型則展現(xiàn)出相較于傳統(tǒng)模型的性能優(yōu)勢。

圖2.基于歸一化均方根誤差的多模型預測性能比較

深度學習模型在整合多組學、G×E互作等復雜數(shù)據(jù)時展現(xiàn)出強大潛力,能有效捕捉非線性關(guān)系,但其應用受限于數(shù)據(jù)量、計算資源與模型可解釋性。在具體應用中,多模態(tài)深度學習在部分年份的預測準確性可超越GBLUP,但表現(xiàn)并不穩(wěn)定;而DNNGP憑借其多層分級結(jié)構(gòu),在大數(shù)據(jù)集上的預測精度則穩(wěn)定優(yōu)于GBLUP、LightGBM等主流模型。

圖3.多模態(tài)深度學習模型結(jié)構(gòu)示意圖

近年來開發(fā)的多種開源軟件和數(shù)據(jù)管理工具極大推動了基因組預測技術(shù)的普及與應用。專用R包(如IPLGP、MPS)通過整合多性狀選擇策略,為親本篩選和雜交組合優(yōu)化提供高效決策支持,顯著提升育種效率。EnvRtype軟件包通過集成21種關(guān)鍵環(huán)境因子數(shù)據(jù),在降低實驗成本的同時提高了基因組預測精度,為精準育種提供了可靠的技術(shù)保障。(注:由智農(nóng)云芯開發(fā)的GSBrain P系列產(chǎn)品涵蓋GBLUP、Bayes、各類深度學習網(wǎng)絡架構(gòu),還支持用戶可視化零代碼構(gòu)建任意架構(gòu)的深度學習模型進行基因組預測或選擇)

該文章系統(tǒng)梳理了基因組預測在植物育種中的關(guān)鍵技術(shù)及應用,重點闡釋了傳統(tǒng)機器學習與深度學習方法對提升遺傳增益的核心價值。未來需加強跨學科協(xié)作,突破大數(shù)據(jù)管理與模型可解釋性瓶頸,推動精準育種的規(guī)模化應用。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容