2022《Cell》 作物馴化與育種中的整合基因組學

導讀

野生植物被成功地馴化為農(nóng)作物是人類文明的大事件。該過程的成功很大程度上要歸功于持續(xù)的人工選擇。本文總結(jié)了過去十年在作物馴化和育種研究中的新發(fā)現(xiàn)。作物基因組圖譜的構(gòu)建和眾多性狀控制基因的功能解析為科研提供了基礎信息。在許多植物的研究中都正在應用讀取、解讀和改造復雜遺傳信息的方法來高效地從頭設計物種或?qū)σ吧N進行重新馴化。了解作物微觀進化的潛在機制,將其應用于農(nóng)業(yè)生產(chǎn),或?qū)槲磥響獙Z食安全方面的挑戰(zhàn)提供行之有效的解決方案。

原名:The integrated genomics of crop domestication and breeding
譯名:作物馴化與育種中的整合基因組學
期刊:Cell
IF:66.85
發(fā)表時間:2022年5月
通訊作者:黃學輝,黃三文和李家洋
通訊作者單位:上海師范大學,中國農(nóng)科院深圳基因組所和中科院種子創(chuàng)新研究院
DOI號: 10.1016/j.cell.2022.04.036
研究進展

1 引言

自從大約一萬年前出現(xiàn)農(nóng)業(yè)文明以來,人類一直對農(nóng)產(chǎn)品有強烈的依賴。幾十種植物的成功馴化為作物是農(nóng)業(yè)文明的大事件,因為豐富的糧食資源是人類繁榮的重要基礎。最典型的例子是:三大主糧作物水稻、小麥和玉米,目前養(yǎng)活了數(shù)十億人。這些谷物分別獨立起源于東亞、中東和中美洲,然后傳播到世界各地,表明這些作物對人類社會具有廣泛的價值。

馴化的作物與其野生祖先存在遺傳差異。人類在尋求食物的生產(chǎn)活動中,有意識地馴化植物。植物與易于種植(如,直立的植物結(jié)構(gòu))、收獲效率(如,在成熟時減少落粒)和吸引人的味道等特征相關(guān)的等位基因變異被特異地進行選擇。在人類將這些馴化或半馴化的植物傳播到更廣泛的地理區(qū)域范圍的過程中,那些具有適合不同環(huán)境(如光照時間、溫度、水、土壤和微生物)的等位基因變異的植物種群在農(nóng)民的有意種植下規(guī)模逐漸擴大。過去的馴化事件是對有利的自然變異進行固定化,這在栽培物種形成中是一個緩慢的過程。例如,根據(jù)考古觀察,水稻、小麥和大麥中僅“減少落粒”這個表型的固定就經(jīng)歷了千年甚至數(shù)千年。相比之下,現(xiàn)代育種中的人工選擇更加高效,水稻和小麥中半矮化等位基因的固定化僅用了幾十年時間。植物遺傳學和育種者需要追蹤作物馴化和育種過程中的關(guān)鍵分子變化,以便指導作物的進一步改良或以更快捷的方式從頭馴化野生植物,因為遺傳育種遵循相同的原則——尋找或創(chuàng)制多樣化的等位基因,之后進行自然或人工選擇。

人類在確保充足的糧食供應方面,仍面臨多重挑戰(zhàn)。其中包括人口增長、耕地和清潔水的不足、氣候變化、環(huán)境污染以及不可預測的其他危機,如當前的COVID-19大流行。保障全球糧食安全需要不斷改進植物育種科技?;蚪M學技術(shù)的發(fā)展極大地促進了作物馴化分子基礎的研究。在過去的幾年里,基于解析和操縱植物基因組方面的科技的飛速進展,包括讀?。ǜ鞣N組學技術(shù))、解讀(大數(shù)據(jù)的深度學習)和編輯改造(CRISPR-Cas9)等,在作物馴化和育種領(lǐng)域促成了諸多新的概念和發(fā)現(xiàn)。新概念和新發(fā)現(xiàn)在作物設計中的應用,包括新等位基因甚至新基因的基因工程,將加快未來育種的速度。本文總結(jié)了基因組學、群體遺傳學、遺傳圖譜和功能基因組學在該領(lǐng)域取得的最新進展,并展望****未來****。

圖1 | 作物馴化和改良的遺傳方法。在解析基因組過程中,高通量技術(shù)的出現(xiàn)生成了大量組學數(shù)據(jù)。通過整合組學數(shù)據(jù)和各種遺傳分析方法,可以揭示潛在的機制,包括識別馴化和改良相關(guān)基因及其調(diào)控途徑。用于基因編輯的工具,如CRISPR-Cas9和合成生物學,將以高效的方式用于作物重新馴化和育種。

2 作物參考基因組測序

作物馴化和改良的遺傳研究在很大程度上非常依賴相關(guān)植物物種的高質(zhì)量參考基因組序列。在過去20年里,已經(jīng)有數(shù)百種植物完成了測序、參考基因組組裝,其中大部分已經(jīng)達到染色體水平。作物基因組的爆炸式發(fā)展很大程度上歸功于基因組分析中測序技術(shù)和相關(guān)算法的快速發(fā)展。目前,能夠測到較長的序列(通常>10kb)的第三代測序(TGS)在生成作物參考基因組方面幾乎完全取代NGS(短序列的大規(guī)模測序,讀長通常為150-800bp)。具體來說,PacBio高保真測序所使用的CCS(circular consensus sequencing)測序技術(shù)能夠讀取準確讀高達99.8%、平均長度為13.5kb的序列信息。此外,盡管納米孔(Nanopore)測序技術(shù)的堿基準確度較低(約90%)存在缺陷,但其讀取長度的優(yōu)勢(平均>20kb,最大長度超過2Mb)使該技術(shù)頗具吸引力。雖然簡單地使用Pacbio高保真測序或納米孔長片段測序即可實現(xiàn)高連續(xù)性的基因組組裝,但結(jié)合“合成長讀取技術(shù)”(例如,10xGenomics、Hi-C和Bionano光學圖譜分析系統(tǒng))可以減少組裝錯誤、能更好地將序列定位到motif、組裝到染色體上。除了測序技術(shù)的進步,研究人員還開發(fā)了許多算法和工具包,用于從頭組裝基因組,包括Canu、FALCON、Wtdbg2、NECAT和Hifiasm等,這些工具提高了序列組裝的準確性并使獲得的參考基因組的缺口更少。

最近,在應用這些工具的基礎上,許多作物的基因組組裝得到了更新升級。例如,玉米、小麥、馬鈴薯、棉花和花生。此外,最近,已經(jīng)有研究者著力構(gòu)建無缺口的端粒到端粒(T2T)參考基因組,這為被稱為“暗物質(zhì)”的染色體區(qū)域(例如,著絲粒和大型重復區(qū)域)的解析提供了新的見解。例如song等人組裝了兩個水稻品種的無缺口基因組,是作物(玉米)中組裝的第一個無缺口基因組;在玉米中,Liu等人組裝了兩個染色體水平的無缺口基因組,揭示了旋鈕狀重復(knob repeats)的內(nèi)部結(jié)構(gòu)。

同源多倍體作物基因組由于亞基因組的極高相似性,解析難度較高。為了解決重建同源多倍體基因組的問題,Zhang等人開發(fā)了一種基于Hi-C的支架算法(All-HiC),該算法能夠為多倍體基因組構(gòu)建等位基因的識別、染色體規(guī)模的組裝提供便利。該方法成功地應用于組裝復雜的基因組,如同源四倍體甘蔗和同源四倍體紫花苜蓿。此外,已經(jīng)設計了幾種遺傳方法用于構(gòu)建染色體單倍型,例如三重組合、配子組合和重組后代的分離群體的基因分型。值得注意的是,基因組同線性分析表明,在同源多倍體物種的同源染色體之間可以檢測到大量結(jié)構(gòu)變異(SV),如大片段倒位等。

在“白金級”的作物基因組解析后,研究者不僅可以發(fā)現(xiàn)功能基因,還可以發(fā)現(xiàn)基因組變異。值得注意的是,通過機器學習簡單地基于基因組序列即可預測到開放染色質(zhì)、組蛋白標記和轉(zhuǎn)錄豐度等許多組學特征,暗示基因組中仍有大量信息有待探索、解析。例如,在玉米中,Zhou等人構(gòu)建了一個模型,僅根據(jù)基因轉(zhuǎn)錄起始位點附近確定的基序即可預測基因在響應熱應激時的表達趨勢。對25個玉米組裝基因組中具有順式調(diào)節(jié)變異的基因的進一步分析表明,SV可能引起轉(zhuǎn)錄因子結(jié)合位點的存在或缺失,從而引起其應激反應發(fā)生改變。

3 從單一參考基因組到泛基因組

隨著測序和生物信息學的升級,作物群體基因組學正在從單一參考重測序方法轉(zhuǎn)變?yōu)榫€性泛基因組方法。最近又出現(xiàn)了圖形泛基因組新方法。對于單一參考基因組的重測序方法,變異的識別高度依賴于序列相似性,從而將NGS短片段定位到參考基因組上,故而難以避免來自高度多態(tài)性區(qū)域的遺傳變異的丟失。泛基因組是指存在于一個研究物種中的基因組序列的總和。早期的線性泛基因組由多個基因組組裝或參考基因組與未能比對上的序列數(shù)據(jù)的附加序列的合并、組裝組成。與線性泛基因組相比,基于圖的基因組可以在將來自目標物種的多個基因組的復雜信息整合到同一個圖中,并且可以用于后續(xù)的種群遺傳分析。

泛基因組減少了參考偏差并涵蓋了更多的變異信息,有利于下游遺傳分析。特別是,SV通常富集在復雜的基因組區(qū)域,因此可以使用基于組裝的變體調(diào)用策略以準確識別。相對而言,基于單一參考基因組、重測序獲得的結(jié)果因為未比對成功的短序列及其組裝通常準確度較低。

許多作物中均已構(gòu)建泛基因組(圖2A)?;?0個品種的染色體水平基因組組裝構(gòu)建的大麥泛基因組,極大地促進了大麥遺傳學研究和育種。泛基因組中發(fā)現(xiàn)了大量的Mb堿基的倒位,其中一些被發(fā)現(xiàn)與最近的突變育種和適應性相關(guān)。在番茄中,Gao等人利用構(gòu)建的泛基因組在風味相關(guān)基因TomloxC的啟動子中發(fā)現(xiàn)了一種罕見的調(diào)節(jié)因子變異。Alonge等人在不同的番茄品系中捕獲了238,490個SV,其中大量與基因劑量和表達水平的改變相關(guān)。在大豆研究中,構(gòu)建了基于圖的高質(zhì)量泛基因組,用作對整個大豆種群的SV進行基因分型的參考?;谶@些SV的全基因組關(guān)聯(lián)研究(GWAS)解析了一個10-kb的SV,它可能與種子是否具有光澤相關(guān)的基因相關(guān)。在玉米中,Hufford等人從頭組裝了26個不同系的基因組,用于嵌套關(guān)聯(lián)(NAM)作圖,提高了NAM中遺傳作圖的能力。在水稻中,Qin等人使用基于圖形的SNP和SV基因分型預估出17.5%的SV與相鄰SNP的連鎖程度較低,表明有很大比例的隱藏遺傳變異尚待探索。在番茄中也觀察到類似的現(xiàn)象,即SV與相鄰SNP的連鎖程度低。當將由番茄泛基因組圖譜中鑒定的SV納入考慮時,估計的遺傳力增加了24%。盡管泛基因組正在成為作物基因組學研究的新參考信息,但它們相關(guān)的基因組注釋情況(例如基因和轉(zhuǎn)座因子注釋)和基因組實用性(例如泛基因組瀏覽器和數(shù)據(jù)庫)仍有待開發(fā),以更好地支持作物遺傳研究和育種。

4 作物群體基因組學

除了側(cè)重于盡可能全面地解析基因組變異的泛基因組學,群體基因組學更關(guān)注解釋這些變異的進化因素。在植物馴化過程中,基因漂移和人工選擇等進化力量驅(qū)動了顯著的基因組變化。根據(jù)基因組特征(包括多樣性減少、頻譜的偏移、單倍型純合性擴展和顯著的等位基因頻率分化)已經(jīng)開發(fā)了用于檢測人工選擇的方法。該方法是基于從基因組區(qū)域的中性變異部分識別多態(tài)性模式特征發(fā)生的變化。同時,研究者也越來越多的注意到許多農(nóng)作物起源復雜,需要考古基因組學的更多證據(jù)。深入研究野生種群亞結(jié)構(gòu)的多樣性、不同野生亞種群對栽培群體的相對遺傳貢獻率、多樣性下降的時間等因素,有助于更好地解析馴化過程和人類選擇所針對的基因。

圖2 | 過去十年中作物群體基因組學的進展。A|顯示了每種作物在重新測序(主要通過短讀測序技術(shù))或泛基因組構(gòu)建方法測序(主要通過長讀測序)中的基因組覆蓋率。B|通過對栽培植物及其野生祖先的全基因組重測序檢測到的馴化Sweep區(qū)通常與遺傳作圖信號或克隆的馴化基因重疊(提供了作物中馴化基因的典型示例)。泛基因組有助于確定導致馴化變異的原因(以玉米tb1基因為示意圖),并追蹤群體的進化過程。整合多組學技術(shù)的方法將進一步促進相關(guān)分子調(diào)控網(wǎng)絡的研究。

深度學習也已應用于進化基因組學,并且已經(jīng)開發(fā)了一些方法用于檢測選擇特征。例如,開發(fā)了使用祖先重組圖(SIA)的選擇推理,來研究祖先重組圖的特征,并推斷有益變異的選擇系數(shù)和等位基因頻率變化過程。值得注意的是,這種基于深度學習的方法不僅可以檢測和量化硬清掃(一個有益等位基因迅速增加其在整群體中的頻率,其關(guān)聯(lián)位點的變異急劇減少),還可以檢測和量化軟清掃(多個有益等位基因同時被選擇并掃描群體)具有良好的表現(xiàn)。

當與“自上而下”實驗(例如數(shù)量性狀基因座定位作圖QTL)相結(jié)合時,這些“自下而上”的方法變得更加強大,能確定負責馴化相關(guān)性狀的基因,水稻、玉米、大豆和番茄等研究就是很好的例證。然而,值得注意的是,有許多基因座具有很強的人工選擇信號,但與任何已克隆的馴化基因或遺傳作圖信號無重疊。這些選擇信號可能是地理遺傳特征,也可能是在栽培實踐開始之前的很長一段時間內(nèi)由未知的選擇壓力驅(qū)動的。此外,許多可能與人類的無意識選擇有關(guān)的基因或功能元素仍有待探索。

群體遺傳學除了研究二倍體作物外,還研究了大量多倍體作物,因為30%的栽培作物都屬于多倍體。多倍體的遺傳后果包括遺傳多樣性和雜合程度的提高,以及對新環(huán)境的適應性、可塑性的提高。Salman-Minkov等于2016年注意到與野生近緣種相比,作物物種中多倍體比例過高,并提出了“馴化后多倍化”的概念作為一個合理的假設:作物多倍化的遺傳結(jié)果促進了它的成功馴化。與二倍體作物相比,在棉花、油菜和小麥等多種多倍體作物中,觀察到了一些新的遺傳模式,包括不對稱的亞基因組選擇等。對于無性繁殖的作物,如葡萄、木薯和馬鈴薯,盡管馴化已經(jīng)改變了重要的農(nóng)藝相關(guān)途徑,但在馴化過程中,遺傳漂變和育種系統(tǒng)的轉(zhuǎn)變導致了有害突變的積累。值得注意的是,在雜合狀態(tài)下,越來越多的有害等位基因被掩蓋,因此需要在未來的育種計劃中清除這些突變。

廣泛的作物群體比較基因組學的進展正在促使研究人員分析作物適應人類選擇的進化限制。盡管通常發(fā)現(xiàn)相似性狀受不同基因控制,但不同作物品種在馴化過程中仍存在許多趨同進化的案例。Oryza glaberrima(非洲栽培稻)和O. sativa(亞洲栽培稻)分別由非洲和亞洲古代農(nóng)民獨立馴化,它們具有一些類似的“馴化綜合癥”,例如減少落粒性和的植物結(jié)構(gòu)更直立化。Wang等人(2014年)和Wu等人(2017年)確定了亞洲栽培稻中已知的控制種子落粒性和植物結(jié)構(gòu)等馴化相關(guān)性狀的調(diào)控基因,這也是非洲水稻的人工選擇目標。此外,選擇還作用于亞洲和非洲水稻中的PROG1基因。葫蘆中的非苦味是人類偏好的,在不同的葫蘆品種培養(yǎng)中同步選擇了該性狀。Zhou等人(2016年)發(fā)現(xiàn)了一組調(diào)節(jié)苦味化合物(葫蘆素)生物合成的轉(zhuǎn)錄因子,并發(fā)現(xiàn)在不同的野生葫蘆品種馴化過程中,可能針對這些調(diào)節(jié)因子做出了趨同選擇。種子休眠的喪失也是跨多種作物的共同馴化性狀。在大豆中克隆了控制種子休眠的stay-green G基因,并在水稻中發(fā)現(xiàn)了其具有保守功能的同源基因??刂拼篼溍⒐饣鹊倪z傳基礎被確定為與水稻LABA1基因同源,這兩種基因都被人工選擇之下、消除芒倒刺形成。鑒于禾本科中的許多物種是被人類馴化以提供碳水化合物的,Zhou等(2020年)收集分析了水稻、玉米和大麥中鑒定的選擇相關(guān)的掃描區(qū)域的基因,發(fā)現(xiàn)它們與小麥同源的基因區(qū)域也富含馴化相關(guān)特征,這表明人類的選擇導致谷類作物具備趨同選擇的特征。

5 選擇相關(guān)的重要基因

在過去的二十年里,植物遺傳學和進化研究在識別人類選擇相關(guān)基因方面已經(jīng)做出了巨大的努力(圖2B)。在馴化和現(xiàn)代育種過程中被選擇的基因分別稱為馴化和改良基因。一般來說,相關(guān)性狀表現(xiàn)出連續(xù)的表型變異,并由多個數(shù)量性狀基因(QTG)控制,這些基因可以通過基于圖譜的克隆或GWAS來識別。此外,通過整合群體遺傳學和多組學數(shù)據(jù),可以通過探索研究有關(guān)這些基因的選擇過程和功能的更多細節(jié)。

馴化是人類對植物進行選擇的初始階段。一些影響較大的QTG在馴化過程中被強烈選擇并在作物基因組中固定下來。例如,種子落粒性、植物結(jié)構(gòu)和花序結(jié)構(gòu)是作物最重要的馴化目標。在幾種主要谷物中,已經(jīng)鑒定到控制這些性狀的QTGs,例如tb1、PROG1/RPAD、SHAT1-5和Brt等。除了這些QTGs,其他與種子相關(guān)性狀有關(guān)的QTGs(包括種子休眠、芒、種殼顏色、種皮顏色、裸粒和味道等)也是馴化的主要目標。在水果和蔬菜作物中,味道和風味是重要的馴化目標。例如,黃瓜中Bt基因的選擇產(chǎn)生了不苦的葫蘆科瓜果,而西瓜中ClAGA2的選擇產(chǎn)生了甜果肉。

在少數(shù)特定地區(qū)發(fā)生的馴化后,作物不斷得到改良并在全球范圍內(nèi)廣泛傳播。在擴散期間,在不同地區(qū)農(nóng)民繼續(xù)進行人工選擇,以使作物適應當?shù)丨h(huán)境。在光周期敏感作物中,光周期相關(guān)基因是主要選擇目標,幾乎所有主要的開花相關(guān)QTG都經(jīng)歷了適度程度的人工選擇。在水稻中,選擇了Ghd7、DTH8、Ghd7.1和Hd1,使得原始的短日照植物也能在高緯度地區(qū)長日照條件下開花。同樣在玉米中對ZCN8、ZmCCT和ZmCCT9進行選擇;在大豆中J、Tof11Tof12被選擇,促進了它們在熱帶或溫帶地區(qū)的傳播、分布。對光周期相關(guān)QTG的選擇促進了水稻、玉米和大豆的種植范圍擴展到全球。

在現(xiàn)代育種中,作物產(chǎn)量通常是最重要的目標之一。對fw2.2、lcn2.1、fw3.2和其他QTGs的選擇促使現(xiàn)代番茄果實的大小比櫻桃番茄增加了10倍以上。雜交育種已被廣泛用于許多作物,利用雜種優(yōu)勢提高產(chǎn)量。在雜交育種過程中涉及和選擇了許多雜種優(yōu)勢基因和雜交不育基因。數(shù)量遺傳學和群體遺傳學分析表明,在雜交水稻中集中選擇了幾個與開花時間和植株結(jié)構(gòu)相關(guān)的基因,促成了產(chǎn)量雜種優(yōu)勢。特別是,基于開花時間的SFT和基于植物結(jié)構(gòu)的IPA1可能分別是番茄和水稻中重要的雜種優(yōu)勢相關(guān)基因。鑒定水稻中的S5和qHMS7等雜種不育基因有助于打破生殖障礙,并有助于利用遠緣雜交獲得雜種優(yōu)勢。

總體而言,QTGs的馴化和改良為雜交育種提供了有價值的信息,也促進人們對作物微進化的一般機制的理解,以及對未來育種的實質(zhì)性目標的理解。QTG相關(guān)信息和潛在的分子機制也為新作物的從頭馴化鋪平了道路。

6 連鎖拖累和上位性

在作物育種中,種質(zhì)資源的收集經(jīng)常被用作寶貴的資源,但連鎖累贅是一個常見的障礙。連鎖累贅(也稱為遺傳累贅)是指與育種者試圖滲入的基因緊密相連的不良基因?;谒緮?shù)量性狀圖譜,在約25%的水稻基因組中都檢測到潛在的連鎖累贅。水稻有兩種主要的連鎖累贅:一種是與稀有而有價值的基因緊密連鎖的劣等基因,另一種是在兩個亞種中出現(xiàn)高度分化的相鄰基因。在番茄抗病育種中,使用了許多野生等位基因,如 Mi-1、Ty-1Sw-5,大量外來片段隨著這些野生基因滲入到這些抗病品種中。野生等位基因的連鎖累贅是固定的,難以打破,可能是染色體倒位造成的。水稻和番茄的研究結(jié)果表明連鎖累贅可能是野生種質(zhì)資源利用中的一個常見障礙,因為野生植物基因組可能包含許多與未馴化基因相關(guān)的所需抗性基因。因此,需要特意打破這種聯(lián)系:滲入理想的基因,避免緊密連鎖的不良基因。為了實現(xiàn)這一目標,連鎖累贅的基因組格局、高密度基因分型的使用以及智能育種系統(tǒng)的開發(fā)都需要在育種群體中追蹤重組事件,以排除高度連鎖和劣等基因,如基于不同二倍體馬鈴薯基因組組裝的大型倒位圖的構(gòu)建,為排除潛在的連鎖拖拽提供了重要參考信息。特別是,CRISPR-Cas9技術(shù)可用于重組植物染色體,包括介導目標區(qū)域的大規(guī)模倒位或誘導異源染色體間染色體易位等,都有可能打破或修復植物育種中的遺傳連鎖。

過去馴化導致的一些作物存在一種特殊類型的連鎖累贅,位于Sweep區(qū)?;诒硇偷鸟Z化在基因組空間分析方面存在一些缺陷。馴化選擇了優(yōu)選的等位基因時,不可避免地會選擇一些額外的、與目標等位基因高度連鎖的基因組片段,這個過程被稱為“搭便車”。在西紅柿中,Sweep區(qū)可達111Mb,占基因組的14.2%,有時會導致意想不到的結(jié)果。例如,fw11.3的基于果實質(zhì)量的選擇導致數(shù)十種代謝物發(fā)生變化,這在很大程度上是由sweep區(qū)域內(nèi)的連鎖基因引起的。這些sweep顯著縮小了進一步改進的空間。如今,基于基因的選擇和基因組編輯可以提供新的策略來釋放這些在馴化中產(chǎn)生的基因組空間。

除了連鎖累贅外,上位性也存在類似的情況。將兩個靶基因放在一起對表型的影響效果并不總是像做加法那樣簡單。在番茄研究中,由于兩個轉(zhuǎn)錄因子之間的遺傳相互作用,將兩個獨立選擇中表現(xiàn)有益的基因疊加在一起,會導致分枝和不育等不良表型,這表明育種中還需要繞過負上位性基因。不幸的是,在大多數(shù)作物中,目前關(guān)于上位性相互作用的信息非常有限。更多全面檢測和定量評估作物基因組中這些上位性相互作用的遺傳學研究對于指導作物育種將是大有裨益的。

7 創(chuàng)制新等位基因

過去的馴化依賴于人類長期艱苦的選擇、適合作物種植中自然發(fā)生的突變?,F(xiàn)在基因組學技術(shù)的進步和重要作物基因的發(fā)現(xiàn)加速了育種選擇并促進研究者設計理想的作物。基因組編輯,主要使用CRISPR-Cas9技術(shù)這個強大的工具,有效地為作物育種目標操縱各種等位基因,包括劣質(zhì)基因的敲除和調(diào)控基因的微調(diào)。在感興趣基因的編碼區(qū)內(nèi)進行移碼插入缺失突變,是基因組編輯中最常見的操作。這種敲除突變體可能會出現(xiàn)極端的表型變化,這在基因功能驗證中很有價值。但是,對于遺傳改良,重要基因的功能喪失等位基因常常不能產(chǎn)生理想的表型。許多馴化突變屬于“弱等位基因”或“數(shù)量等位基因”類型。例如,幾乎所有栽培稻種都含有sh4這種減少種子落粒性的缺陷的等位基因——馴化過程中,第一個外顯子中發(fā)生G到T突變并被固定下來,sh4的基因功能在栽培水稻中并未完全喪失,而sh4的移碼突變體則完全消除了落粒性相關(guān)的發(fā)育,導致產(chǎn)生完全不落粒表型。

在蛋白質(zhì)編碼區(qū)進行堿基編輯是一種創(chuàng)建新等位基因的方法。例如,編碼顆粒結(jié)合淀粉合酶I的Waxy(Wx)是影響谷物食用和烹飪質(zhì)量的主要水稻基因。通過對編碼區(qū)進行精確的堿基編輯、產(chǎn)生多個新Wx等位基因,達到了微調(diào)稻谷中的直鏈淀粉含量的目的。類似的方法已應用于OsACC1和OsALS1的人工進化,以提高植物對除草劑的抗性。在CRISPR-Cas9基因編輯中使用多個目標引物、在啟動子區(qū)域內(nèi)進行刪除編輯(Indel),是另一種生成多種等位基因的方法,可以通過編輯順式元件來改變基因表達水平或模式。這種方法首先在西紅柿中進行了嘗試,產(chǎn)生了許多啟動子變體,用于果實大小、花序分枝和植物結(jié)構(gòu)的遺傳改良。后續(xù)在其他作物上的成功應用表明它是促進農(nóng)藝性狀改良的有效方法。

基因組編輯也能夠產(chǎn)生大的缺失。在小麥中,TaMLO1基因敲除品系表現(xiàn)出對白粉病的廣譜抗性,但存在生長缺陷。而一個304-kb的缺失則可導致TaTMT3B激活、保持植物生長和產(chǎn)量,同時賦予強大的抗性。因此,同時編輯TaMLO1基因和所需的大缺失可以在沒有影響生長的情況下實現(xiàn)抗病性。這些發(fā)現(xiàn)強調(diào)了基因組編輯是植物育種中實現(xiàn)快速創(chuàng)新的有力策略。

8 從頭馴化和基因組設計

栽培作物是從生長在人類文明起源附近的野生植物中馴化而來的,而在未來,有可能使用現(xiàn)代工具對更多的野生物種進行馴化。由于許多馴化基因的鑒定和新工具的開發(fā),基因組規(guī)模的從頭馴化在技術(shù)上變得可行。以基因組工程為目標,通過同時操縱多個基因、從頭馴化野生植物或重新馴化現(xiàn)有作物的野生祖先,正在使用基因組編輯、基因組設計或合成生物學等方法實施(圖3)。CRISPR-Cas9技術(shù)在從頭馴化中非常強大。近年來,基于圖位克隆和GWAS,馴化相關(guān)基因的知識得到了極大的擴展。此外,如上所述,已經(jīng)確定了幾個重要的基因、揭示了作物馴化中的趨同進化模式。因此,隨著發(fā)現(xiàn)不同植物中的同源基因通常控制相同的性狀,編輯關(guān)鍵節(jié)點中的基因可能會在重新馴化中發(fā)揮很好的作用。事實上,通過在野生植物中進行基因組篩選、編輯多個馴化基因的同源基因,已經(jīng)證明了這種策略的有效性(圖3A)。例如孤生作物、地櫻桃和野生番茄等,因為它們在抗病性和耐鹽性方面的優(yōu)勢而被選中用于人工馴化。

圖3 | 通過同時操縱多個基因進行作物再馴化和育種的基因組工程方法。A|對馴化基因進行基因組編輯,以快速馴化四倍體野生稻、野生番茄圖中顯示了基因組編輯中使用的基因。B|基因組設計策略用于創(chuàng)制二倍體馬鈴薯F1雜種。圓圈內(nèi)的標簽“3”和無圓圈的“3”分別表示自交和雜交。SI和DM分別是自交不親和和有害突變的縮寫。C|作為對未來的展望,C4植物玉米光合作用的模塊通過合成生物學途徑提高大豆的產(chǎn)量。

一個單子葉植物的例子是四倍體野生稻,它被設計用于創(chuàng)造新的谷類作物,以獲得更大的生物量、對氣候變化適應性更強。異源四倍體野生稻(Oryza alta)是一種來自南美洲的野生稻種,含有許多可用于農(nóng)業(yè)的表型。為便于野生植物的從頭馴化,已經(jīng)建立了高效的組織培養(yǎng)和轉(zhuǎn)化系統(tǒng)、組裝成了具有高質(zhì)量基因注釋的染色體級基因組。在栽培稻中,已鑒定出許多馴化或改良相關(guān)基因。從野生稻基因組中搜索了六種重要農(nóng)藝性狀基因的同源基因,并選擇基于CRISPR-Cas9的誘變。研究發(fā)現(xiàn)大多數(shù)用于基因組編輯的基因在栽培稻和野生稻之間相當保守,和預期一致,這些性狀在可以被迅速馴化。這些研究表明,野生植物可以被高效地成功轉(zhuǎn)化為類作物物種,這為利用野生近緣種和未馴化植物中的無數(shù)基因打開了大門,也為未來的植物育種計劃賦予了重要的特征。雜交馬鈴薯育種,將其從無性繁殖的四倍體作物改造成二倍體種子作物,將徹底改變馬鈴薯產(chǎn)業(yè)。自交不親和和近交衰退是阻礙雜交馬鈴薯育種的兩個主要障礙。自交不親和的障礙是通過鑒定馬鈴薯中的自交親和基因來解決的。由有害的隱性突變引起的近交衰退則是馬鈴薯育種的第二大障礙,是更大的挑戰(zhàn),但其中的遺傳基礎已被破譯。這些有害突變在馬鈴薯不同品系中具有品系特異性,表明具有不同遺傳背景的自交系之間的雜交將掩蓋大多數(shù)有害等位基因突變的不良影響。最近的一項研究中,通過基因組編輯產(chǎn)生了二倍體馬鈴薯的自交系,并使用基因組輔助選擇來識別和清除這些主效應有害突變(圖3B)。這種策略通過基因組設計,可以將馬鈴薯育種從緩慢的、非累積的模式轉(zhuǎn)變?yōu)榭焖俚哪J?,從而使應用F1代雜交種進行馬鈴薯育種成為可能。對水稻的研究方向則與馬鈴薯的策略完全相反——使雜交水稻變成為克隆繁殖的作物。水稻中同時針對幾個減數(shù)分裂和受精基因進行遺傳工程操作可以導致通過孤雌生殖途徑進行無性繁殖,這可能使水稻雜交系能夠產(chǎn)生具備雜種優(yōu)勢的種子。這種策略可以改進并擴展到其他作物,在后代中,繼續(xù)保持雜交F1代中的高產(chǎn)量特征。合成生物學的最新進展也為植物基因組設計新的生物學功能提供了強大的工具(圖3C)。例如,將新的光呼吸旁路引入水稻葉綠體,或在玉米中過表達Rubisco大小亞基及其組裝伴侶RUBISCO裝配因子(RAF1)作為完整結(jié)構(gòu),均極大地提高了作物的光合效率和糧食產(chǎn)量。這一策略也已應用于提高作物的營養(yǎng)質(zhì)量。例如,通過對類胡蘿卜素途徑進行復雜的工程改造,在番茄果實中產(chǎn)生了一種可再生的高價值色素“酮類胡蘿卜素”。在另一項研究中,設計了一種新的代謝途徑并將其添加到水稻基因組中,使用包含8個花青素相關(guān)基因的重組載體,最終,創(chuàng)制了具有花青素含量高并具有抗氧化活性的胚乳的水稻新種質(zhì)。合成生物學在作物害蟲防治方面也非常有效。在最近的一項工作中,通過利用煙草中的遺傳種群和多組學方法,從葉片中鑒定出一種對葉蟬害蟲具有抗性的揮發(fā)性化合物。解析這種化合物的生物合成途徑后,設計了合成生物學方法來重建番茄和蠶豆中的化學物質(zhì)以進行作物植保。此外,隨著對天然橡膠生物合成機制的了解,合成生物學可能會在改進或創(chuàng)造產(chǎn)橡膠植物方面發(fā)揮重要作用。這些展示了合成生物學在作物設計育種中創(chuàng)制特異模塊方面的潛在應用。

展望
廣泛收集不同遺傳資源對作物遺傳改良具有重要意義。遺傳學研究表明,馴化相關(guān)等位基因也存在于野生種群中,但頻率較低且分散在不同的種質(zhì)中。馴化和現(xiàn)代育種都是通過尋找有益等位基因、富集多個目標等位基因加速進化的過程。野生資源以及適應當?shù)丨h(huán)境的地方品種均具有豐富的遺傳多樣性,并且包含許多天然的、對作物栽培有益的等位基因。目前,世界各地的種質(zhì)資源庫(通常稱為基因庫)中保存著數(shù)百萬種植物種質(zhì)。正如大麥研究中證明的,基因庫基因組學勾勒出了未來利用這些種質(zhì)的方向。隨著測序成本的不斷降低,幾乎可以對基因庫中的所有種質(zhì)進行全基因組低覆蓋測序,并對所有核心種質(zhì)進行高質(zhì)量的基因組測序。通過對植物遺傳資源進行系統(tǒng)的基因組數(shù)據(jù)分析、結(jié)合表型數(shù)據(jù)分析,研究人員將能夠解析出適應氣候變化和環(huán)境挑戰(zhàn)的關(guān)鍵等位基因。此外,由此產(chǎn)生的基因組-表型數(shù)據(jù)庫,以及數(shù)據(jù)和種子,可以通過共享使用協(xié)議,在全球范圍內(nèi)用于基因組設計育種,共同解決全球糧食安全問題。植物馴化和育種有賴于通過染色體重組將來自不同種質(zhì)的多個有利等位基因進行整合或者創(chuàng)制一個全新的基因組。盡管一般來說,重組事件并不受控制,但一些調(diào)節(jié)減數(shù)分裂交叉的基因可能具有提高交換數(shù)量的潛力。此外,表觀遺傳修飾有可能改變減數(shù)分裂交換的分布。這些對于育種者來說是重要的發(fā)現(xiàn),因為由于重組率低,著絲粒附近的有害突變很難去除。因此,控制重組的工具(增加重組數(shù)量、微調(diào)重組模式)以及其他廣泛使用的育種技術(shù)(例如基因組選擇、單倍體誘導和快速育種),都將有助于提高作物改良的效率。人工智能(AI)正在成為作物遺傳研究和育種的強大工具,用于精確表型分析和組學數(shù)據(jù)挖掘。通過基因組設計或基因組編輯定制的新植物需要通過高通量方法進行篩選,以對目標性狀進行表型分析。人工智能可用于在特定條件下有效選擇復雜、多變環(huán)境中數(shù)量巨大的育種群體。育種者使用無人機(UAV)和各種傳感器來捕捉田間作物的圖像,可以獲得海量的表型數(shù)據(jù),以進行高效和全面的分類。除了用于表型分析,隨著測序成本的不斷降低和大規(guī)模組學數(shù)據(jù)的爆炸式增長,現(xiàn)在可以使用深度學習來挖掘生物信息?,F(xiàn)有深度學習模型的擴展為探索生物調(diào)控和DNA中解析生物遺傳密碼提供了一個平臺。未來,隨著人工智能的進一步發(fā)展,各種植物的組學數(shù)據(jù)將用于解析基因調(diào)控網(wǎng)絡,指導基因編輯,加快植物育種步伐。長遠來看,要點就在于解決物種間基因資源互相隔離的局限性,并將不斷增加的新型分子模塊譜添加到目標作物中。例如,隨著對C4光合作用潛在分子機制的深入了解,可以通過發(fā)現(xiàn)和重塑控制Kranz發(fā)育、形成及CO2濃縮相關(guān)的關(guān)鍵基因,使C3水稻或C3大豆重新馴化為C4植物(圖3C)。結(jié)合作物的另一個關(guān)鍵生物過程固氮模塊,擁有超級作物的新時代可能從夢想變成現(xiàn)實。

https://mp.weixin.qq.com/s/h6iI36rtZqjC0vvHg56SFQ

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容