將同一屬內(nèi)不同種遺傳變異的泛基因組整合在一起構(gòu)建的超級泛基因組可以更好地代表整個屬的遺傳變異。稻屬包括亞洲栽培稻 ( Oryza sativa,Os) 和非洲栽培稻(O. glaberrima,Og)兩個栽培種,它們分別從普通野生稻和短舌野生稻馴化而來。組裝了251份高質(zhì)量的水稻基因組,構(gòu)建了目前植物中群體規(guī)模最大的、基因組充分注釋的、稻屬中最為系統(tǒng)的超級泛基因組。該圖譜的完成將極大地促進水稻功能基因挖掘和水稻種質(zhì)資源利用。相關(guān)研究成果于2022年7月12日以 “A Super Pan-Genomic Landscape of Rice”為題發(fā)表在Cell Research(影響因子46.297)上。
Os由亞洲野生稻 ( O. rufipogon , Or ) 馴化而成,主要有兩種類型:Geng ( Os. japonica , Osj ) 和Xian ( Os. indica , Osi)。Osj早在9000 年前就被馴化了,而Osi形成較晚,從Osj的馴化等位基因滲入。
大約 3500 年前,Og是從O. barthii ( Ob ) 馴化而來的,而O. barthii (Ob)大約在 600,000 年前與Or分道揚鑣。
對包括單核苷酸變異和結(jié)構(gòu)變異(SVs)在內(nèi)的一整套遺傳變異的鑒定,有助于研究栽培稻和野生稻的種群結(jié)構(gòu)和進化動態(tài),加深了對適應(yīng)、馴化、和物種形成。然而,應(yīng)該注意的是,遺傳變異通常是針對單個參考基因組進行鑒定的;因此,與參考基因組不存在或高度分歧的 DNA 序列被忽略。泛基因組結(jié)合了多個基因組,試圖代表一個物種的整個基因集,可以幫助克服序列缺失的問題。水稻是中國第一大糧食作物,中國也是世界上最早種植水稻的國家。在水稻基因組學研究上,中國也一直走在世界前列。20年前,中國科學家獨立繪制完成并成功“解讀”了水稻基因序列,這也是人類第一次在基因組層面認識了水稻。5年間,中國科學家已完成構(gòu)建4個水稻泛基因組,包括使用453個亞洲栽培稻種質(zhì)的短讀長構(gòu)建的泛基因組、使用53亞洲栽培稻和13個普通野生稻種質(zhì)的短讀長迭代組裝的泛基因組、使用32個亞洲栽培稻和1個非洲栽培稻種質(zhì)的長讀長組裝而成的泛基因組和使用105個亞洲栽培稻和6個普通野生稻的長讀長組裝而成的泛基因組。
水稻馴化的過程中經(jīng)歷了高強度的人工選擇,導致栽培稻相對于野生稻祖先遺傳多樣性減少,成為目前培育水稻品種的制約因素之一
該研究通過地理分布來源、基因型和表型變異 精心選擇了具有高度代表性的202份亞洲栽培稻核心種質(zhì)材料,28份普通野生稻、11份非洲栽培稻 和 10份短舌野生稻。對所選擇的251份水稻核心種質(zhì)材料進行長讀長納米孔(Nanopore)測序和 Illumina 短讀長重測序,利用自主開發(fā)的WTDBG軟件從頭組裝了251份高質(zhì)量水稻基因組序列,并對每個基因組做了充分的注釋。

然后,基于序列和蛋白相似性分別構(gòu)建了以非冗余序列和非冗余基因為代表的泛基因組。該研究將基于三代長讀長數(shù)據(jù)鑒定到的159,491個結(jié)構(gòu)變異信息整合為圖形化的變異圖譜(Variation graph)。這種變異圖譜形式的泛基因組能夠幫助研究人員利用已有的二代重測序數(shù)據(jù)獲取相應(yīng)水稻材料的結(jié)構(gòu)變異(Structural variation,SV)。為了方便在群體水平上準確地比較等位基因在不同水稻材料中的遺傳變異,研究者還利用高質(zhì)量的群體基因組構(gòu)建了基于基因組序列比對的泛基因組圖譜,并對每個變異位點進行了基因注釋和序列的整合,囊括了目前最全面的水稻基因序列的復等位信息。

該泛基因組圖譜可以幫助研究者充分挖掘與利用水稻功能基因遺傳變異??共』騈LRs(leucine-rich repeat genes)區(qū)域經(jīng)常存在復雜的SV,對不同水稻材料中的抗病基因的等位變異進行鑒定和比較非常困難。研究人員利用泛基因組圖譜通過整合NLRs注釋信息,構(gòu)建了水稻泛NLRome,確定了泛NLRs家族基因的共線性。為抗病基因功能和進化研究提供了基礎(chǔ),也給群體水平的復雜基因家族或者復雜的染色體區(qū)域研究提供了借鑒。

研究人員利用他們構(gòu)建的泛基因組序列和對應(yīng)的群體表達數(shù)據(jù),對兩個已知初定位QTL進行重新分析,分別快速確定了產(chǎn)量相關(guān)性狀的候選基因,并通過實驗驗證了候選基因的功能。群體水平的泛基因組序列可以幫助研究者從群體的水平上對復雜QTL定位區(qū)間序列的單倍型精準解析,大大加快功能基因挖掘的進程。

該泛基因組圖譜為水稻比較基因組學和進化基因組學研究提供了重要基礎(chǔ)。亞洲稻和非洲稻的比較基因組研究,揭示了亞洲栽培稻和非洲栽培稻重要農(nóng)藝性狀馴化和環(huán)境適應(yīng)的遺傳基礎(chǔ)。利用泛基因組序列解析了與水淹反應(yīng)相關(guān)的已知基因在5個不同水稻亞群中的單倍型分布和群體分化程度,發(fā)現(xiàn)非洲水稻和亞洲水稻中這些耐水淹基因可能發(fā)生了獨立的變異來適應(yīng)水淹環(huán)境。株型由野生稻匍匐生長轉(zhuǎn)變?yōu)樵耘嗟局绷⑸L是水稻馴化過程中的關(guān)鍵一步。前人研究表明,野生稻中都存在一個由多個串聯(lián)鋅指基因構(gòu)成的RPAD位點,而在栽培稻基因組中僅有一個鋅指基因,分別是prog1和prog7。在亞洲栽培稻馴化過程中,PROG1功能喪失及與其緊密連鎖的110 kb片段缺失,導致亞洲栽培稻株型變直立。而在非洲栽培稻prog7基因組區(qū)域內(nèi)也存在130 kb左右大片段缺失,但是該缺失片段內(nèi)調(diào)控水稻匍匐生長習性的基因并不清楚。利用泛基因組圖譜比較了普通野生稻和短舌野生稻RPAD位點的差異,發(fā)現(xiàn)其在種內(nèi)和種間均存在明顯的分化,并且在馴化過程中,非洲栽培稻與亞洲栽培稻都在RPAD位點發(fā)生了大片段缺失,但是非洲栽培稻與亞洲栽培稻分別保留了RPAD位點兩端的不同鋅指基因,該結(jié)果不僅揭示了非洲栽培稻株型馴化的分子機理,也為大片段結(jié)構(gòu)變異驅(qū)動作物平行馴化提供了重要的分子證據(jù)。



為了高效方便地利用這些海量的基因組數(shù)據(jù),研究人員還構(gòu)建了數(shù)據(jù)庫RiceSuperPIRdb(http://www.ricesuperpir.com/)。通過數(shù)據(jù)檢索,可以高效地獲得特定水稻品種基因組序列及基因組注釋,還可以選擇任意樣本基因組為參考基因組,查看與所有材料的全基因組比對結(jié)果和基因組變異。該網(wǎng)站對利用這些基因組信息研究水稻基因功能研究和種質(zhì)資源利用具有重要的科學意義和實用價值。
Cell Research同期發(fā)表了圣路易斯華盛頓大學Kenneth M. Olsen教授對于該工作的評論文章。Olsen教授認為基因組相關(guān)研究的貢獻不僅取決于單個基因組的組裝質(zhì)量,也取決于其包含的自然變異多樣性。Shang等人發(fā)布了第一個包含亞洲栽培稻和三個近緣物種在內(nèi)的水稻“超級泛基因組”,該研究極大促進了我們對于水稻基因組的理解,相關(guān)種質(zhì)資源及數(shù)據(jù)對基礎(chǔ)研究有重要價值。
原文鏈接:https://www.nature.com/articles/s41422-022-00685-z
評論文章鏈接:https://www.nature.com/articles/s41422-022-00699-7
黃學輝 教授 (上海師范大學)
泛基因組(Pan-genome)是指一個物種內(nèi)所有基因組信息的總和。相比單一參考基因組,泛基因組信息包含了豐富的遺傳多樣性,可有效降低參考基因組偏差對遺傳變異檢測的影響。該研究團隊選取了251份來自不同類群的亞洲栽培稻、普通野生稻、非洲栽培稻及短舌野生稻材料,對它們進行了長讀長測序、從頭組裝、基因組注釋和結(jié)構(gòu)變異鑒定,獲得了一份高質(zhì)量的水稻泛基因組圖譜。這套群體水平的超級泛基因組,無論是材料選擇、樣本大小還是組裝質(zhì)量都可圈可點,是水稻基因組學研究中一項里程碑式的工作。
在此基礎(chǔ)上,該研究團隊還開發(fā)了這套數(shù)據(jù)的在線網(wǎng)站,提供給同行們進行水稻組學資源的獲取和整合,這將極大地方便科研人員充分挖掘水稻品種中的各類等位變異,精確地鑒定復雜農(nóng)藝性狀的關(guān)鍵變異位點(QTN),進一步推動水稻功能基因組學研究。此外,結(jié)合高質(zhì)量的組學數(shù)據(jù),育種家還可以充分利用這251份水稻資源,進行優(yōu)異基因聚合,創(chuàng)制新的育種材料,實現(xiàn)更高水平的分子設(shè)計育種。
田志喜 研究員(中國科學院遺傳與發(fā)育生物學研究所 )
種內(nèi)、種間多樣性是作物改良的基礎(chǔ)。隨著研究的深入,基于單一參考基因組解析物種多樣性的弊端逐漸顯現(xiàn),例如無法實現(xiàn)基因組復雜區(qū)域候選基因的精細解析等。在本文中,研究人員從稻屬材料中系統(tǒng)性收集了251份水稻核心種質(zhì),組裝了高質(zhì)量基因組,在進行完整注釋后構(gòu)建了目前植物中群體規(guī)模最大的超級泛基因組。同時,基于高質(zhì)量基因組的序列比對完成了泛基因組圖譜。該圖譜將群體材料每個變異位點的序列和基因注釋整合,展示了目前稻屬基因組序列最全面、最完整的復等位信息,為群體水平候選片段或等位基因的共線性分析及單倍型比較等研究提供新的切入點和突破口。研究人員以復雜基因家族——抗病基因NLRs為例,詳細介紹了基于水稻超級泛基因組開展復等位基因研究的方法。通過提取泛基因組圖譜中NLRs信息,成功構(gòu)建了泛NLRome,在群體水平充分展示NLRs的共線性、重排等信息,不僅能夠為NLRs進化相關(guān)研究提供了參考,也為基于泛基因組研究復雜基因家族或者染色體區(qū)域提供了思路。
最后,作者將所得數(shù)據(jù)及分析結(jié)果在網(wǎng)站上進行可視化,方便相關(guān)科研人員以任意研究樣本為參考基因組查看與所有材料的全基因組比對結(jié)果和基因組注釋,查看材料間變異信息。作為植物研究領(lǐng)域的頂級資源和研究成果,不僅是前沿科學挑戰(zhàn)的新突破,同時對水稻甚至其他植物的功能研究和分子育種具有不可估量的價值。