Sun X, Jiao C, Schwaninger H, et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nature Genetics, 2020, DOI: 10.1038/s41588-020-00723-9.
科學(xué)網(wǎng)—重磅推薦!康奈爾大學(xué)費(fèi)章君團(tuán)隊(duì)揭示蘋(píng)果馴化的遺傳學(xué)歷史 - 小柯生命的博文
分相的二倍體基因組組裝和泛基因組提供了對(duì)蘋(píng)果馴化遺傳史的見(jiàn)解
摘要
蘋(píng)果的馴化主要是由種間雜交驅(qū)動(dòng)的。本研究報(bào)告了栽培的蘋(píng)果(Malus domestica cv. Gala)和其兩個(gè)主要野生祖先,M. sieversii和M. sylvestris的單倍型解析基因組。在每個(gè)基因組的兩個(gè)單倍型之間鑒定出實(shí)質(zhì)性的變異?;蚪M血統(tǒng)的推斷可確定約有23%的Gala基因組來(lái)自雜種。對(duì)91份蘋(píng)果種質(zhì)進(jìn)行了深測(cè)序,確定了栽培蘋(píng)果的選擇性清除,這些選擇性清除起源于兩個(gè)祖先中的任何一個(gè),并且與重要的馴化性狀有關(guān)。通過(guò)對(duì)蘋(píng)果pan基因組的構(gòu)建和分析,發(fā)現(xiàn)了數(shù)千個(gè)新基因,其中數(shù)百個(gè)是從其中一個(gè)祖先中篩選出來(lái)的,并且大部分固定在栽培蘋(píng)果中,揭示了新基因/等位基因的導(dǎo)入是蘋(píng)果通過(guò)雜交馴化的一個(gè)標(biāo)志。最后,Gala果實(shí)在13個(gè)發(fā)育階段的轉(zhuǎn)錄組圖譜揭示了19%的等位基因特異性表達(dá),包括許多與果實(shí)品質(zhì)相關(guān)的基因。
正文
作物馴化對(duì)人類(lèi)的人口增長(zhǎng)和文明發(fā)展起著至關(guān)重要的作用。今天,人類(lèi)嚴(yán)重依賴(lài)于數(shù)千年前被馴化的多種農(nóng)作物1。通過(guò)技術(shù)創(chuàng)新加強(qiáng)了關(guān)鍵作物的遺傳改良2,3,但由于馴化作物的遺傳多樣性狹窄而受到阻礙。作物野生近緣種是育種遺傳物質(zhì)的重要來(lái)源,而這些野生近緣種所需性狀的潛在基因常常被用來(lái)改良馴化種質(zhì)4,5。盡管基因信息很重要,但用于作物野生親緣關(guān)系的基因組信息卻很少6。
大多數(shù)作物基因組復(fù)雜,具有基因組大、雜合度高、多倍體等特點(diǎn)7。這種復(fù)雜性對(duì)植物基因組組裝提出了挑戰(zhàn),為了獲得高質(zhì)量的基因組,通常需要在參考選擇上付出更多的努力,而且在許多情況下,低倍性的純合系更受青睞8,9。然而,許多植物在自然界中是自由授粉的,因此雜合基因組區(qū)域可能是表型變異的主要因素10。因此,對(duì)自然雜合系的直接測(cè)序可以提供對(duì)其遺傳復(fù)雜性的深入見(jiàn)解11。另一方面,植物往往具有遺傳結(jié)構(gòu),單一的參考基因組決不能代表整個(gè)群體。因此,除了線性參考基因組外,還可以生成一個(gè)復(fù)雜的種群多樣性表示形式。這種表現(xiàn)形式的變體,包括基于基因的12,13或基于序列的14,15泛基因組,成功地捕獲了隱藏的遺傳多樣性,并促進(jìn)了重要性狀16,17的遺傳基礎(chǔ)的發(fā)現(xiàn)。
蘋(píng)果(Malus domestica Borkh.)是一種廣受歡迎的溫帶水果,其馴化是通過(guò)不同野生種的雜交和優(yōu)良性狀基因型的克隆繁殖來(lái)實(shí)現(xiàn)的。在野生種中,M. sieversii和M. sylvestris是主要的祖先18,19,20。蘋(píng)果基因組高度雜合,對(duì)早期的基因組組裝21,22提出了重大挑戰(zhàn)。目前,栽培蘋(píng)果的參考質(zhì)量基因組組合可用于雙單倍體系GDDH13(參考文獻(xiàn)9)、三單倍體HFTH1(參考文獻(xiàn)23)和二倍體品種“Gala Galaxy”24;對(duì)于其野生近緣物種,只有M. baccata的基因組草圖可用25。在本研究中,我們組裝了栽培蘋(píng)果Gala的參考級(jí)、相性二倍體基因組,這是一個(gè)生長(zhǎng)在世界各地的頂級(jí)品種,以及兩個(gè)主要的野生祖先M. sieversii和M. sylvestris。我們直接測(cè)序雜合系,揭示了基因組的二倍體狀態(tài)。我們還構(gòu)建了基于91份深度重測(cè)序的蘋(píng)果屬植物的泛基因組。這些高質(zhì)量的參考基因組和泛基因組可以更好地了解蘋(píng)果馴化的遺傳基礎(chǔ),為今后蘋(píng)果的研究和育種提供寶貴的資源。
結(jié)果
基因組組裝與同源染色體構(gòu)建
我們?yōu)檫@3份種質(zhì)獲得了623-780倍的Illumina和10x基因組序列的覆蓋率,以及37-81倍的PacBio-HiFi序列覆蓋率(補(bǔ)充表1)。對(duì)于每份種質(zhì),reads被組裝成一個(gè)包含定相scaffold的二倍體基因組,以及一個(gè)傳統(tǒng)的單倍體合并基因組(補(bǔ)充圖1)。對(duì)于二倍體基因組,最終組裝體的大小為1.31-1.32GB,對(duì)于單倍體合并基因組,大小為652-668?Mb(補(bǔ)充表2)。盡管雜合度較高(0.85-1.28%),但所有的組裝都表現(xiàn)出很高的連續(xù)性,二倍體組合體的scaffold N50為3.3-4.3?Mb,單倍體合并基因組的scaffold N50為16.8-35.7?Mb(補(bǔ)充表2)。利用高密度的遺傳圖譜26,27和與已發(fā)表的基因組9,成功地錨定了96.7–97.8%的單倍體合并基因組scaffold。
二倍體組裝的大小大約是單倍體基因組的兩倍,這表明同源染色體在每個(gè)組裝中都得到了很好的捕獲,這進(jìn)一步得到了k-mer譜分析的支持(擴(kuò)展數(shù)據(jù)圖1)。大約93.7-95.5%的定相scaffold被分成兩個(gè)非冗余的集合(又稱(chēng)為haplomes),它們被進(jìn)一步錨定在17個(gè)同源染色體上。每個(gè)haplome的累積大小為單倍體基因組的88.5–100.0%(補(bǔ)充表2),所有三份材料都顯示出兩個(gè)haplome之間的高度共線性(圖1a)。使用多種方法的基因組評(píng)估證實(shí)了單倍體和二倍體組裝的高質(zhì)量(補(bǔ)充注釋和擴(kuò)展數(shù)據(jù)圖2)。
圖1:Gala,M. sieversii和M. sylvestris的基因組和進(jìn)化。

在二倍體組裝中,總共預(yù)測(cè)了90147-90507個(gè)蛋白質(zhì)編碼基因,在單倍體組裝中預(yù)測(cè)了45199-45352個(gè)蛋白質(zhì)編碼基因(補(bǔ)充表2)。核苷酸結(jié)合、富含亮氨酸的重復(fù)基因廣泛參與抗病28,并且在蘋(píng)果屬植物中發(fā)現(xiàn)高度可變(補(bǔ)充說(shuō)明、補(bǔ)充表3和補(bǔ)充圖2)。
我們的組裝顯示出與已發(fā)表基因組的整體高共線性(補(bǔ)充圖3),除了1號(hào)染色體上的5-Mb倒位,我們發(fā)現(xiàn)這可能是GDDH13和HFTH1基因組中的錯(cuò)誤組裝(擴(kuò)展數(shù)據(jù)圖3)。我們鑒定了單倍體之間的實(shí)質(zhì)性差異,包括2387290、2591444和2929832個(gè)單核苷酸多態(tài)性(SNPs)、363464、364605和401893個(gè)插入/缺失,以及M.sieversii、M.sylvestris和Gala的202、343和330個(gè)倒位(補(bǔ)充表4和補(bǔ)充圖4)。
大約58.7–59.4%的蘋(píng)果基因組是重復(fù)序列,類(lèi)似于GDDH13和HFTH1的基因組(補(bǔ)充表5和補(bǔ)充圖5)。我們發(fā)現(xiàn)在蘋(píng)果進(jìn)化過(guò)程中發(fā)生了兩次長(zhǎng)末端重復(fù)轉(zhuǎn)座子(LTR-RT)爆發(fā),其中較老的一次發(fā)生在蘋(píng)果和梨29的物種形成之前,最近的一次發(fā)生在M.sylvestris和M.sieversii分化為亞群之前(圖1b、c和補(bǔ)充圖)。6和7)。LTR-RTs在重復(fù)爆發(fā)后的進(jìn)化可能創(chuàng)造了物種間豐富的遺傳多樣性。一個(gè)值得注意的例子是redTE逆轉(zhuǎn)錄轉(zhuǎn)座子,它在一些蘋(píng)果品種中轉(zhuǎn)移到MYB1基因座上,導(dǎo)致了紅色果皮23。我們發(fā)現(xiàn)redTE只存在M.sieversii和M.domestica中,它以短雜合子的形式存在于Gala中,可能導(dǎo)致MYB1等位基因的特異性表達(dá),從而導(dǎo)致Gala的黃紅果皮顏色(補(bǔ)充注釋和擴(kuò)展數(shù)據(jù)圖4)。