每周文獻(xiàn)|大豆多倍體進(jìn)化和生活史變遷

豆科植物擁有兩個(gè)亞屬,一個(gè)是單年生的Soja亞屬 (2n=40),里面包含我們很熟悉的朋友——大豆Glycine max。另一個(gè)是多年生的Glycine 亞屬(2n=38, 40, 78, 80)。兩個(gè)亞屬在一千萬(wàn)年前就離婚分家了。原本以為分家之后各自安好,不料分家之后連生活史(單年生/多年生)和染色體倍型都發(fā)生了改變。原本一家的大豆為什么會(huì)發(fā)生如此翻天覆地的變化?今天我們分享一篇來(lái)自Nature Plants的文獻(xiàn),縱觀(guān)大豆基因組的倍型進(jìn)化以及生活史轉(zhuǎn)變。


首先隆重介紹本次男嘉賓,也就是我們所熟知的大豆:Glycine max

Glycine max.jpg

以及男嘉賓爺爺?shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔數(shù)臓敔敚?strong>Glycine soja
不能說(shuō)十分相像,簡(jiǎn)直是一模一樣。
這倆一看就是親生的。

Glycine soja

文章信息

  • 題目:Phylogenomics of the genus Glycine sheds light on polyploid evolution and life-strategy transition
  • 期刊和時(shí)間:Nature Plants,2022.3.14
  • 作者和單位:通訊作者來(lái)自山東農(nóng)大的Dajian Zhang老師以及普渡大學(xué)的Jianxin Ma老師。

研究背景

  • 有花植物例如豆科的多倍化和生活史轉(zhuǎn)變十分頻繁,然而卻缺乏遺傳學(xué)證據(jù)解釋其原因。

研究結(jié)果

1.染色體級(jí)別的基因組裝和基因組注釋

作者使用三代測(cè)序PacBio,輔助Hi-C技術(shù)和BESs(paired bacterial artificial chromosome (BAC) end sequences)技術(shù),對(duì)五個(gè)多年生二倍體大豆G. falcata (FF), G. stenophita (BB), G. cyrtoloba (CC), G. syndetika(AA) ,G. tomentella D3 (DD),以及一個(gè)異源多倍體大豆G. dolichocarpa (AtAtDtDt)進(jìn)行測(cè)序。

隨后對(duì)組裝后的基因組進(jìn)行評(píng)估,使用了N50,k-mer估計(jì)等指標(biāo);基因組完整性采用 BUSCO和CEGMA軟件進(jìn)行評(píng)估。大豆基因組系統(tǒng)發(fā)育情況,基因組共線(xiàn)性情況(Fig1)及評(píng)估結(jié)果如下(table1):

table1| 基因組組裝情況.jpg

Figure1| 大豆樣本的采樣地,系統(tǒng)發(fā)育樹(shù),基因組共線(xiàn)性分析

注解:Fig1中A圖是本次測(cè)序數(shù)據(jù)的樣品采集地及系統(tǒng)發(fā)育情況。系統(tǒng)發(fā)育樹(shù)根據(jù)830個(gè)直系同源基因構(gòu)建,Medicago truncatula和Phaseolus vulgaris作為外群。其生活史和倍型也在其中以不同顏色區(qū)分。其中分化時(shí)間通過(guò)Beast軟件添加。B圖是基因組共線(xiàn)性情況,最外圍是本次共線(xiàn)性分析的參考基因組Glycine max。C圖是八號(hào)染色體在D/Dt,A/At基因組之間的重排情況和轉(zhuǎn)座子密度分布。作者以此為例說(shuō)明對(duì)多個(gè)物種/基因組進(jìn)行比較,可以驗(yàn)證許多基因組重排,并確定這些事件的相對(duì)時(shí)間和性質(zhì)。D圖將各個(gè)大豆種基因組的重組率進(jìn)行對(duì)比(以 P. vulgaris的重組率作為參考),表明多年生植物的基因組重排次數(shù)少于單年生植物。

在此基礎(chǔ)之上作者對(duì)基因組進(jìn)行了蛋白編碼注釋?zhuān)占總€(gè)大豆測(cè)序種的根,葉和花,混合上述植物組織并利用RNA-seq進(jìn)行測(cè)序。得到的reads分別進(jìn)行de novo組裝和有參考基因組的組裝。取二者組裝后轉(zhuǎn)錄本的并集使用MAKER-P基因預(yù)測(cè)工具進(jìn)行基因組注釋。

2.轉(zhuǎn)座子和著絲粒重復(fù)序列的基因分化

在得到高質(zhì)量大豆基因組之后,作者對(duì)于其中的轉(zhuǎn)座子區(qū)域進(jìn)行了分析。Fig2A和B列出了各個(gè)類(lèi)型基因組中轉(zhuǎn)座子種類(lèi)分布和數(shù)量。在這其中,98.2%的長(zhǎng)末端轉(zhuǎn)座子(LTR-RT)被估算產(chǎn)生于5百萬(wàn)年前,這也暗示了這些長(zhǎng)末端轉(zhuǎn)座子很可能是導(dǎo)致基因組分化的原因。此外,在多年生大豆種中發(fā)現(xiàn)了905個(gè)完整的LTR-RTs,而這些之中沒(méi)有一個(gè)能夠完完整整地出現(xiàn)在單年生大豆中,這些LTR-RTs僅有不到四分之一在單年生大豆中有微弱的片段同源基因發(fā)現(xiàn)。這也能一定程度上說(shuō)明在大豆屬分化之后體內(nèi)的LTR-RT產(chǎn)生了獨(dú)立遺傳。

Figure2| 單年生大豆和多年生Glycine亞屬各品種的重復(fù)序列分析

此外,大多數(shù)植物的著絲粒由長(zhǎng)序列的著絲粒衛(wèi)星重復(fù)序列(CSRs)組成,這些重復(fù)序列經(jīng)常被富含著絲粒的逆轉(zhuǎn)錄轉(zhuǎn)座子(CRs)打斷。在單年生大豆中曾經(jīng)鑒定出兩個(gè)CSR家族Gm-Cent1 and Gm-Cent2,在大豆20條染色體中各自代表其中一個(gè)染色體組的著絲粒衛(wèi)星重復(fù)序列。然而這些CSR在多年生大豆中數(shù)量大大減少(Fig2C)。由上述CSR直系同源分析進(jìn)而推進(jìn)到串聯(lián)重復(fù)基因分析時(shí),作者發(fā)現(xiàn)在基因組A,B,C,D中沒(méi)有找到CRS-like重復(fù)蛋白。僅在F基因組中找到了CRS-like,因此與栽培大豆Gm-Cent1 和Gm-Cent2構(gòu)建了系統(tǒng)發(fā)育樹(shù)(Fig2D)?;贕m-Cent1 和Gm-Cent2鄰位物理圖譜分析和二代測(cè)序數(shù)據(jù),作者找到了Gmr17和Gmr01(Fig2EFG),二者可能是單年生大豆種中的富含著絲粒的逆轉(zhuǎn)錄轉(zhuǎn)座子(CRs)(至于鄰近分析(relative frequencies of physical adjacency)小編還在學(xué)習(xí)中)??傊?strong>在單年生大豆中找到了Gmr17和Gmr01,但是多年生大豆沒(méi)有。這可能也是造成其生活史轉(zhuǎn)變的原因之一。

3.超級(jí)泛基因組解析大豆進(jìn)化

當(dāng)下大豆的泛基因組規(guī)模較小,僅容納了栽培種。為了擴(kuò)充泛基因組的遺傳多樣性,作者使用測(cè)序得到的二倍體Glycine聯(lián)合構(gòu)建了超大泛基因組。在基因組中注釋非冗余基因顯示31936個(gè)多年生二倍體大豆共有基因。這些基因是多年生大豆的核心基因(Fig3A)。在下載的26個(gè)單年生大豆基因組中,作者也進(jìn)行了相同的注釋?zhuān)业搅?129,006個(gè)共有的非冗余基因,這些基因是單年生大豆的核心基因。將單年生和多年生大豆的核心基因和非核心基因重新歸類(lèi),形成了Fig3B??梢?jiàn)單年生大豆中非核心基因形成比例較高(但這種高比例可能是因?yàn)閱文晟蠖够虮磉_(dá)資源多,畢竟多年生大豆只測(cè)序了5個(gè)種)。

Figure3| 多年生大豆核心基因和單年生大豆核心基因聚類(lèi)分析

接下來(lái)作者把目光聚焦到了17,922多年生大豆和單年生大豆共有的核心基因中。首先通過(guò)Ka/Ks檢測(cè)其受選擇程度,與6,745個(gè)多年生大豆和單年生大豆共有的非核心基因相比,核心基因的Ka,Ks和Ka/Ks都更?。?strong>Fig4C-E)。但是在單年生和多年生植物之間(Fig4C-E紅藍(lán)之間)沒(méi)有顯著性差異。對(duì)上述共有基因的duplicates和singletons進(jìn)行Ka/Ks檢測(cè)也顯示了相同的結(jié)果。但是在隨后的分析中作者發(fā)現(xiàn),多年生二倍體大豆中核心基因的duplicates to singletons比例高于非核心基因,而單年生大豆基因組中整體的duplicates to singletons比例要高于多年生。兩種生活史不同的大豆在基因進(jìn)化上可能也存在分歧。

Figure4| 單年生大豆和多年生大豆在共有核心/非核心基因的純化選擇分析。

4.適應(yīng)性進(jìn)化導(dǎo)致生活史轉(zhuǎn)變

聊完單年生和多年生大豆基因組整體的基因進(jìn)化,現(xiàn)在我們深入微觀(guān)找尋導(dǎo)致其生活史轉(zhuǎn)變的基因。作者在多年生二倍體大豆和他們的7個(gè)野生型單年生大豆中尋找同源基因,對(duì)找到的同源基因進(jìn)行Ka/Ks檢測(cè)發(fā)現(xiàn)了52個(gè)經(jīng)歷過(guò)較強(qiáng)純化選擇的位點(diǎn),這里面有6個(gè)經(jīng)過(guò)GO分析發(fā)現(xiàn)是控制花朵發(fā)育的基因,其中2個(gè)基因在多年生和單年生大豆中具有極高水平的純化選擇,很可能跟生活史轉(zhuǎn)變相關(guān)(Fig5A,B)。進(jìn)一步同源分析發(fā)現(xiàn),這兩個(gè)基因一個(gè)和Arabidopsis PLANT HOMOLOGOUS TO PARAFIBROMIN (PHP)同源,控制花朵形成(Fig5F是其通路)。另一個(gè)與Arabidopsis DWARF14 (D14)同源,編碼獨(dú)腳金內(nèi)酯受體(Fig5G是其通路)。Fig5C,D分別對(duì)比了二者與PHP和D14的序列差異。Fig5E是二者的純化選擇強(qiáng)度,在單年/多年生大豆中的情況。這兩個(gè)基因的適應(yīng)性進(jìn)化,超高的純化選擇強(qiáng)度,以及基因本身的功能都在一定程度解釋了生活史的轉(zhuǎn)變。

Figure5|

5.亞基因組中的基因偏好性分離

這里的“基因分離”英文寫(xiě)作subgenomic fractionation,指的是冗余基因丟失的過(guò)程。而有偏好性的基因分離指的是基因分離發(fā)生在其中一個(gè)亞基因組上。轉(zhuǎn)座子作為驅(qū)動(dòng)偏好性基因分離的因素,在亞基因組之間產(chǎn)生表觀(guān)遺傳差異。進(jìn)而引發(fā)表達(dá)量的下降,受影響的基因低表達(dá)直至喪失功能。

大豆基因組中A和D產(chǎn)生的重排率是最高的,大約每百萬(wàn)年11個(gè)重排事件。然鵝在A(yíng)和At以及D和Dt基因組內(nèi)部卻十分保守。A和At只有10個(gè)位置轉(zhuǎn)換(transpositions),D和Dt只有6個(gè)位置轉(zhuǎn)換(Fig6A)。而且在多倍化發(fā)生之后At基因組和Dt基因組間仍然發(fā)生了23個(gè)小的亞基因組間轉(zhuǎn)座,包含了45個(gè)基因(Fig6B)。

Figure6| 轉(zhuǎn)座子在A(yíng),D基因組上的分布情況

此外從基因組A和D到基因組At和Dt的多倍化伴隨著基因丟失,而且這些A和D基因組中丟失的基因有更高的Ka/Ks(Fig7F),表明其受到了純化選擇。更進(jìn)一步,受到純化選擇的基因在表達(dá)水平上明顯變?nèi)?。At和Dt基因組中的基因缺失更傾向于成簇缺失(Fig7H)。異源多倍化后的At和Dt相鄰基因相較于A(yíng)和D更傾向于共表達(dá)(Fig7I,J)。

Figure7| 異源多倍體中亞基因組的分化與偏好性分離

注解Fig7c中顯示的是At和Dt相較于A(yíng)和D基因組中的基因丟失情況。Dt相較于A(yíng)t丟失了更多的singletons。丟失基因的種類(lèi)展示在Fig7e。Fig7g顯示,A和D同源物的表達(dá)水平與At和Dt中對(duì)應(yīng)基因的丟失率分別呈負(fù)相關(guān)。Fig7 i,j分別是At和Dt的臨位共表達(dá)情況和A和D基因組的臨位共表達(dá)情況,前者正相關(guān),后者沒(méi)顯著性關(guān)聯(lián),以此說(shuō)明其從A&D演化為At&Dt之后基因趨向于共表達(dá)。Fig7 k作者對(duì)丟失的基因進(jìn)行種類(lèi)劃分,并且給出了其比例。Fig7 I展示了一個(gè)deletion模型,用以表明提前終止導(dǎo)致的刪除突變促使了亞基因組分離。

總結(jié)

本研究組裝了5個(gè)多年生二倍體大豆高質(zhì)量基因組和1個(gè)多年生異源多倍體大豆高質(zhì)量基因組。本文中通過(guò)對(duì)于全基因組的轉(zhuǎn)座子分析,純化選擇分析和丟失基因分析,將大豆倍型進(jìn)化的原因歸納到重組導(dǎo)致基因丟失,最終引發(fā)染色體分離。明確了有花植物多倍化進(jìn)化的方向。整篇文章是一篇純生信分析,只用六個(gè)高質(zhì)量基因組就能發(fā)到NP,其課題本身的立意功不可沒(méi)。如果在此基礎(chǔ)上能夠?qū)Υ蠖筆HP和D14的同源基因進(jìn)行正向遺傳學(xué)驗(yàn)證,且發(fā)現(xiàn)了大豆生活史的巨大轉(zhuǎn)變,想必能夠達(dá)到CNS的水平(某種程度上的作物從頭馴化)。


參考信息:

1. Glycine Soja;https://www.sciencedirect.com/topics/agricultural-and-biological-sciences/glycine-soja
2. Zhuang, Y., Wang, X., Li, X. et al. Phylogenomics of the genus Glycine sheds light on polyploid evolution and life-strategy transition. Nat. Plants (2022). https://doi.org/10.1038/s41477-022-01102-4

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容