蔥屬植物是一個(gè)大的單子葉植物類別,含近千個(gè)物種,其中不少物種具有顯著的經(jīng)濟(jì)價(jià)值。大蒜是重要的蔥屬作物之一,我國(guó)大蒜的年播種面積達(dá)到1000萬畝以上。**大蒜具有膨大的鱗莖,富含大蒜素,不僅可用作蔬菜和調(diào)味料食品,也被廣泛用于醫(yī)藥產(chǎn)業(yè)。大蒜基因組未知,且栽培種大蒜一般不育,嚴(yán)重阻礙了大蒜生物學(xué)研究及大蒜育種工作。
大蒜屬于二倍體物種(2n=16),但大蒜基因組非常大(16.9 Gb),且具有重復(fù)率高(預(yù)估> 80%),雜合度大(~1.68%)等特點(diǎn),屬于非常復(fù)雜的基因組為了解碼大蒜基因組,中國(guó)農(nóng)業(yè)科學(xué)院麻類研究所劉頭明研究團(tuán)隊(duì),聯(lián)合山東農(nóng)業(yè)大學(xué),西北農(nóng)林科技大學(xué),武漢大學(xué)和諾禾致源生物科技公司,歷時(shí)四年完成了大蒜基因組的測(cè)序和組裝工作,研究結(jié)果以“A chromosome-level genome assembly of garlic (Allium sativum L.) provides insights into genome evolution and allicin biosynthesis”為題,在線發(fā)表在Molecular Plant(影響因子 12.084)上。
該研究綜合利用PacBio,Nanopore,Illumina PE,10X Genomics和Hi-C技術(shù)開展了大蒜的基因組測(cè)序,測(cè)序數(shù)據(jù)量達(dá)到4.3 Tb。

經(jīng)過組裝后得到的基因組大小為16.24 Gb, Contig 和superscaffold N50分別為194 kb和1.69 Gb。單條染色體最小的為1.35 Gb,最大的達(dá)到2.16 Gb。注釋分析發(fā)現(xiàn)大蒜基因組中含57561個(gè)基因,BUSCO和CEGMA評(píng)估證明大蒜基因組組裝質(zhì)量較好。作者還通過大規(guī)模的轉(zhuǎn)錄組數(shù)據(jù)來表征了大蒜不同組織以及膨大鱗莖不同發(fā)育時(shí)期的基因表達(dá)模式。大規(guī)模轉(zhuǎn)錄組分析共鑒定到847個(gè)鱗莖中特異表達(dá)的大蒜基因,5881個(gè)鱗莖膨大期間差異表達(dá)基因;另外,在102個(gè)大蒜品種中,完成大蒜鱗莖的基因表達(dá)與鱗莖重量性狀的皮爾森相關(guān)性分析。結(jié)合這些基因表達(dá)結(jié)果發(fā)現(xiàn)多個(gè)WOX家族基因和生長(zhǎng)素相關(guān)基因可能參與到鱗莖發(fā)育。

大蒜基因組作為首個(gè)蔥屬物種中完成測(cè)序的基因組,對(duì)于研究物種進(jìn)化具有重要的意義。研究團(tuán)隊(duì)基于基因組系統(tǒng)進(jìn)化分析發(fā)現(xiàn)大蒜與天門冬科蘆筍在大約80.8百萬年前發(fā)生了分化。大蒜在進(jìn)化過程中發(fā)生了三次全基因組復(fù)制(WGD)事件,其中兩次發(fā)生在與蘆筍分化之前,另有一次近期的WGD事件發(fā)生在17.9 MYA。此外,大蒜基因組在~20-30萬年前轉(zhuǎn)座元件發(fā)生急劇擴(kuò)張(另外,這次轉(zhuǎn)座元件的爆發(fā)也解釋了與大蒜素和菊粉類新型果聚糖生物合成相關(guān)基因的演化,為這兩個(gè)化合物的生物合成提供了新的視野。),導(dǎo)致基因組中高達(dá)91.3%的序列為重復(fù)序列,這是迄今為止所發(fā)現(xiàn)的重復(fù)序列比例最高的基因組。因此,該研究推斷大蒜的三次全基因組復(fù)制事件及重復(fù)序列急劇擴(kuò)張是驅(qū)動(dòng)大蒜基因組龐大的根本原因。

最后,本研究通過基因組擴(kuò)張收縮分析,發(fā)現(xiàn)菊糖型果聚糖合成關(guān)鍵酶6G-FFT基因和蒜氨酸酶基因發(fā)生了急劇擴(kuò)張,推測(cè)它們可能分別與大蒜特有化合物菊糖型果聚糖和大蒜素的生物合成進(jìn)化相關(guān)。結(jié)合轉(zhuǎn)錄組數(shù)據(jù),該研究確立了大蒜素生物合成通路,發(fā)現(xiàn)4個(gè)串聯(lián)重復(fù)的蒜氨酸酶基因隨著大蒜鱗莖發(fā)育,其表達(dá)量持續(xù)上升,推測(cè)它們與大蒜鱗莖中的蒜氨酸酶積累相關(guān)。

據(jù)悉,此次完成測(cè)序的品種為二水早紫皮蒜,也就是俗稱的四川蒜。劉頭明解釋稱,之所以將二水早紫皮蒜選為首個(gè)測(cè)序的品種,是因?yàn)樗m用性廣,在我國(guó)種植地域也最廣。山東農(nóng)業(yè)大學(xué)孫秀東副教授,李寧陽副教授和喬旭光教授,中國(guó)農(nóng)業(yè)科學(xué)院麻類研究所朱四元研究員,程毅副研究員,諾禾致源生物公司趙靜博士為本文第一作者,中國(guó)農(nóng)業(yè)科學(xué)院麻類研究所劉頭明研究員,粟建光研究員,西北農(nóng)林科技大學(xué)程智慧教授為論文通訊作者。本研究受到了國(guó)家重點(diǎn)研發(fā)項(xiàng)目,中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)科技創(chuàng)新工程和國(guó)家自然科學(xué)基金項(xiàng)目資助。
Analysis of LTR Retrotransposons
Full-length LTR retrotransposons were identified in the garlic and Asparagus officinalis genomes using LTR_FINDER (Xu and Wang, 2007) and LTRharvest (Ellinghaus et al., 2008) with default parameters. Candidate LTR sequences were filtered as described by Hu et al. (2011). Briefly, only sequences containing intact LTR domains that belonged to families with more than two members were retained. Full-length LTRs were subsequently translated into amino acids in three frames. Translated sequences were mapped against the Ty1_Copia (PF07727) and Ty3_Gypsy(PF000078) domains in the Pfam database using HMMER (http://hmmer.org) with E-values % 1e5.
Sequences that mapped to the Copia and Gypsy superfamilies were aligned using MAFFT(https://mafft.cbrc.jp/alignment/software/) with default parameters. The phylogenetic trees of LTR-RTs in the two superfamilies were constructed using FastTree (http://www.microbesonline.org/fasttree/).
論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(20)30232-X
參考:http://www.360doc.com/content/20/0731/06/57935769_927740040.shtml