文獻(xiàn)
2022
Genome Biology
Genomic insights into?the?evolutionary history and?diversification of?bulb traits in?garlic
研究背景
大蒜
大蒜是一種很重要的蔬菜、中藥甚至香料,營(yíng)養(yǎng)價(jià)值和經(jīng)濟(jì)價(jià)值很高,食用部分是鱗莖。它的起源、馴化和育種改良?xì)v史還不是很清楚。目前,比較廣泛認(rèn)可的說(shuō)法是大蒜起源于地中海地區(qū)、中亞以及西亞,是從野生的長(zhǎng)蔥馴化而來(lái)。
大蒜是二倍體,2n=16,雖然染色體不多,但是很長(zhǎng),單套基因組有16.9G,是擬南芥的160多倍,重復(fù)序列多,雜合度大,很難組裝。2020年,也是本文的通訊作者劉頭明老師,第一次組裝了大蒜基因組,發(fā)表在MP上。
基因組重測(cè)序技術(shù)
(1)全基因組重測(cè)序:將特定組織或者細(xì)胞中的DNA進(jìn)行隨機(jī)打碎,構(gòu)建片段為350bp或者500bp的文庫(kù),通過(guò)Illumina Hiseq對(duì)文庫(kù)進(jìn)行高通量測(cè)序,從而獲得某一個(gè)個(gè)體所有DNA序列的信息。
(2)簡(jiǎn)化基因組測(cè)序:簡(jiǎn)化基因組測(cè)序簡(jiǎn)單來(lái)說(shuō)就是用限制性核酸內(nèi)切酶去切割基因組,最后把我們的目標(biāo)區(qū)域拿來(lái)測(cè)序,這樣能極大地降低測(cè)序成本。
常用的簡(jiǎn)化基因組測(cè)序手段有這兩種,RAD和GBS,當(dāng)然除了這兩種基本的方法,還有好多延申出來(lái)的新方法。

這個(gè)表格對(duì)幾種簡(jiǎn)化基因組測(cè)序做了對(duì)比,感興趣的可以看下這個(gè)鏈接(https://blog.csdn.net/u012110870/article/details/102804240),有更詳細(xì)的介紹。
結(jié)論1 群體結(jié)構(gòu)

Fig 1a
作者從17個(gè)國(guó)家收集了233份材料(Fig 1a),包括230份大蒜和3份長(zhǎng)蔥,做了簡(jiǎn)化基因組測(cè)序。都比對(duì)到同一版本的大蒜參考基因組上,有意思的是84.3%的大蔥的reads也能比對(duì)上,說(shuō)明兩者的親緣關(guān)系很近,基因組序列很相似。

Fig 1b

Fig 1c
通過(guò)PCA和進(jìn)化樹(Fig 1b-c),可以看到這230份大蒜分成了四個(gè)分支,這個(gè)橘黃色的10份大蒜和3份大蔥距離最近,并且這10份大蒜主要來(lái)自大蒜的起源中心中亞地區(qū),表明這10份種質(zhì)資源在系統(tǒng)發(fā)育上比其他種質(zhì)資源更接近野生種,該類群被指定為起源類群(OG)。另外三個(gè)分支按來(lái)源分成了中國(guó)組1和中國(guó)組2和組3,組3就是從中國(guó)之外的其他地方收集的材料。
結(jié)論2 群體多樣性與分化

Fig 1d

作者利用這些簡(jiǎn)化基因組測(cè)序計(jì)算了四個(gè)亞群的核苷酸多樣性和群體分化指數(shù)。Fig 1d中每個(gè)橢圓里面的黑色數(shù)字就是每個(gè)亞群的核苷酸多樣性pi值,數(shù)量級(jí)是10的-5次方,都很低很低,黃瓜、藍(lán)莓、水稻一般都在10的-3或者-4次方。四個(gè)亞群之間的群體分化指數(shù)都比較高,能達(dá)到0.3或者0.4以上。
因?yàn)楝F(xiàn)在的分析是基于簡(jiǎn)化基因組測(cè)序,它測(cè)的并不是全基因組,所以作者進(jìn)一步選了10份起源類型,35份CG1和39份CG2做了全基因組重測(cè)序。前面提到大蒜的基因組非常大,所以他們雖然只測(cè)了84份材料,卻產(chǎn)生了14Tb的數(shù)據(jù)。利用全基因組重測(cè)序數(shù)據(jù)又計(jì)算了pi和Fst值,群體分化指數(shù)還是比較高,基本和秈稻和粳稻之間的分化差不多。
作者用全基因組重測(cè)和簡(jiǎn)化基因組測(cè)序都計(jì)算了核苷酸多樣性,d圖中紅色的是全基因組重測(cè)序計(jì)算的,黑色的是然后發(fā)現(xiàn)用GBS計(jì)算的,然后發(fā)現(xiàn)GBS得到的結(jié)果始終小于全基因組重測(cè)序結(jié)果。
我看了這篇文章的審稿意見和作者回復(fù),作者在第一版manuscript中寫道可能是因?yàn)橄拗菩院怂醿?nèi)切酶附近的核苷酸更保守導(dǎo)致了這種偏差,但是審稿人不信,審稿人認(rèn)為是因?yàn)镚BS得到的位點(diǎn)數(shù)過(guò)少導(dǎo)致的。然后作者對(duì)全基因組重測(cè)序數(shù)據(jù)選取了GBS同樣的位點(diǎn)數(shù)計(jì)算核苷酸多樣性,發(fā)現(xiàn)確實(shí)是因?yàn)槲稽c(diǎn)過(guò)少導(dǎo)致的這種偏差。


Fig S3
大蒜的食用部分是鱗莖,鱗莖就是一群蒜瓣圍繞中間這個(gè)柱子構(gòu)成了一個(gè)組合,我們平時(shí)所謂的蒜瓣就是一個(gè)個(gè)一個(gè)的鱗芽。不同亞群的鱗莖和鱗芽有明顯差異(Fig S3)。中國(guó)組1,CG1大多是我們常見的四六瓣蒜,也就是一個(gè)鱗莖有4個(gè)或者6個(gè)鱗芽。CG2是多瓣蒜,一個(gè)鱗莖有更多的鱗芽。

Fig 1e
作者統(tǒng)計(jì)了三個(gè)亞群的鱗莖重量、鱗莖直徑、鱗芽數(shù)量和鱗芽重量,發(fā)現(xiàn)了比較明顯的群體分化(Fig 1e),所以文章后面主要從群體的角度研究影響鱗莖和鱗芽性狀的因素。
結(jié)論3 CG1和CG3的獨(dú)立馴化

Fig 2a

Fig 2b
作者計(jì)算了三個(gè)亞群的有效群體大小Ne,F(xiàn)ig 2a展示了Ne的歷史動(dòng)態(tài)變化,橫坐標(biāo)代表距離現(xiàn)在過(guò)去了多少年,也就說(shuō)這個(gè)值越大代表越久遠(yuǎn),縱坐標(biāo)是有效群體大小。
可以看到三個(gè)亞群在距今大概50萬(wàn)年前發(fā)生了分化,在距今1萬(wàn)到1.5萬(wàn)年前分別發(fā)生了瓶頸事件導(dǎo)致群體銳減,一般來(lái)說(shuō)瓶頸事件的發(fā)生與那個(gè)時(shí)期的獨(dú)特地質(zhì)事件相關(guān),這個(gè)時(shí)間點(diǎn)正好和新仙女木期重合,新仙女木期是晚冰期的氣候極冷時(shí)期,可能是極低的氣溫導(dǎo)致了有效群體大小的銳減。
人類作物馴化的歷史大概有1萬(wàn)年,現(xiàn)在最早的大蒜記錄可以追溯到公元前2600年,距今大概5000年,也就是說(shuō)CG1和CG2的分化早于他們的馴化歷史。大蒜是嚴(yán)格不育的,只能通過(guò)播種鱗芽或者氣生鱗莖進(jìn)行嚴(yán)格的無(wú)性繁殖,這導(dǎo)致了不同大蒜個(gè)體之間的生殖隔離。因此作者認(rèn)為CG1和CG2分化成兩個(gè)不同的群體之后,它們從兩個(gè)不同的途徑進(jìn)行獨(dú)立馴化。進(jìn)一步通過(guò)ABBA BABA test也證實(shí)了兩個(gè)群體間沒有基因交流,獨(dú)立馴化(Fig 2b)。

Fig 2c

Fig 2d
CG1和CG2兩個(gè)亞群間的群體分化指數(shù)普遍很大,有超過(guò)30%的區(qū)域Fst大于0.5(Fig 2c)。
和OG原始類群相比,CG1和CG2分別鑒定到842和943個(gè)受選擇區(qū)域(Fig 2d),只有0.18%的區(qū)域在CG1和CG2中共同受選擇,這也證明了CG1和CG2兩個(gè)亞群獨(dú)立受選擇,獨(dú)立馴化。
結(jié)論4 CG1和CG2轉(zhuǎn)錄水平的顯著差異

Fig 3a
轉(zhuǎn)錄組比基因組通常更能直接反映表型變異,因此作者測(cè)了這81份材料鱗莖的轉(zhuǎn)錄組。這個(gè)圈圖棕色的三個(gè)track從內(nèi)到外依次是OG-CG1-CG2的FPKM(Fig 3a),能看到一些差異但不是很直觀,然后作者用到了一個(gè)指標(biāo)香農(nóng)指數(shù)來(lái)表征轉(zhuǎn)錄本豐度的多樣性,圈圖外圈四個(gè)綠色的track依次是OG-CG1-CG2和所有81份材料的。OG的香農(nóng)指數(shù)大體在1.7-2.2;CG1 2.8-3.4;CG2 3.0-3.7。
香農(nóng)指數(shù)計(jì)算可參考
Martínez, Octavio, and M Humberto Reyes-Valdés. PNAS. (2008). doi:10.1073/pnas.0803479105

Fig 3b

Fig 3c
Fig 3b展示了這三個(gè)亞群中兩兩比較存在的差異表達(dá)基因,根據(jù)表達(dá)情況分成了三種,一種是在某亞群中表達(dá),在另一個(gè)亞群中不表達(dá);一種是在某亞群中不表達(dá),在另一個(gè)亞群中表達(dá);還有在兩個(gè)亞群均表達(dá)但是存在差異,可以看到還是有好多基因在CG1和CG2馴化過(guò)程是存在明顯的差異表達(dá)的。
前面提到,大蒜的鱗莖表型變異在這三個(gè)亞群中變化還是很顯著的,所以作者看了CG1和CG2相對(duì)于OG各自的和整體的差異基因與鱗莖、鱗芽性狀的富集關(guān)系,發(fā)現(xiàn)這些差異基因真的富集到好多與鱗芽、鱗莖相關(guān)的基因(Fig 3c)。
需要注意的是,90%以上的差異基因不在受選擇區(qū)域,這說(shuō)明大多數(shù)基因的差異表達(dá)是由選擇性基因調(diào)控引起的,而不是基因組區(qū)域受選擇引起的。

Fig 3d

Fig 3e
這兩個(gè)基因在擬南芥中的同源基因已被證實(shí)在花蕾發(fā)育和分化中起重要作用,它們的表達(dá)量在三個(gè)亞群中存在顯著的差異(Fig 3d)。
Fig 3e展示了這兩個(gè)基因表達(dá)量和鱗芽數(shù)量之間的相關(guān)性。斜線上是三個(gè)分布直方圖,左上角的是81份大蒜大蒜瓣數(shù)量頻數(shù)分布,中心和右下角的是這兩個(gè)基因在81份材料中的表達(dá)量。散點(diǎn)擬合圖是大蒜瓣數(shù)量和這個(gè)基因表達(dá)量的擬合關(guān)系,0.53是兩者之間的相關(guān)系數(shù),星號(hào)代表顯著性。通過(guò)這個(gè)圖強(qiáng)調(diào)了這兩個(gè)基因與大蒜瓣數(shù)量的密切關(guān)系。
結(jié)論5 CG1和CG2中有害突變存在獨(dú)立的積累和清除

Fig 4a

Fig 4b
對(duì)于無(wú)性繁殖的生物,很容易導(dǎo)致有害突變的積累,所以在這一部分作者鑒定了三個(gè)亞群中的有害突變。Fig 4a 密度圖展示了這些材料中,兩兩之間的有害突變的重疊比例,在84份材料中這個(gè)比例是有三個(gè)明顯的峰,分別是6.51%、19.78%和31.42%,而且兩兩亞群之間的有害突變重疊比例也都形成了獨(dú)立的峰,說(shuō)明這三組大蒜分別經(jīng)歷了有害突變的積累。
CG1和CG2的有害突變明顯少于原始群體(Fig 4b),說(shuō)明在各自馴化的過(guò)程中CG1和2都在降低有害突變,作者想進(jìn)一步研究這些有害突變是如何獨(dú)立清除的。

Fig 4c

Fig 4d
因?yàn)樵隈Z化過(guò)程中CG1和CG2獨(dú)立受到選擇,所以很容易想到的一個(gè)點(diǎn)就是有害突變?cè)讵?dú)立選擇中受到清除。Fig 4c統(tǒng)計(jì)的是在受選擇區(qū)域和基因組其他區(qū)域的有害突變?nèi)コ?,無(wú)論是CG1還是CG2都表現(xiàn)出受選擇區(qū)域有更多的有害突變被清除。相應(yīng)的Fig 4d 統(tǒng)計(jì)了這些區(qū)域的有害突變密度,在受選擇區(qū)域有害突變明顯更少。通過(guò)這兩個(gè)分析作者想說(shuō)明選擇導(dǎo)致大蒜有害突變的下降。
結(jié)論6 CG1和CG2鱗莖性狀的差異
平時(shí)我們吃大蒜,吃的是蒜瓣,也就是鱗芽,鱗芽的數(shù)量和重量是影響大蒜產(chǎn)量的最關(guān)鍵因素,而且鱗芽的數(shù)量和重量在三個(gè)亞群種存在明顯的分化。所以文章的最后作者蔥受選擇區(qū)域鑒定了影響鱗芽數(shù)量和重量的基因。

Fig 5b
首先是鱗芽數(shù)量。鱗芽從本質(zhì)是講就是一個(gè)過(guò)于膨大的花蕾,在水稻和擬南芥種最經(jīng)典的影響花蕾發(fā)育的基因是TB1,所以作者先是在大蒜種鑒定了TB1的同源基因,一共找到了12個(gè),其中一個(gè)在CG1亞群的受選擇區(qū)(Fig 5b)。

Fig 5c-d

Fig 5e
Fig 5c展示了這個(gè)基因鄰近區(qū)域的OG和CG1兩個(gè)亞群的核苷酸多樣性比值和群體分化只是,紅色箭頭指示的是這個(gè)基因,F(xiàn)ig 5d展示了這個(gè)基因的基因結(jié)構(gòu)和存在明顯分化的單倍型,F(xiàn)ig 5e把各個(gè)位置的單倍型和鱗芽數(shù)量做了關(guān)聯(lián),能看到有些單倍型和鱗芽數(shù)量是存在顯著關(guān)聯(lián)的。

Fig 5f

Fig S8
對(duì)于鱗芽數(shù)量,CG2亞群最多,CG1亞群最少,OG介于兩者之間(Fig 5f),作者看了這個(gè)TB1基因在三個(gè)亞群的表達(dá)量,也發(fā)現(xiàn)了顯著的差異,并且和表型趨勢(shì)一致(Fig S8)。

Fig S13

Fig 5g
前面講到的TB1是已知的一個(gè)與花蕾發(fā)育相關(guān)基因,因?yàn)橛羞@230份材料的表型數(shù)據(jù),作者還做了GWAS,找到了22個(gè)潛在相關(guān)位點(diǎn)(Fig S13),這些位點(diǎn)鄰近200kb的范圍內(nèi)找到了11個(gè)轉(zhuǎn)錄水平與鱗芽數(shù)量存在顯著關(guān)聯(lián)的基因。其中有一個(gè)基因位于受選擇區(qū)域(Fig 5g)。

Fig S14

Fig 5h-i
這個(gè)基因參與了擬南芥生長(zhǎng)素信號(hào)轉(zhuǎn)導(dǎo)途徑,是芽生長(zhǎng)的抑制因子,在三個(gè)亞群種表達(dá)量存在顯著差異(Fig S14),單倍型與鱗芽數(shù)量存在顯著關(guān)聯(lián),表明它可能是抑制鱗芽數(shù)量的基因(Fig 5h-i)。

Fig S15d

Fig 6b
除了鱗芽數(shù)量,鱗芽的重量也是很重要的一個(gè)性狀,作者測(cè)定了鱗芽膨大前-中-后的轉(zhuǎn)錄組,兩兩call DEG,然后對(duì)共同的DEG去找與鱗芽重量相關(guān)的候選基因(Fig S15d)。在洋蔥和土豆中的研究發(fā)現(xiàn),開花基因FT與塊莖的膨大密切相關(guān),作者在這些DEG里也是鑒定到了FT,并且位于受選擇區(qū)域(Fig 6b)。

Fig S18

Fig 6c
作者把大蒜中的這個(gè)FT基因在擬南芥中做了過(guò)表,發(fā)現(xiàn)確實(shí)可以像FT那樣顯著的影響開花(Fig S18),這也是這篇文章中唯一一個(gè)實(shí)驗(yàn)驗(yàn)證的點(diǎn),拋開那些花里胡哨的修飾,它的本質(zhì)就是在大蒜中鑒定到一個(gè)擬南芥FT的同源基因,然后用大蒜中這個(gè)FT序列在擬南芥中做了驗(yàn)證,實(shí)際上就是驗(yàn)證了兩個(gè)同源基因。這個(gè)FT基因在三個(gè)亞群中存在明顯的表達(dá)差異(Fig 6c),推測(cè)它可能是影響鱗芽重量的候選基因。
正文部分的最后,作者還強(qiáng)調(diào)了盡管在受選擇區(qū)找到了這么多與鱗芽性狀相關(guān)的候選基因,但是沒有一個(gè)基因是在CG1和CG2中同時(shí)受到選擇的,這又支持了CG1和CG2獨(dú)立馴化的觀點(diǎn)。
總結(jié)
核心觀點(diǎn):我國(guó)的四六瓣蒜和多瓣蒜獨(dú)立馴化
具體體現(xiàn)
1-強(qiáng)烈的群體分化
2-獨(dú)立的瓶頸效應(yīng)
3-基因表達(dá)的普遍差異
4-有害突變的獨(dú)立清除
5-獨(dú)立的受選擇
6-鱗芽/鱗莖性狀的獨(dú)立分化
本文使用 文章同步助手 同步