文獻
2023
Nature Communications
Genomes of cultivated and wild Capsicum species provide insights into pepper domestication and population differentiation
課題背景
(1)辣椒屬于茄科,包括35個種。C. annuum var. annuum是世界上最普遍種植的辣椒,包含辛辣和非辛辣(甜)的辣椒果實。辛辣果實不僅是一種寶貴的食物和保健資源,也可以作為止疼藥和抗癌藥。?
(2)早在公元前7000年左右,辣椒就在中美洲和/或南美洲被馴化,是最古老的馴化作物之一。現在栽培的五種辣椒分別是從C. annuum var. glabriusculum 馴化而來的C. annuum var. annuum,從C. baccatum var. baccatum 馴化而來的C. baccatum var. pendulum, C. chinense, C. frutescens和C. pubescens. 五個栽培種又可以分成3個分支。

(3)栽培辣椒的性狀
C. pubescens具有紫色花冠和深棕色或近乎黑色的種子。?
C. baccatum var. pendulum具有白色花冠并帶有黃色或金色斑點以及米色或淡褐色的種子。?
C. baccatum var. baccatum的花冠是白色或近乎白色的,帶有花冠斑點。?
C. frutescens和C. chinense的花冠通常是近乎白色,但更常見的是淡綠色。?
C. annuum var. annuum的花冠是白色的(很少是紫色的)。
C. chinense在果實的形狀、大小和顏色方面具有多樣性,而C. frutescens的果實通常較小且呈橢圓形。C. chinense的果實通常非常辛辣,具有濃烈的水果味道和獨特的香氣。C. frutescens的果實也具有辛辣的特點。?
(4)有人提出辣椒的馴化可能發(fā)生在多個起源中心。然而,先前的大規(guī)模辣椒群體研究主要集中在單一的栽培種C. annuum var. annuum上。因此,對于各種栽培辣椒和野生辣椒之間的系統發(fā)育關系、遺傳多樣性、種群分化、趨同和趨異選擇以及基因漸滲等研究仍然有限。
亮點
本研究中,作者首先利用PacBio長讀長數據和Hi-C數據,組裝了三個辣椒(分別來自Annuum分支, Baccatum 分支和 Pubescens 分支)的高質量基因組,并且對這三個參考基因組構建了一個圖形泛基因組,然后對涵蓋五個栽培種以及近緣野生種的500份辣椒種質資源進行了全基因組重測序。?
通過群體水平的分析,作者提供了辣椒屬物種的群體分化、趨同和趨異馴化以及基因漸滲的基因組學見解,并確定了與重要農藝性狀(如果實形狀和風味、開花時間以及生物/非生物脅迫應答)相關的候選基因。?
這項研究為未來的功能研究和辣椒屬物種的分子育種提供了全面而有價值的基因組資源。
結論1?番茄群體水平的DNA甲基化圖譜

Fig S3
本研究選取了3種辣椒用于組裝參考基因組,分別是來自annuum分支的C. annuum var. Zhangshugang, 來自baccatum分支的C. bacaccatum var. pendulumpi 632928和來自Pubescens分支的C. Pubescens Grif1614。這三個基因組整體上顯示出高度共線性,盡管它們之間存在一些大的倒置和基因組重排(Fig S3)。
為了給辣椒屬物種的遺傳多樣性提供更全面的參考,作者對三份參考基因組構建了圖形泛基因組。把“632928”和“Grif1614”比對到“Zhangshugang”參考基因組上去鑒定InDel和結構變異,這些從“632928”和“Frif1614”鑒定出的變異被整合到“Zhangshugang”基因組上形成一個圖形泛基因組。
結論2?辣椒屬的系統發(fā)育和種群結構

Fig 1a
作者對來自9個辣椒種的1296份材料進行了低深度全基因組重測序(深度約為1×)。利用淺全基因組重測序數據檢測SNP,然后使用GenoCore創(chuàng)建了一個核心集合,該集合包括500份材料,捕獲了1296份辣椒材料總遺傳多樣性的97.5%,這些核心材料主要來自中美洲和南美洲(Fig 1a)。對這500份材料進行了進一步的重測序,深度約為14.7×,共22.3Tb數據。通過把這些序列比對到圖形泛基因組,共鑒定出100,111,632個高質量SNPs和5,306,979個InDels。
經過分類學修正之后,這500個樣本被分為七個辣椒屬物種,分別是C. pubescens(n=38)、C. chacoense(n=17)、C. baccatum(n=118)、C. annuum(n=112)、C. galapagoense(n=1)、C. frutescens(n=99)和C. chinense(n=115)。

Fig 1b-c
C. annuum 進一步分為栽培種(C. annuum var. annuum;n=90,包括10個可能的野生樣本)和野生種(C. annuum var. glabriusculum;n=22)兩種形式。C. baccatum 也分為栽培種(C. baccatum var. pendulum;n=109)和野生種(C. baccatum var. baccatum;n=9)兩個群體(Fig 1a-b)。
這七個種在進化樹中的位置與先前報道的一致。C. pubescens(Pubescens clade)位于其他六個物種的姐妹群的位置,向內依次是C. chacoense、C. baccatum var. baccatum 和 C. baccatum var. pendulum,它們形成了 Baccatum clade。而C. galapagoense、C. frutescens、C. chinense、C. annuum var. glabriusculum 和 C. annuum var. annuum 形成了 Annuum clade(Fig 1b)。
PCA顯示出三個主要的群集,代表著Pubescens、Baccatum 和 Annuum 分支(Fig 1c-d)。其中PC2清晰地將Annuum 分支中的四個群體分開,包括C. frutescens、C. chinense、C. annuum var. annuum 和 C. annuum var. glabriusculum。
在這些辣椒樣本中共鑒定出了38個可能的雜交種,它們都來自Annuum 分支,其中包括5個來自C. annuum var. annuum,3個來自C. annuum var. glabriusculum,10個來自C. chinense,以及20個來自C. frutescens。這些可能的雜交種和10個可能的C. annuum var. annuum 野生樣本被排除在下游種群分析之外。
結論3?辣椒屬物種的群體分化

Fig 2a-c
作者利用群體分化指數Fst研究了五個栽培亞群(C. pubescens、C. baccatum var. pendulum、C. frutescens、C. chinense 和 C. annuum var. annuum)以及三個野生亞群(C. chacoense、C. baccatum var. baccatum 和 C. annuum var. glabriusculum)之間的全基因組分化。
C. baccatum var. baccatum 和 C. baccatum var. pendulum 具有最低水平的全基因組分化(Fig 2a)。其他所有的比較,Fst都大于0.37,說明辣椒屬物種之間存在較強的群體分化,并且不同栽培種具有獨立的馴化歷史。
這五個栽培種分布在特定的環(huán)境中,具有明顯香氣差異,并表現出廣泛的生物和非生物脅迫耐受性差異。為了更好地理解這些獨特特征的遺傳基礎,作者確定了高度分化的基因組區(qū)域(Fst前1%的窗口)。高度分化的基因組區(qū)域的總大小在不同的兩兩物種比較之間相似(Fig 2b),但在C. pubescens 和 C. annuum var. annuum 之間的分化區(qū)域中發(fā)現了更多的基因(Fig 2c)。

Fig 2d
雖然大多數基因在兩兩比較中都是特異的,但是涉及生物/非生物應答的基因常常在多個比較中被檢測到(Fig 2d)。
開花時間是一個復雜的特征,反映了植物對它們各自生長環(huán)境的適應性。開花時間在五種栽培辣椒中存在差異。C. pubescens 需要最長的開花時間,其次是 C. baccatum var. pendulum、C. chinense 和 C. frutescens,而 C. annuum var. annuum 需要最短的時間。與開花時間相關的基因在栽培辣椒之間高度分化的區(qū)域中被發(fā)現,如SUF4、FLX3以及FY。
辣椒素對辣椒的辛辣味貢獻很大。在五種栽培辣椒的兩兩比較中,與辣椒素生物合成有關的基因被鑒定出位于高度分化的基因組區(qū)域,如CCR在C. frutescens 和 C. pubescens 以及 C. chinense 和 C. pubescens 之間的分化區(qū)域被發(fā)現(Fig 2d)。
揮發(fā)性化合物是重要的與風味相關的化合物,影響消費者的喜好。如醇類和醛類化合物常常存在于辣椒屬植物中,包括C. annuum var. annuum、C. chinense和C. frutescens,但它們的特征在不同物種之間有所變化。調節(jié)醇和醛類生物合成的基因,如編碼醇脫氫酶的基因,被發(fā)現位于明顯分化的基因組區(qū)域(Fig 2d)。非揮發(fā)性化合物(如糖類),也與辣椒的風味高度相關,并在辣椒屬中顯示出種內和種間的變異。
結論4?辣椒的種群歷史

Fig 2e-g
有效群體大小 (Ne) 的動態(tài)變化可以深入了解環(huán)境因素和人類馴化事件對種群歷史的影響。經歷Last Glacial Maximum (LGM)時期后辣椒所有種的有效群體大小急劇下降,當進入到Meghalayan時期,Ne迅速恢復到穩(wěn)定期(Fig 2e)。
C. annuum var. annuum的Ne一直以來是所有群體中最低的,直到1000年前開始逐漸增加,特別是在哥倫布發(fā)現美洲后。對C. annuum var. annuum進行強烈的馴化和選擇可能導致其LD衰減速度相對較慢(Fig 2f),并且相對于其他栽培種,其遺傳多樣性更低(Fig 2g)。
結論5?辣椒屬物種的趨同和趨異馴化

Fig 3a-b
栽培辣椒的育種目標包括果提高實產量和品質、改善植株結構以及提高對生物和非生物脅迫的抗性。
兩種栽培辣椒,C. annuum var. annuum 和 C. baccatum var. pendulum 的果實明顯較長、較寬,與其野生祖先相比,兩者的形態(tài)更具多樣性(Fig 3a-b),這表明C. annuum var. annuum 和 C. baccatum var. pendulum 可能經歷了趨同馴化,導致果實更大和形態(tài)更多樣化。

Fig 3c-d
作者將栽培辣椒C. annuum var. annuum和C. baccatum var. pendulum與它們的野生祖先C. annuum var. glabriusculum和C. baccatum var. baccatum進行比較以鑒定全基因組的受選擇信號。分別從C. annuum var. annuum(Fig 3c)和C. baccatum var. pendulum(Fig 3d)找到了529個和615個受選擇區(qū)域。

Fig 3e-h
值得注意的是,只有11.17Mb的基因組區(qū)域(包含68個基因)在C. annuum var. annuum和C. baccatum var. pendulum兩者中都被選擇(Fig 3e),而分別在C. annuum var. annuum和C. baccatum var. pendulum中特有的選擇區(qū)域為165.34Mb(1553個基因)和170.78Mb(890個基因)。
果實大小和重量是辣椒育種中最重要的目標之一。在C. annuum var. annuum的受選擇區(qū)域中檢測到的與果實大小和重量相關的基因和QTL在很大程度上與C. baccatum var. pendulum中檢測到的不同(Fig 3c-d)。在C. annuum var. annuum中檢測到的最強的馴化信號之一位于Chr3上,其中包含果實重量的QTL Han3.1 32,而在C. baccatum var. pendulum中,最強的信號包括Chr2的Han2.1 32和Chr9的果實大小/重量QTLs Fwd/Fwg。這些結果表明,C. annuum var. annuum和C. baccatum var. pendulum果實大小和重量的增加,可能是通過獨立的受選擇導致的。
在C. annuum var. annuum的受選擇區(qū)域發(fā)現了兩個編碼OVATE家族蛋白的基因(Caz06g07310和Caz09g04240),這些基因在番茄中已被報道參與果實形狀的調控,但在C. baccatum var. pendulum中沒有發(fā)現。這些結果表明,與果實重量類似,C. annuum var. annuum和C. baccatum var. pendulum中果實形狀的馴化也主要是通過選擇不同的基因組區(qū)域實現的(Fig 3a)。
對C. annuum的果實形狀指數的進行GWAS分析,鑒定到一個顯著的關聯信號,位于Chr2的160,915,869bp到161,006,859bp之間,包含五個基因(Fig 3f)。在C. baccatum中的果實形狀指數的GWAS分析發(fā)現了兩個極顯著的信號,一個在Chr2的172,704,945bp到172,706,325bp之間,另一個在Chr10的120,586,110bp到122,585,250bp之間(Fig 3g)。在Chr2的關聯區(qū)域中沒有注釋的基因,而在Chr10上的區(qū)域包含四個基因,其中包括一個(Caz10g08850)編碼OVATE家族蛋白的基因。與C. baccatum var. baccatum相比,Caz10g08850基因組區(qū)域的核苷酸多樣性在果實形狀指數>4(纖維形)和果實形狀指數<1.2(鐘形)的C. baccatum var. pendulum群體中都要低得多(Fig 3h),表明在辣椒育種過程中不同辣椒類型中Caz10g08850基因的不同等位基因被固定以滿足消費者的喜好。
野生辣椒通常具有辛辣味。在辣椒的馴化歷程中,已經選擇了不同程度的辛辣味,以滿足不同的烹飪需求。在C. annuum var. annuum和C. baccatum var. pendulum的受選擇區(qū)域找到了36個和14個與辣椒素合成有關的基因(Fig 3c-d),其中只有兩個基因(Caz03g22890和Caz07g10470)重疊。這些結果表明,C. annuum var. annuum和C. baccatum var. pendulum中的辛辣差異主要是通過在獨立的馴化過程中選擇辣椒素合成途徑中的不同基因來實現的。
結論6?從Baccatum分支向Annuum分支的基因漸滲

Fig 4a-b
將抗性基因從近緣物種中引入是一種常見的育種手段。在辣椒屬植物中,通過TreeMix檢測到了從Baccatum分支到Annuum分支(包括C. frutescens和C. chinense)的基因流動事件(Fig 4a)。ABBA-BABA 檢驗也進一步支持了這一基因流動事件(Fig 4b)。

Fig 4c-d
通過fd計算全基因組的平均基因漸滲強度為1.71%,基因組漸滲比例為1.51%,在Chr6-Chr7-Chr12上檢測到最強的基因漸滲強度(Fig 4c)。
Chr6末端存在強漸滲區(qū)域(前1%fd),包含了72個基因,其中包括17個與抗性相關,其中15個基因聚成了兩個基因cluster(Fig 4d)。第一個cluster中的Caz06g28230基因,與番茄Mi-1同源,被證實與抗性相關。

Fig 4e-f
進一步對Annuum分支中所有的物種進行基因組區(qū)域的掃描,尋找與Baccatum分支相似的區(qū)域。作者發(fā)現了Baccatum基因漸滲主要存在于C. chinense和C. frutescens中,而在C. annuum中很少見(Fig 4e)。這種漸滲導致了這一區(qū)域在C. chinense和C. frutescens中相對于C. annuum var. annuum具有更高的遺傳多樣性(Fig 4d)和更強的連鎖不平衡(Fig 4f),這可能是缺乏重組導致的。
在Chr7和Chr12上的基因漸滲區(qū)域還發(fā)現了有助于生物和非生物脅迫抗性的基因。這些結果共同表明,從Baccatum分支到C. chinense和C. frutescens的基因漸滲可能幫助了抗性的提高。
本文使用 文章同步助手 同步