崖州灣國(guó)家實(shí)驗(yàn)室大豆種子創(chuàng)新團(tuán)隊(duì)首席科學(xué)家田志喜作為通訊作者,在Cell期刊上發(fā)表了題為:Genomic atlas of 8,105 accessions reveals stepwise domestication, global dissemination, and improvement trajectories in soybean?的封面論文。研究系統(tǒng)調(diào)查了8,105份大豆種質(zhì)資源在馴化、傳播與改良過程中受選擇的基因。首次發(fā)現(xiàn)黑大豆是馴化過程中的關(guān)鍵中間類型,大豆馴化性狀呈現(xiàn)階梯式選擇模式。通過對(duì)比不同地理區(qū)域和歷史時(shí)期的種質(zhì)資源,鑒定出眾多參與性狀改良與環(huán)境適應(yīng)的選育基因,并揭示了中國(guó)大豆改良育種重點(diǎn)隨時(shí)間演變的動(dòng)態(tài)變化。構(gòu)建了首個(gè)大豆QTN庫與在線變異數(shù)據(jù)庫,為未來高產(chǎn)、高油、高蛋白大豆的精準(zhǔn)育種提供了重要基因資源與平臺(tái)。

PART.01|研究設(shè)計(jì)與方法
技術(shù)路線
對(duì)8105個(gè)大豆種質(zhì)資源進(jìn)行全基因組分析揭示大豆逐步馴化的過程,黑豆作為其中重要進(jìn)化中間體;通過對(duì)比不同地理區(qū)域和歷史時(shí)期的種質(zhì)資源,鑒定出眾多參與性狀改良與環(huán)境適應(yīng)的選育基因并構(gòu)建了一個(gè)變異數(shù)據(jù)庫。

研究背景
過去60年全球大豆產(chǎn)量增長(zhǎng)約13倍。面對(duì)全球人口持續(xù)增長(zhǎng)帶來的需求激增,大幅提升大豆產(chǎn)量已刻不容緩;在生產(chǎn)中,重點(diǎn)培育植株挺拔、莖稈強(qiáng)健、種子粒徑增大及含油量提升等性狀;在傳播中,著重培育適應(yīng)光周期變化、溫度波動(dòng)、病害侵襲等多樣化環(huán)境條件的特性。解析大豆馴化、傳播等過程中的遺傳變化機(jī)制;鑒定性狀選擇的關(guān)鍵基因;揭示在自然種群中的遺傳多樣性。將有力推動(dòng)育種計(jì)劃,提升作物產(chǎn)量、抗逆能力。
研究材料
多項(xiàng)已發(fā)表研究的總共8,105份大豆種質(zhì)的重測(cè)序數(shù)據(jù)。該群體包含1,334份野生種、1,045份地方品種、5,716份栽培種及10份半野生種,地理來源覆蓋全球主要大豆產(chǎn)區(qū)。
研究方法
1. 基因組結(jié)構(gòu)與遺傳多樣性分析
? ?群體結(jié)構(gòu)分析、連鎖不平衡分析、基因流分析
2.擇信號(hào)檢測(cè)與關(guān)聯(lián)分析
? ?選擇信號(hào)識(shí)別、全基因組關(guān)聯(lián)分析、單倍型分析
3.基因功能驗(yàn)證實(shí)驗(yàn)
? ?載體構(gòu)建與遺傳轉(zhuǎn)化、亞細(xì)胞定位、分子互作實(shí)驗(yàn)、轉(zhuǎn)錄活性分析
PART.02|主要成果
8105份大豆種質(zhì)的遺傳變異
將68.19 Tb的測(cè)序數(shù)據(jù)比對(duì)至(ZH13 v2.0)參考基因組,鑒定出4,856萬個(gè)SNPs和1,082萬個(gè)Indels,變異主要集中在基因間區(qū)與內(nèi)含子區(qū)(圖1B)。群體遺傳分析證實(shí),野生大豆的遺傳多樣性最高(圖1C),連鎖不平衡水平最低(圖1D)。

黑豆的基因組結(jié)構(gòu)揭示了大豆馴化的潛在起源
群體結(jié)構(gòu)和系統(tǒng)發(fā)育分析表明,所有野生品系聚為一個(gè)單一組;同時(shí),地方品種和改良品種的分類與其地理分布呈現(xiàn)出明顯的相關(guān)性(圖2B和2C)。某些栽培大豆具有與其他栽培大豆顯著不同的獨(dú)特基因組結(jié)構(gòu)。這些材料大多被歸類為黑豆,其特征是具有獨(dú)特的黑色種皮。
黑豆群體可分為黃淮地區(qū)和西北地區(qū)兩大亞群,大豆可能存在至少兩個(gè)獨(dú)立的馴化中心,為長(zhǎng)期存在的馴化起源爭(zhēng)議提供了新線索。TreeMix、D統(tǒng)計(jì)等多重分析均證實(shí),野生大豆、黑豆及其他栽培亞群之間存在復(fù)雜的基因流歷史(圖3A)。黑豆作為馴化的中間類型,在與野生和栽培群體的持續(xù)基因交流中,作為了重要中間環(huán)節(jié)。

大豆馴化過程中農(nóng)藝性狀逐步選擇
使用FST、?XP-CLR、π以及RAiSD方法進(jìn)行全基因組掃描,在野生大豆與黑豆間檢測(cè)到135個(gè)高質(zhì)量選擇性清除位點(diǎn),在黑豆與地方品種間鑒定出了486個(gè)選擇性清除位點(diǎn)。證實(shí)了種皮顏色的馴化發(fā)生在種子形態(tài)和品質(zhì)之后(圖3B)。
檢測(cè)并比較野生大豆→黑大豆→地方品種的選擇信號(hào)(圖3C)。GmSHAT1-5,GmNST1A等基因在莢果開裂性狀分析中被篩選出來,GmNST1A(GmSHAT1 - 5的同源基因)曾被推測(cè)具有類似功能,可調(diào)控大豆的莢果開裂現(xiàn)象,黑豆主要攜帶與野生大豆相同的單倍型(全長(zhǎng)型,定義為Hap2),而地方品種和栽培品種則傾向于攜帶導(dǎo)致提前終止密碼子的單核苷酸突變(截短型,定義為 Hap1),從而導(dǎo)致47個(gè)氨基酸的缺失(圖3D和3E)。通過酵母單雜交試驗(yàn)證實(shí),GmNST1A 與GmSHAT1 - 5啟動(dòng)子結(jié)合,發(fā)現(xiàn)GmNST1A基因在馴化過程中影響豆莢炸裂的潛在分子機(jī)制。
作者提出了一種馴化模型(圖3F):早期選擇聚焦于產(chǎn)量與成熟期等核心性狀,后期則在此基礎(chǔ)上增強(qiáng)了對(duì)種皮顏色、休眠期等次級(jí)性狀的改良。整個(gè)過程伴隨著不同群體間復(fù)雜的基因流 ,最終塑造了現(xiàn)代栽培大豆的基因組。

大豆傳播路線上不同的選擇
通過Tajima's D值進(jìn)行判定。已知基因被分為四類:開花時(shí)間(藍(lán)色)、生物與非生物脅迫(紫色)、產(chǎn)量相關(guān)(紅色)以及油脂與蛋白質(zhì)含量(綠色)。通過Tajima's D信號(hào),分析了大豆沿全球擴(kuò)散路徑發(fā)生的適應(yīng)性選擇。結(jié)果表明,許多關(guān)鍵農(nóng)藝性狀基因,尤其與開花時(shí)間、生長(zhǎng)習(xí)性和品質(zhì)相關(guān)的基因,在不同地理區(qū)域經(jīng)歷了差異化選擇(圖4A),緯度適應(yīng)是其中的一個(gè)典型特征。以開花期主效基因E2為例,GWAS分析證實(shí)其為緯度適應(yīng)的關(guān)鍵QTL(圖4B),其不同單倍型(Hap1/Hap2)分別在高、低緯度地區(qū)富集(圖4C)。
定向選擇與平衡選擇在促進(jìn)植物適應(yīng)方面也發(fā)揮了重要作用。利用Tajima's D統(tǒng)計(jì)量,鑒定出大量受平衡選擇的基因(圖4D)。在大豆開花網(wǎng)絡(luò)中起關(guān)鍵調(diào)節(jié)作用的基因中:多個(gè)開花促進(jìn)因子(如FT2a/E9)受到定向選擇,以確保開花基礎(chǔ)的穩(wěn)定性;而多個(gè)開花抑制因子(如FT1a)則受到平衡選擇,靈活調(diào)整開花時(shí)間(圖4E)。這種“定向選擇固定主效基因、平衡選擇維持調(diào)控靈活性”的模式,可能是大豆廣泛適應(yīng)性的重要遺傳基礎(chǔ)。

中國(guó)不同時(shí)期育種過程中的選擇
通過對(duì)不同時(shí)期大豆的百粒重、蛋白質(zhì)含量及油脂含量進(jìn)行對(duì)比分析,根據(jù)這些特征的差異程度,將大豆品種劃分為四個(gè)時(shí)期組別:1960年前(n =157)、?1960-1980年(n =275)、1980-2000年(n =479)及2000-2020年(n =608)。1960年至1980年期間蛋白質(zhì)含量略有增加,油含量下降。此后,百粒重和油含量持續(xù)增加,蛋白質(zhì)含量顯著下降(圖5A)。性狀變化表明大豆育種重點(diǎn)發(fā)生了轉(zhuǎn)變,最初側(cè)重于高蛋白品種,隨后在后期階段重點(diǎn)轉(zhuǎn)向培育高產(chǎn)和高油大豆品種,與市場(chǎng)需求變化吻合。對(duì)四個(gè)時(shí)期的遺傳選擇進(jìn)行了比較分析,整個(gè)育種歷史中存在大量選擇性清除區(qū)域(圖5B),與產(chǎn)量相關(guān)的基因選擇壓力在后期增強(qiáng),比如育種策略從選擇大粒相關(guān)基因(如GmCYP78A10)轉(zhuǎn)向優(yōu)化株型基因(如SPL9c)。
油脂和蛋白質(zhì)含量呈顯著負(fù)相關(guān)(圖5C),但協(xié)同改良二者是育種的理想目標(biāo)。為發(fā)掘關(guān)鍵基因,以“總油+蛋白含量”為性狀進(jìn)行GWAS分析,在13號(hào)染色體上發(fā)現(xiàn)了一個(gè)候選基因GmSWEET30a(圖5D和5E)。進(jìn)一步研究發(fā)現(xiàn),GmSWEET30a啟動(dòng)子區(qū)的一個(gè)優(yōu)異單倍型(Hap2)能顯著提升“總油+蛋白”含量 (圖5F)。分子實(shí)驗(yàn)證實(shí),Hap2啟動(dòng)子具有更強(qiáng)的轉(zhuǎn)錄活性(圖5G)。通過CRISPR-Cas9基因敲除技術(shù),證明GmSWEET30a及其同源基因GmSWEET30b是協(xié)同調(diào)控大豆油分和蛋白質(zhì)積累的關(guān)鍵正向調(diào)控因子,敲除后“總油+蛋白”含量顯著下降 (圖5H)。這一發(fā)現(xiàn)為打破油分-蛋白負(fù)相關(guān)、實(shí)現(xiàn)協(xié)同改良提供了寶貴的基因資源和育種靶點(diǎn)。

受選擇基因的遺傳變異數(shù)據(jù)庫
為指導(dǎo)未來育種,本研究構(gòu)建了一個(gè)關(guān)鍵基因變異數(shù)據(jù)庫,并分析了223份中國(guó)核心骨干親本的單倍型分布。分析發(fā)現(xiàn),雖然部分產(chǎn)量(如BIGSEEDS1)和品質(zhì)(如GmSWEET10a)基因的優(yōu)異等位基因已被高度固定,但GmSSS1(籽粒大?。mZF392(油脂)等基因仍存在巨大的遺傳改良潛力(圖6A)。
現(xiàn)代育種的強(qiáng)選擇壓力也帶來了負(fù)面影響?,F(xiàn)代大豆育種中對(duì)高產(chǎn)、抗病和高油含量的重視導(dǎo)致了這223個(gè)骨干親本品種的遺傳多態(tài)性降低(圖6B)。I位點(diǎn)是種皮顏色的主要決定因素(圖6C),它與Rhg4(是賦予大豆抗胞囊線蟲病的重要基因,圖6D)在物理位置上緊密相鄰。在大豆馴化和改良過程中對(duì)黃色種皮顏色的選擇導(dǎo)致了栽培大豆中Rhg4優(yōu)良單倍型(Hap4)由于遺傳累贅而丟失(圖6E和6F),這解釋了黑豆通常具有更強(qiáng)抗性的現(xiàn)象。

PART.03總結(jié)
研究系統(tǒng)分析了8105份大豆材料的進(jìn)化關(guān)系和群體結(jié)構(gòu),發(fā)現(xiàn)黑豆是大豆逐步馴化過程中的進(jìn)化中間體。
研究提出了大豆兩個(gè)獨(dú)立的馴化中心假說,發(fā)現(xiàn)黑豆可以分為兩個(gè)主要分支(分支1和分支2),分支1主要分布于中國(guó)的黃淮海地區(qū),分支2主要分布于中國(guó)的西北地區(qū)(山西、陜西)。
研究系統(tǒng)分析了大豆傳播與改良過程中的時(shí)空基因選擇,挖掘到大量與生態(tài)適應(yīng)性、生產(chǎn)特性分化相關(guān)的選擇基因。
研究構(gòu)建了在線數(shù)量性狀核苷酸文庫和變異圖譜數(shù)據(jù)庫,為指導(dǎo)育種策略提供了關(guān)鍵資源。