基因組學深入挖掘·研究方案(上篇)

自20世紀末人類基因組被破譯以來,整個生命科學研究至今都處在“基因組浪潮”中。人們對生物的認識不再是簡單依據(jù)實驗觀測和描述,而是能夠通過基因組數(shù)據(jù)系統(tǒng)的深入解析內在規(guī)律[1]。近年來,隨著測序技術的不斷發(fā)展,科研工作者能夠更快更便捷的獲得更完整、質量更高的基因組參考序列,使得基因組的研究不再是“奢侈品”。早期較為“粗糙”的基因組正不斷迭代更新,而超大、超復雜物種也已逐漸被國內外學者一一破譯。同時,品種化、細致化、多樣化的研究需求,使得動植物基因組研究進入泛基因組時代。

基因組研究技術可為動植物序列多態(tài)性、物種栽培與馴化、基因定位、基因編輯、精細育種等提供精準信息。破譯基因組已逐漸成為一種基礎且必要的研究,但是如何才能對基因數(shù)據(jù)深入挖掘,又如何展開研究呢?

為了能更好的服務動植物基因組學上的研究,本次以系列高分文章作為切入點,以基因組為基礎結合轉錄組、代謝組、表觀遺傳、群體分析等多組學手段,整合最新多基因組聯(lián)合分析方式,通過相應的方案設計及研究方法進行概述。擬通過文中的方案適用范圍、分析流程及方法優(yōu)勢上讓更多基因組學相關研究者尋找到最適合自己的路徑。

方案一 基因組與轉錄組,深入挖掘基因表達信息

技術介紹

一個物種基因組的成千上萬個基因各司其職,在不同組織、時期、環(huán)境下表達,從而能夠翻譯出對應不同生長需求或不同環(huán)境條件的蛋白,達到生長發(fā)育或應急響應等目的?;虻谋磉_量常被用來定量評估基因的轉錄水平。【時空特異性、組織特異性

獲得高質量的基因組,將使多倍體高重復等復雜物種的轉錄分析準確性更高,研究結果更具可靠性。基因組結合轉錄組分析,使得基因功能研究不再僅僅依靠原來的RNA-seq水平的研究,可以從基因序列結合變異信息和基因表達共同研究生物學問題,使問題研究更深入。

技術路線

適用范圍

  • 特異性狀 根源基因挖掘
  • 生長發(fā)育重要調控機理
  • 差異基因及調控網絡
  • 全基因組動態(tài)表達圖譜
  • 多倍體優(yōu)勢亞基因組探尋等

高分案例

植物案例
英文名:A mini foxtail millet with an Arabidopsis-like life cycle as a C4 model system[2]
中文名:一種類擬南芥生命周期可作為C4模型研究的小型谷子
期刊:Nature Plants(IF:13.256)
合作單位:山西農業(yè)大學

主要研究內容:
作者利用 EMS 誘變技術篩選到一個超早熟突變體“xiaomi ”。解決了谷子作為 C4禾谷類模式植物無法在室內大規(guī)模培養(yǎng)的難題。在此基礎上,高質量參考基因組(組裝出 429.94 Mb,其中 399.4 Mb 通過 Hi-C 錨定在 9 條染色體上(掛載率~93%)。BUSCO 評估結果為 97.78%)。“小米”品種間變異分析比較(SNP、InDel、PAV、特有基因)結合健全的生育期基因表達圖譜和谷子多組學數(shù)據(jù)庫(http://sky.sxau.edu.cn/MDSi.htm),快捷、高效穩(wěn)定的農桿菌轉化體系極大地方便了“小米”功能基因組學研究。

動物案例
英文名:Genomic and transcriptomic insights into molecular basis of sexually dimorphic nuptial spines in Leptobrachium leishanense[3]
中文名:雷山髭蟾角質刺形成分子基礎的基因組及轉錄組學研究
期刊:Nature Communications(IF:12.121)
合作單位:華中師范大學

主要研究內容:
作者以雷山髭蟾為研究對象,通過PacBio+Hi-C技術組裝出 3.54 Gb 基因組,contig N50為1.93 Mb,scaffold N50=395 Mb,通過比較基因組學分析及雌雄個體不同發(fā)育時期的有參轉錄組分析鑒定了一系列與角質刺性二態(tài)發(fā)育相關的生物學通路和關鍵基因。研究成果首次較全面地解析了兩棲動物性二態(tài)形成相關的重要生物學通路以及關鍵基因,彌補了相關研究的不足。該成果不僅為兩棲動物基因組數(shù)據(jù)庫提供了高質量的參考基因組,而且對于深入理解脊椎動物性二態(tài)形成及調控的分子機制具有重要意義。

方案二 基因組聯(lián)合代謝組與轉錄組鎖定關鍵通路

技術介紹
代謝組是指生物體內源性代謝物質的動態(tài)整體,而代謝組研究能更有效地揭示生物學過程及其生化、分子機理。差異積累的代謝物信息將輔助眾多基因進行”共表達”分析,揭示基因功能,并將基因與表型關聯(lián)起來。轉錄組和代謝組可以從大量轉錄組信息中發(fā)掘差異基因,快速判斷核心調控網絡和關鍵候選基因,闡述生物學機理?;蚪M結合轉錄組及代謝組,將系統(tǒng)的鎖定關鍵通路中的基因和代謝物

技術路線

適用范圍

  • 性狀遺傳改良
  • 確定代謝關鍵途徑
  • 蔬果花卉色澤營養(yǎng)
  • 合成代謝通路網絡搭建
  • 鑒定控制關鍵途徑的結構
  • 生長發(fā)育、抗逆及其生化、分子機理

高分案例

植物案例一
英文名:Genomes of the banyan tree and pollinator wasp provide insights into fig-wasp coevolution[4]
中文名:榕樹和榕小蜂的基因組為榕-蜂共生體系協(xié)同進化提供線索
期刊:Cell(IF:38.637)
合作單位:福建農林大學基因組研究中心

主要研究內容:
作者基于三代PacBio、Hi-C和遺傳圖譜等技術成功構建了2種榕樹和1種傳粉榕小蜂的高質量基因組(細葉榕426Mb,contigN50=908 Kb;對葉榕360 Mb,contigN50= 492 kb;榕小蜂387 Mb,contig N50=3.1 Mb)。比較基因組學研究發(fā)現(xiàn)兩種榕樹基因組存在大量的結構變異,為其適應性演化提供了遺傳基礎。并對榕樹氣生根、性別決定基因、榕樹進化、等進行研究。結合代謝組將榕果釋放揮發(fā)物質以及榕小蜂對這些物質的電生理測試闡明榕蜂共生體系專性協(xié)同進化。本次研究首次在基因組水平上揭示了榕-蜂共生體系在形態(tài)和生理方面的協(xié)同演化對雙方類群的協(xié)同多樣化的重要影響。

植物案例二
英文名:Musa balbisiana genome reveals subgenome evolution and functional divergence[5]
中文名:香蕉基因組揭示了亞基因組進化和功能分化
期刊:Nature Plants(IF:13.256)
合作單位:中國熱帶農業(yè)科學院

主要研究內容:
作者利用二代+三代+HI-C的測序技術,成功構建了高質量的香蕉B基因組的圖譜(492.77Mb,contig N50=1.83Mb),為進一步改良香蕉的農藝性狀奠定了基礎。香蕉A、B基因組的比較分析揭示了A、B基因組的分化特點;重測序數(shù)據(jù)分析,揭示了香蕉的遺傳多樣性及亞基因組功能分化;果實乙烯釋放量等代謝物的測定及不同果實成熟階段的香蕉的轉錄組分析結合香蕉的基因擴增和表達模式的研究發(fā)現(xiàn)了果實成熟的演變和調控特征。基于這些研究結果,將有助于香蕉新品種的育種策略。

方案三 基因組與群體進化,解析物種發(fā)展歷程

技術介紹
動植物特定群體的個體基因組之間往往會存在大量變異,如單核苷酸變異(SNP)、插入缺失變異(InDel)、結構變異(SV)等。自然群體區(qū)別于馴化栽培群體最大的特征是其豐富的遺傳多樣性,這些動植物往往經歷了種群的擴張、傳播、本地化適應、基因交流等長期馴化過程。利用基因組水平遺傳變異研究,可以更加準確和全面地解析動植物群體的系統(tǒng)發(fā)生關系及其結構、群體進化歷史、遺傳漸滲、馴化起源與人工選擇位點情況。該研究方案是目前廣受高分基因組學相關期刊“青睞”之一的研究策略。

技術路線

適用范圍

  • 不同群體分化歷程探究
  • 建立亞群間精確變異數(shù)據(jù)庫
  • 地域種、品系間基因滲透歷程
  • 動植物起源地、馴化與環(huán)境適應性研究
  • 挖掘與人工/自然選擇性狀相關基因位點

高分案例

植物案例
英文名:The bracteatus pineapple genome and domestication of clonally propagated crops[6]
中文名:紅苞鳳梨參考基因組及作物的無性繁殖馴化
期刊:Nature Genetics(IF:27.603)
合作單位:福建農林大學

主要研究內容:
作者對紅苞鳳梨(*Ananas comosus *var. bracteatus)的基因組進行了分析(60X Illumina+50X PacBio+Hi-C,組裝513Mb基因組,contig N50=427 Kb)并將之與80多個菠蘿栽培品種和野生祖先進行比較(重測序~17.5X Illumina), 追溯了菠蘿馴化史, 發(fā)現(xiàn)其既經歷了有性生殖過程,也有“一步到位”的無性繁殖過程, 還找到了基因組中與菠蘿特異農藝性狀相關的人工選擇區(qū)段, 為菠蘿的遺傳育種奠定了科學基礎。

動物案例
英文名:Genomic Consequences of Population Decline in Critically Endangered Pangolins and Their Demographic Histories[7]
中文名:瀕危物種穿山甲基因組學研究及種群研究
期刊:National Science Review(IF:16.693)
合作單位:云南大學

主要研究內容:
作者基于二代測序技術結合10X Genomics構建了高質量的穿山甲參考基因組(基因組大小MJ 2.45G;MP 2.40 G,scaffold N50分別為13.85和7.77Mb)。還通過73個馬來穿山甲和23個中華穿山甲重測序分析(12.12 -21.16X Illumina)進行變異檢測和群體結構分析、穿山甲遺傳多樣性分析及種群歷史動態(tài)分析等。提供了有關穿山甲種群數(shù)量長期波動的驅動因素和最近由于人類活動導致的種群數(shù)量減少的基因組影響的有價值的信息,這對穿山甲保護管理和全球行動規(guī)劃至關重要。

方案四 基因組結合GWAS與進化,探索重組遺傳效應

技術介紹
全基因組關聯(lián)分析(genome-wide association study,GWAS)是指全基因組水平分析各位點與復雜性狀遺傳變異的關聯(lián)強弱。GWAS無需構建群體,從自然界中采樣即可基于基因組數(shù)據(jù),充分利用群體進化過程中數(shù)千世代積累的重組事件,分析分子標記對表現(xiàn)型的遺傳效應。高質量的基因組聯(lián)合GWAS分析將使得復雜性狀的遺傳基礎得以剖析,也是目前廣受高分基因組學相關期刊“青睞”之一的研究策略。

技術路線

適用范圍

  • 研究物種染色體倍性一致
  • 未分化出明顯的不同群體結構
  • 研究群體樣本量較大(推薦≥200個)
  • 作物、果蔬、草本、林木花卉及水產家禽等物種性狀相關位點關聯(lián)

高分案例

植物案例
英文名:Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits[8]
中文名:以更新的亞洲棉 A 基因組為基礎的 243 份二倍體棉花的重要農藝性狀的研究
期刊:Nature Genetics(IF:27.603)
合作單位:中國農業(yè)科學院棉花研究所

主要研究內容:
作者通過PacBio+Hi-C技術進行基因組denovo,提升了亞洲棉的基因組組裝水平(組裝1.71 Gb,Contig N50=1.1 Mb)。然后通過群體進化分析發(fā)現(xiàn),亞洲棉和草棉與雷蒙德氏棉同時進行了分化,而亞洲棉起源于中國南部,隨后被引入長江和黃河地區(qū)。大多數(shù)與馴化相關的性狀都經歷了地理隔離。通過亞洲棉的GWAS分析,鑒定了11個重要農藝性狀的98個顯著關聯(lián)位點,并對脂肪酸合成、棉花枯萎病抗性、棉絨性狀的位點進行詳細分析。本研究對理解棉花A亞基因組的進化具有重要的意義。

動物案例
英文名:The evolutionary origin and domestication history of goldfish (Carassius auratus)[9]
中文名:金魚的進化起源和馴化史
期刊:PNAS(IF:9.412)
合作單位:福建農林大學&福建師范大學

主要研究內容:
作者通過PacBio+Hi-C組裝獲得了高質量的金魚基因組 (2n=100;組裝1.73 Gb,Scaffold N50= 606 Kb)的同時,通過比較基因組學研究解析了古代雜交事件產生了兩個亞基因組;進一步通過185條代表性金魚變種和16條野生鯽魚的重測序分析,揭示了金魚的起源,并鑒定了與馴化相關的受選擇基因區(qū)域。研究中全面收集了金魚品種,獲得了與眾多解剖特征相關遺傳變異信息,其中包括區(qū)分傳統(tǒng)金魚進化的特征。除此之外,鑒定了酪氨酸蛋白激酶受體作為透明突變體的候選基因。為金魚的基因組和多樣性數(shù)據(jù)提供了豐富的資源,使得金魚成為功能基因組學和馴化研究具前景的模型。

精彩不停歇由于文章篇幅有限,今天小編就叨叨到這里啦~其實動植物基因組學具有無限研究潛力,其分析意義已不僅在于文章的影響因子高低,更多的是如何完整的闡述一種生物現(xiàn)象,為生產育種以及物種保護提供重要的基礎理論以及獲取基因標記信息。

參考文獻:

[1] 樊龍江.植物基因組學[M].2020

[2] Zhirong Y, Haoshan Z, Xukai L et al.A mini foxtail millet with an Arabidopsis-like life cycle as a C4 model system . Nature Plants. 2020.

[3] Jun L, Haiyan Y, Wenxia W et al. Genomic and transcriptomic insights into molecular basis of sexually dimorphic nuptial spines in Leptobrachium leishanense. Nature Communications .2019.

[4] Zhang X,Wang G,Zhang S et al., Genomes of the Banyan Tree and Pollinator Wasp Provide Insights into Fig-Wasp Coevolution.Nature Genetics. 2020

[5] Wang, Z., Miao, H. et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019.

[6] Chen L Y , Vanburen R , Paris M ,* et al*. The bracteatus pineapple genome and domestication of clonally propagated crops. Nature Genetics, 2019.

[7] ing-Yang H , Zi-Qian H , Laurent F , et al. Genomic consequences of population decline in critically endangered pangolins and their demographic histories. National Science Review.2020

[8] X Du, G Huang, S He, et al. Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits. Nature Genetics. 2018

[9] Chen D, Zhang Q et al., The evolutionary origin and domestication history of goldfish (Carassius auratus).PNAS.2020

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容