參考基因組新時(shí)代 — “單倍型”參考基因組

高雜合、多倍體一直是組裝中的難點(diǎn),以往的做法就是構(gòu)建單倍體或雙單倍材料(double-haploid )來(lái)進(jìn)行組裝,但同時(shí)也沒(méi)有辦法獲得全面的基因信息。目前主流的組裝算法傾向于將雜合 / 同源區(qū)域整合,得到的組裝結(jié)果為 haploid consensus 或者 monoploid。為了深入研究的需要,更多的物種需要將來(lái)自父母的遺傳信息都獲得,因此參考基因 組就需要獲得兩個(gè)單倍體基因組,也就是“單倍型”參考基因組(Haplotype-resolved genome 或 Phased diploid genome)。如今近期多篇文章都用到“單倍型”參考基因組解決生物學(xué)問(wèn)題,同時(shí)多倍體物種組裝方法,與組裝“單倍型”參考基因組在原理上也有著相互借鑒的地方。

案例一

Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication

蘋果(Malus domestica Borkh。)是一種受歡迎的溫帶水果,其馴化由不同野生物種的雜交和具有理想性狀的基因型的無(wú)性繁殖組成。因此蘋果具有高雜合的基因組特征,目前已有的蘋果參考基因組,對(duì)于蘋果育種工作,蘋果馴化研究有一定局限性。

因此本文對(duì)M. domestica?cv.?Gala、M. sieversiiM. sylvestris分別構(gòu)建不同長(zhǎng)度的Illumina paired-end和mate-pair文庫(kù)、10x?Genomics和PacBio HiFi文庫(kù)。Illumina和10x Genomics文庫(kù)測(cè)序數(shù)據(jù),使用DeNovoMAGIC3?組裝,產(chǎn)生一個(gè)定相二倍體組裝和一個(gè)未定相的組裝;PacBio HiFi文庫(kù)測(cè)序數(shù)據(jù),使用Hifiiasm和HiCanu組裝;以上組裝版本,結(jié)合 遺傳圖譜數(shù)據(jù)和已發(fā)表基因組的共線性信息,對(duì) Scaffolds 進(jìn)行掛載。

圖1 “單倍型”蘋果組裝流程圖

表1 “單倍型”蘋果組裝結(jié)果

從上述結(jié)果可以看出,研究者組裝出單倍型基因組為 1.31-1.32 Gb,是不進(jìn)行單倍型區(qū)分的基因組序列的兩倍。盡管雜 合度很高,但所有樣本的組裝結(jié)果都有很高的連續(xù)性,單倍型組裝結(jié)果的 contig N50 為 1.2-1.9 Mb,scaffold N50 為 3.3-4.2 Mb。同時(shí)可以發(fā)現(xiàn),PacBio HiFi 數(shù)據(jù)在高雜合組裝中對(duì)連續(xù)性有非常顯著的提升。

案例二

Haplotype-resolved genome analyses of a heterozygous diploid potato

栽培馬鈴薯是同源四倍體,主要靠薯塊進(jìn)行無(wú)性繁殖。這些特點(diǎn)使得馬鈴薯的基因組高度雜合,有害等位基因隱藏在四套染色體中,而優(yōu)良基因的聚合要依靠復(fù)雜的遺傳重組,導(dǎo)致馬鈴薯品種改良周期漫長(zhǎng)。

本篇文章研究者利用Illumina 測(cè)序、10x Genomics (10xG) linked-read 測(cè)序、ONT 測(cè)序、PacBio-CCS測(cè)序、Hi-C 技術(shù)、遺傳圖譜數(shù)據(jù),相互整合最終得到雜合二倍體馬鈴薯的兩套染色體的基因組序列,完成了單倍體組裝。

圖2 組裝流程圖

表2?組裝結(jié)果

案例三

Assembly of whole-chromosome pseudomolecules for polyploid plant genomes using outbred mapping populations

本研究報(bào)道了一種新的軟件:PolyGembler (polyploid genetic linkage assembler), 該方法是通過(guò)遺傳連鎖分析將contigs 分組和排序獲得染色體序列(pseudomolecules) 的方法。同時(shí)本方法也可以來(lái)檢測(cè)和修復(fù)組裝中的錯(cuò)誤。使用該方法,本文作者結(jié)合RAD-seq數(shù)據(jù),對(duì)已發(fā)表的結(jié)縷草(Zoysia japonica?)進(jìn)行了多倍體拆分。此外,本研究還解決了已發(fā)表的二倍體甘薯(Ipomoea trifida)基因組組裝的13個(gè)組裝錯(cuò)誤。

圖3 PolyGembler 解決方案框架圖

通過(guò)上文三個(gè)案例,可以發(fā)現(xiàn)“單倍型”參考基因組解決方案不再局限于利用不同平臺(tái)/文庫(kù)測(cè)序數(shù)據(jù)和組裝軟件算法,更多的是和重測(cè)序分析中的遺傳圖譜信息相結(jié)合,借用SNP信息反過(guò)給出scaffold定相信息或contig分組信息。

“單倍型”參考基因組在基因組進(jìn)化,物種馴化育種,甚至性染色體研究中有著一定的必要性,也是獲得更全面的基因組信息的必要條件。新時(shí)代來(lái)了,諾禾致源的科技服務(wù)一直在與時(shí)俱進(jìn),后續(xù)最新進(jìn)展也會(huì)實(shí)時(shí)更新,敬請(qǐng)期待。

圖4?“單倍型“組裝常規(guī)思路(來(lái)自案例二)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容