mSystems | 大規(guī)模宏基因組組裝揭示了新的動(dòng)物相關(guān)微生物基因組、生物合成基因簇和其他遺傳多樣性

文獻(xiàn)信息:

標(biāo)題:Large-Scale Metagenome Assembly Reveals Novel Animal-Associated Microbial Genomes, Biosynthetic Gene Clusters, and Other Genetic Diversity
中文:大規(guī)模宏基因組組裝揭示了新的動(dòng)物相關(guān)微生物基因組、生物合成基因簇和其他遺傳多樣性
雜志:msystems
時(shí)間:2020.12.22
單位:Max Planck Institute for Developmental Biology

摘要:

人類微生物群落的大規(guī)模宏基因組組合產(chǎn)生了大量以前未見(jiàn)過(guò)的微生物基因組;然而,微生物基因組相對(duì)很少來(lái)自其他脊椎動(dòng)物。在這里,我們從代表5類的180個(gè)主要野生動(dòng)物物種的腸道元基因組中生成了5596個(gè)元基因組組裝的基因組MAG,此外還有14個(gè)現(xiàn)有的動(dòng)物腸道元基因組數(shù)據(jù)集。這些MAGs包括1522個(gè)物種級(jí)基因組箱(SGBs);其中大多數(shù)在種、屬或科水平上是新的,大多數(shù)在宿主相對(duì)環(huán)境元基因組中富集。在宿主或環(huán)境生物群落中富集的SGBs有許多特征,包括抗菌素抗性基因的數(shù)量。我們鑒定了1986種不同的生物合成基因簇;只有23個(gè)簇有MIBiG數(shù)據(jù)庫(kù)注釋信息?;诨虻难b配揭示了巨大的基因多樣性,其中很多是宿主或環(huán)境特有的。我們的MAG和基因數(shù)據(jù)集極大地?cái)U(kuò)展了微生物基因組庫(kù),并提供了微生物適應(yīng)脊椎動(dòng)物腸道的廣闊視野。

MIBiG數(shù)據(jù)庫(kù)

一、unmapped reads

大量的unmapped reads,即使在使用多個(gè)綜合的宏基因組分析數(shù)據(jù)庫(kù)時(shí)也是如此。通過(guò)http://timetree.org獲得了較早的寄主種系統(tǒng)發(fā)育,分枝按寄主類著色。從內(nèi)環(huán)到外環(huán),映射到樹(shù)上的數(shù)據(jù)包括寄主的飲食、寄主圈養(yǎng)/野生狀態(tài),以及映射到不同寄主特定、非微生物和微生物數(shù)據(jù)庫(kù)的元基因組reads的平均值。注意,圈養(yǎng)/野生狀態(tài)有時(shí)會(huì)因同一物種的個(gè)體而有所不同。的數(shù)據(jù)庫(kù)(i)代表每一個(gè)公開(kāi)可用的宿主物種的基因組(“脊椎動(dòng)物門宿主基因組”),(2)中的所有條目NCBI核苷酸(nt)數(shù)據(jù)庫(kù)與分類識(shí)別匹配主機(jī)物種(脊椎動(dòng)物門主機(jī)nt),(3)一樣的以前的類別,但是與所有脊椎動(dòng)物門序列包括(iv) Kraken2“植物”數(shù)據(jù)庫(kù),(v) Kraken2“真菌”數(shù)據(jù)庫(kù),(vi) Kraken2“原生動(dòng)物”數(shù)據(jù)庫(kù),和(vii)自定義的細(xì)菌和古細(xì)菌數(shù)據(jù)庫(kù)創(chuàng)建的基因組分類學(xué)數(shù)據(jù)庫(kù),第89版(“GTDB-r89”)。讀取按鍵中顯示的順序(從上到下)迭代地映射到每個(gè)數(shù)據(jù)庫(kù),只在下一次迭代中包含unmapped reads?!拔捶诸悺眗eads不映射到任何數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)與到GTDB-r89的讀取映射一起用于下游分析(“微生物+未分類”)。

二、1522個(gè)SGBs的系統(tǒng)發(fā)育樹(shù)

所有1522個(gè)SGBs的系統(tǒng)發(fā)育。從最內(nèi)環(huán)到最外環(huán),映射到系統(tǒng)發(fā)育的數(shù)據(jù)為GTDB門級(jí)分類、放線菌綱級(jí)分類、厚壁菌門綱級(jí)分類、變形桿菌綱級(jí)分類、分類新穎性、宿主腸道或環(huán)境元基因組的顯著富集、在我們的多物種腸道元基因組數(shù)據(jù)集中,哺乳動(dòng)物和其他動(dòng)物腸道元基因組數(shù)據(jù)顯著豐富。系統(tǒng)發(fā)育是通過(guò)PhyloPhlAn從多個(gè)保守的基因座中推斷出來(lái)的。系統(tǒng)發(fā)育過(guò)程中的橙色點(diǎn)表示0.7到1之間的bootstrap值。系統(tǒng)發(fā)育的基礎(chǔ)是古菌和細(xì)菌的最后一個(gè)共同祖先。

三、來(lái)源、富集、性狀

A)從MGnify數(shù)據(jù)庫(kù)中選擇的我們的多環(huán)境元基因組數(shù)據(jù)集,每個(gè)生物群落的樣本數(shù)量的總結(jié)。B) SGBs的數(shù)量在宿主中相對(duì)豐度中顯著富集(log2 fold正變化;“l(fā)2fc”)環(huán)境元基因組(負(fù)l2fc)。圖中顯示的值是生物群系中顯著富集的(藍(lán)色)和不顯著的(紅色)MAGs的數(shù)量。C)富含宿主和環(huán)境的SGBs具有明顯的特征。通過(guò)MAG基因含量(Traitar 26)預(yù)測(cè)的SGBs表型被總結(jié)為在宿主或環(huán)境元基因組中顯著富集(DESeq2 Adj. P < 0.01)或兩種生物群系(x軸小面“neither”)的SGBs。注意x軸刻度的不同。星號(hào)表示表型在特定生物群系的SGBs中更為普遍,而在1000個(gè)排列的空白模型中,SGBs之間的生物群系標(biāo)簽被打亂。所有DESeq2結(jié)果見(jiàn)表S3A。

來(lái)源分析:?
MGnify: the microbiome analysis resource in 2020

性狀推測(cè):
From Genomes to Phenotypes: Traitar, the Microbial Trait Analyzer

四、系統(tǒng)發(fā)生樹(shù)和次生代謝簇

MAGs reveal novel secondary metabolite diversity

所有經(jīng)AntiSMASH鑒定的BGCs≥3的SGBs (n = 233)的系統(tǒng)發(fā)育。從最外層環(huán),數(shù)據(jù)映射到系統(tǒng)(i) GTDB phylum-level分類學(xué)分類,(ii)分類新奇,(3)主機(jī)或顯著富集環(huán)境基因組(iv)的患病率BGC家庭整個(gè)multispecies metagenome數(shù)據(jù)集,和(v) BGC的數(shù)量確定的雜志,患病率是最大BGC家庭BGC類型,和只有BGC家庭流行率≥25%。系統(tǒng)發(fā)育是經(jīng)過(guò)修剪的版本,如圖2所示。系統(tǒng)發(fā)育過(guò)程中的橙色點(diǎn)表示0.7到1之間的bootstrap值?!癗PRS”、“PKS”和“RiPPs”分別代表非核糖體肽合成酶、聚酮肽合成酶和核糖體合成和翻譯后修飾肽。

五、基于基因的宏基因組組裝序列cluster分析

Large-scale gene-based metagenome assembly reveals novel diversity

從combined數(shù)據(jù)集進(jìn)性基于基因的宏基因組組裝產(chǎn)生50%序列一致性cluster。A)每個(gè)門的基因簇總數(shù)。為清楚起見(jiàn),只顯示cluster≥100的門。每個(gè)欄上的標(biāo)簽列出了cluster的數(shù)量(以及占總數(shù)的百分比)。B)每門和COG類細(xì)菌基因簇?cái)?shù)。小面標(biāo)簽“P”指的是“特征不佳”。C)每類(均屬于廣古菌屬)和COG類的古菌基因簇?cái)?shù)。D)每個(gè)COG類的病毒基因簇?cái)?shù)。E)每個(gè)家族標(biāo)注的簇?cái)?shù)。為清楚起見(jiàn),只顯示cluster≥100的門。每個(gè)條旁邊的標(biāo)簽表示集群的數(shù)量。按門分類的每個(gè)家族的簇?cái)?shù)。CAZy科和門是由多數(shù)到最少的cluster數(shù)量。為清楚起見(jiàn),只顯示cluster≥100的CAZy科和門。

參考:Protein-level assembly increases protein sequence recovery from metagenomic samples manyfold. Nat. Methods 2019

六、Biome enrichment of gene clusters from specific phyla

A) COG類B) KEGG通路或C) CAZy家族的基因簇富集。只顯示了兩個(gè)生物群系中豐度顯著豐富的分組(DESeq2, adj. P < 1e-5)。只有在至少25%的元基因組中觀察到的基因簇被包括在內(nèi)。為了清晰起見(jiàn),只顯示了>7門富集的KEGG通路,只顯示了>1門富集的CAZy科。注意,坐標(biāo)軸在B)相對(duì)于A)和C)中翻轉(zhuǎn)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容