文獻信息:
標(biāo)題:Improved metagenome binning and assembly using deep variational autoencoders
中文:深度變分自編碼改進宏基因組分箱和組裝
雜志:NBT
時間:2021.1.4
摘要:
盡管近年來在宏基因組分類方面取得了進展,但從宏基因組數(shù)據(jù)中重建微生物物種仍然具有挑戰(zhàn)性。在這里,我們開發(fā)了用于宏基因組分類的變分自編碼器(VAMB),該程序使用深度變分自編碼器在聚類之前對序列co豐度和k-mer分布信息進行編碼。我們證明了一個變分自編碼器能夠整合這兩種不同的數(shù)據(jù)類型,而不需要任何先前的數(shù)據(jù)集知識。VAMB優(yōu)于現(xiàn)有的最先進的binners,分別在模擬和真實數(shù)據(jù)上重建29-98%和45%更接近完整(NC)的基因組。此外,VAMB能夠從1000個人類腸道微生物組樣本中分離出緊密相關(guān)的菌株,平均核苷酸同源性(ANI)高達99.5%,并重構(gòu)了255個和91個NC型vulgatus和dorei Bacteroides樣本特異性基因組,形成兩個不同的集群。我們使用來自該數(shù)據(jù)集的2606個NC箱顯示人類腸道微生物組的物種具有不同的地理分布模式。