16S測(cè)序分析(六)用PICRUSt預(yù)測(cè)菌群KEGG代謝通路

導(dǎo)讀

PICRUSt (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 的原理基于已測(cè)細(xì)菌基因組的16S rRNA全長(zhǎng)序列,推斷它們的共同祖先的基因(同源基因)功能譜,對(duì)Greengenes數(shù)據(jù)庫(kù)中其它未測(cè)物種的基因功能譜進(jìn)行推斷,構(gòu)建古菌和細(xì)菌域全譜系的基因功能預(yù)測(cè)譜,最后,將測(cè)序得到的菌群組成“映射”到數(shù)據(jù)庫(kù)中,對(duì)菌群代謝功能進(jìn)行預(yù)測(cè)。

文獻(xiàn):
Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 2013

一、數(shù)據(jù)準(zhǔn)備

1 QIIME2 DADA2分析的輸出文件

1.1 rep-seqs.qza ## 代表性序列
1.2 table.qza ## 代表性序列豐度表,如下:

(導(dǎo)出qza文件的方法將在下面介紹)

2. Greengene細(xì)菌模板數(shù)據(jù)

下載地址:https://docs.qiime2.org/2019.1/data-resources/

下載得到gg_13_5_otus.tar.gz(最新版,大小為304M)后將其解壓得到97_otus.fasta(最新版,大小約為139M),文件獲取如下:

二、工作流程

1. 格式轉(zhuǎn)換

將97_otus.fasta命名為gg_13_5_97_otus.fasta,并將其格式轉(zhuǎn)化成QIIME2 qza格式

qiime tools import \
 --type 'FeatureData[Sequence]' \
 --input-path gg_13_5_97_otus.fasta \
 --output-path gg_13_5_97_otus.qza

2. 聚類(lèi)

參考QIIME2官方文檔:https://docs.qiime2.org/2018.8/tutorials/otu-clustering/

qiime vsearch cluster-features-closed-reference \
 --i-sequences rep-seqs.qza \
 --i-table table.qza \
 --i-reference-sequences gg_13_5_97_otus.qza \
 --p-perc-identity 0.97 \
 --p-threads 10 \
 --output-dir picrust/closed_ref_97_otu

3. 將qza格式轉(zhuǎn)換biom格式

qiime tools export --input-path closed_ref_*_otu/clustered_table.qza --output-path closed_ref_*_otu/

4. 將biom格式轉(zhuǎn)成tsv格式

biom convert --to-tsv -i feature-table.biom -o feature-table.tsv

這樣就得到了OTU豐度表feature-table.tsv。接下來(lái)用PICRUSt(網(wǎng)址:http://huttenhower.sph.harvard.edu/galaxy/)進(jìn)行在線菌群代謝功能預(yù)測(cè),步驟如下:

三、PICRUSt預(yù)測(cè)菌群KEGG通路

1 上傳數(shù)據(jù)

1.1 點(diǎn)擊上傳控件

1.2 選擇上傳格式和需要上傳的本地文件;點(diǎn)擊Start開(kāi)始上傳;點(diǎn)擊Close返回

2 數(shù)據(jù)標(biāo)準(zhǔn)化

按如下操作:

3 KEGG代謝通路預(yù)測(cè)

按如下要求操作:

4 功能分類(lèi)

按如下要求操作:

5 下載預(yù)測(cè)結(jié)果

6 菌群KEGG預(yù)測(cè)結(jié)果

相關(guān)閱讀:
16S測(cè)序分析(一)菌屬豐度表獲取
16S測(cè)序分析(二)菌群多樣性分析
16S測(cè)序分析(三)用LEfSe尋找組間差異細(xì)菌
16S測(cè)序分析(四)用MaAsLin尋找組間差異細(xì)菌
16S測(cè)序分析(五)用RandomForest尋找關(guān)鍵細(xì)菌

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容