PICRUSt2安裝及對16s數(shù)據(jù)進(jìn)行功能預(yù)測

1.PICRUSt簡介

PICRUSt全稱為Phylogenetic Investigationof Communities by Reconstruction of Unobserved States,由Langille等人于2013年開發(fā),文章發(fā)表在Nature Biotechnology上(Langille et al. 2013)。它是最早被開發(fā)的基于16S rRNA基因序列預(yù)測微生物群落功能的工具,包括在線版(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)和基于MacOS X或Linux系統(tǒng)的下載安裝版(http://picrust.github.io/picrust/install.html#install)。

原理

如圖1所示,其預(yù)測過程分兩步:

(1)基因內(nèi)容預(yù)測(gene content inference)。該步先對Greengenes數(shù)據(jù)庫的“closed reference”序列劃分OTU后構(gòu)建進(jìn)化樹,通過祖先狀態(tài)重構(gòu)(Ancestralstate reconstruction)算法并結(jié)合IMG/M數(shù)據(jù)庫,預(yù)測出樹中未進(jìn)行全基因組測序OTU的基因組信息。

(2)宏基因組預(yù)測(metagenome inference。將16SrDNA測序結(jié)果與Greengenes數(shù)據(jù)庫進(jìn)行比對,挑選出與“closed reference”數(shù)據(jù)庫相似性高的(默認(rèn)為≥97%)OTU;根據(jù)OTU對應(yīng)基因組中16SrDNA的拷貝數(shù)信息,將每個OTU對應(yīng)序列數(shù)除以其16S拷貝數(shù)來進(jìn)行標(biāo)準(zhǔn)化;最后,將標(biāo)準(zhǔn)化的數(shù)據(jù)乘以其對應(yīng)的基因組中基因含量從而實(shí)現(xiàn)宏基因組預(yù)測的目的。獲得的預(yù)測結(jié)果可以通過KEGG Orthology、COGs或Pfams等對基因家族進(jìn)行分類。

2.在conda下picrust2的安裝

source activate qiime2-2018.8 #激活環(huán)境

conda install -c anaconda -c defaults-chttps://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda? ? -c https://conda.anaconda.org/biocore q2-fragment-insertion? #安裝fragment-insertion插件

conda install -c conda-forge -c bioconda -c gavinmdouglas q2-picrust2 #一步安裝

3.picrust2的使用

先進(jìn)行Vsearch,需要?table.qza,rep-seqs.qza,99-otu.qza文件,得到 table-cr-99.qza, rep-seqs-cr-99.qza,unmatched-cr-99.qza文件

qiime vsearch cluster-features-closed-reference \

? ? --i-table table.qza \

? ? --i-sequences rep-seqs.qza \

? ? --i-reference-sequences 99_otus.qza \

? ? --p-perc-identity 0.99 \

? ? --o-clustered-table table-cr-99.qza \

? ? --o-clustered-sequences rep-seqs-cr-99.qza \

? ? --o-unmatched-sequences unmatched-cr-99.qza

# preparative file: table-cr-99.qza,rep-seqs-cr-99.qza,reference.fna.qza,reference.tre.qza

qiime fragment-insertion sepp \

? ? ? ? ? --i-representative-sequences rep-seqs-cr-99.qza \

? ? ? ? ? --p-threads 1 \

? ? ? ? ? --i-reference-alignment reference.fna.qza \

? ? ? ? ? --i-reference-phylogeny reference.tre.qza \

? ? ? ? ? --output-dir tutorial_placed_out

qiime picrust2 custom-tree-pipeline \

? ? ? ? ? --i-table table-cr-99.qza \

? ? ? ? ? --i-tree tutorial_placed_out/tree.qza \

? ? ? ? ? --output-dir q2-picrust2_output \

? ? ? ? ? --p-threads 1 --p-hsp-method pic \

? ? ? ? ? --p-max-nsti 2

qiime feature-table summarize \

? ? ? ? ? --i-table q2-picrust2_output/pathway_abundance.qza \

? ? ? ? ? --o-visualization q2-picrust2_output/pathway_abundance.qzv

qiime diversity core-metrics \

? ? ? ? ? --i-table q2-picrust2_output/pathway_abundance.qza \

? ? ? ? ? --p-sampling-depth 3192 \? ? #根據(jù)最小樣本深度,在 table-cr-99.qza文件中找

? ? ? ? ? --m-metadata-file sample-metadata.tsv \

? ? ? ? ? --output-dir pathabun_core_metrics_out \

? ? ? ? ? --p-n-jobs 1

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容