PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一款基于標(biāo)記基因序列來預(yù)測功能豐度的軟件。
“功能”通常指的是基因家族,如KEGG同源基因和酶分類號,但可以預(yù)測任何一個任意的特性。同樣,預(yù)測通?;?6S rRNA基因測序數(shù)據(jù),但也可以使用其他標(biāo)記基因。
在這個幫助文檔中,您可以找到腳本、安裝說明和工作流的描述。有關(guān)詳細信息,請參見github wiki的右側(cè)欄。
PICRUSt2包括這些改進以及與原始版本相比的其他改進:
- 允許用戶預(yù)測任何16S序列的功能。來自O(shè)TU或擴增序列變體(amplicon sequence variants,ASV,例如DADA2和Deblur輸出)的代表性序列可通過序列放置方法用作輸入。
- 用于預(yù)測的參考基因組數(shù)據(jù)庫擴大了10倍以上。
- 從Castor R包中添加隱藏狀態(tài)預(yù)測算法。
- 允許輸出MetaCyc 本體預(yù)測,這將可與普通宏基因組學(xué)的結(jié)果比較。
- 通路豐度的推斷現(xiàn)在依賴于MinPath,這使得這些預(yù)測更加嚴格。
Installing
conda create -n picrust2 -c bioconda -c conda-forge picrust2=2.3.0_b
conda activate picrust2
FlowCharts

PICRUST2
Run Script
The entire PICRUSt2 pipeline can be run using a single script, called picrust2_pipeline.py. This script will run each of the 4 key steps outlined on this wiki: (1) sequence placement, (2) hidden-state prediction of genomes, (3) metagenome prediction, (4) pathway-level predictions.
picrust2_pipeline.py -s study_seqs.fna -i study_seqs.biom -o picrust2_out_pipeline -p 1
參考:
https://blog.csdn.net/woodcorpse/article/details/89302863
https://github.com/picrust/picrust2/wiki/Installation