倒騰學(xué)習(xí)了一段時(shí)間的qiime1和qiime2,決定苦心整理一下學(xué)習(xí)成果。雖然不知道啥時(shí)候才能更完。主要參考下述網(wǎng)站的分析流程:https://twbattaglia.gitbooks.io/introduction-to-qiime/content/macqiime.html 但是會(huì)增加一些關(guān)于R繪圖相關(guān)的。
Overview
本系列將分成以下幾個(gè)部分:
- 處理加工FASTQ序列文件生成OTU table
- OTU table的處理
-
Alpha多樣性分析:
Alpha Rarefaction,計(jì)算 Alpha Diversity -
Beta多樣性分析:
計(jì)算 Beta多樣性,距離箱形圖,PCoA -
分類學(xué)組成和豐度:
Taxa Summary圖,豐度差異,關(guān)聯(lián)性分析,核心物種分析 - 預(yù)測16S宏基因組數(shù)據(jù)的功能(PICRUSt)
- 線性判別分析效應(yīng)(LEfSe)
Before Getting Started
1、理解16S rRNA data
OTU是什么?
OTU(operational taxonomic units),即操作分類單元。通過一定的距離度量方法計(jì)算兩兩不同序列之間的距離度量或相似性,繼而設(shè)置特定的分類閾值,獲得同一閾值下的距離矩陣,進(jìn)行聚類操作,形成不同的分類單元。
具體詳解可以參考這個(gè)帖子:http://www.dxy.cn/bbs/topic/35655953
與Qiime相關(guān)的文章
- Conducting a Microbiome Study
- QIIME allows analysis of high-throughput community sequencing data
- Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample
- Quality-filtering vastly improves diversity estimates from Illumina amplicon sequencing
- Advancing our understanding of the human microbiome using QIIME
- Stability of operational taxonomic units: an important but neglected property for analyzing microbial diversity
- Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible
- Robust methods for differential abundance analysis in marker gene surveys
Alpha多樣性
- Kumar-UAB Diversity Presentation
- An Introduction to Applied Bioinformatics
- Wikipedia Diversity Index Entry
- Measurements of Biodiversity
- Measuring the diversity of a single community
- Werner Lab QIIME Overview
- Coloss Honey Bee Research Association
- Wikipedia Rarefaction Entry
2、常用命令
在使用qiime的過程中我們需要了解一些基本的命令,以及命令的格式:
查看命令幫助 command_name.py -h
列出文件 ls
讀取和運(yùn)行命令的基本格式 scriptname.py -i input_file.txt -o output_folder
切換工作目錄 cd / cd ..
創(chuàng)建目錄 mkdir
新建txt文件 touch new_file.txt
給文件/文件夾命名的是時(shí)候避免使用空格,可以用下滑線_替代
使用斜杠符號(hào)\使長命令可讀性增加
安裝wget命令
# 檢查wget是否安裝
wget --version
# 安裝wget(如果需要)
sudo easy_install wget
3、務(wù)必記錄你的所有命令
前人血淚教訓(xùn),因?yàn)槲覀儠?huì)對(duì)OTU table執(zhí)行不同的操作,比如過濾等等,所以為了能夠確保有跡可循,所以請(qǐng)記錄你在分析過程中的所有命令
你可以記錄在Sublime等編輯器里或者新建一個(gè)txt文件
一個(gè)典型命令的記錄方式(記得寫注釋):
# Keep only the time point 'Day 28' in a new biom and mapping files.
filter_samples_from_otu_table.py \
-i otu_table.biom \
-o otu_table_noday0.biom \
-m mapping_file.txt \
-s 'Day:28'
4、Qiime1的常用文件
- 16s_pickotu_param.txt - Parameters text file for OTU picking. 提取OTU時(shí)的參數(shù)文件
- otu_table.biom - Processed OTU table for running most analyses.用于后續(xù)分析的OTU table
- mapping_file.txt - A metadata file corresponding to the OTU table. metadata文件,說明樣本情況
- rep_set.tre - A phylogenetic tree corresponding to the OTU table.基于OTU table的系統(tǒng)發(fā)育樹文件
- rep_set.fna - A file of representative sequences corresponding to the OTU table. 基于 OTU table的代表序列文件