1.構(gòu)建索引
$HISAT2_HOME/hisat2-build $HISAT2_HOME/example/reference/22_20-21M.fa \
--snp $HISAT2_HOME/example/reference/22_20-21M.snp 22_20-21M_snp
2.序列比對
a單端序列
$HISAT2_HOME/hisat2 -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-U HISAT2_HOME/example/reads/reads_1.fa \
-S eg1.sam
b雙端序列
$HISAT2_HOME/hisat2 -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-1 $HISAT2_HOME/example/reads/reads_1.fa \
-2 $HISAT2_HOME/example/reads/reads_2.fa \
-S eg2.sam
3.使用SAMtools/BCFtools進(jìn)行下游分析
SAMtools是一組用于操作和分析SAM和BAM比對文件的工具。BCFtools是一組用于calls變異和操作VCF和BCF文件的工具,它通常與SAMtools一起發(fā)布。同時使用這些工具允許您操作從SAM格式的比對到VCF格式的calls變異。本示例假設(shè)已經(jīng)安裝了samtools和bcftools,并且包含這些二進(jìn)制文件的目錄位于PATH環(huán)境變量中。
a?雙端序列比對
$HISAT2_HOME/hisat -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-1 $HISAT2_HOME/example/reads/reads_1.fa \
-2 $HISAT2_HOME/example/reads/reads_2.fa \
-S eg2.sam
b?SAM文件轉(zhuǎn)化為BAM文件
samtools view -bS eg2.sam > eg2.bam
c?將原始BAM文件轉(zhuǎn)化為排序過的sorted BAM文件
samtools sort eg2.bam -o eg2.sorted.bam
d?我們現(xiàn)在有一個已排序的BAM文件,名為eg2.sord.bam。bam文件是一種有用的格式,因為比對內(nèi)容是(a)壓縮的,這便于長期存儲,(b)是排過序的,這便于calls變異。要生成calls變異的VCF格式文件,請運行:
samtools mpileup -uf $HISAT2_HOME/example/reference/22_20-21M.fa eg2.sorted.bam | bcftools view -bvcg - > eg2.raw.bcf
e?要查看bcf格式文件
bcftools view eg2.raw.bcf