今天根據(jù)NC大作1143份秈稻測序數(shù)據(jù)進行callsnp操作記錄
?1-下載SRA文件
prefetch --option-file SRR_Acc_List.all.txt
有時候我們選擇用迅雷下載時需要添加后綴
for file in SRR*;do mv $file $file".sra";done
2-解壓sra文件
for file in SRR*;do fasterq-dump -e 30 -b 100MB -c 200MB -m 2000MB --split-3 $file;done?
3-生成bam文件
bwa mem -t 10 nip_all.chrs.con.fasta sra1_1.fastq sra1_2.fastq | samtools view -bS -@ 10 -o sra1.bam
4-排序
for file in *.bam;do samtools sort $file -@ 5 -o $file"sorted.bam";done
5-callsnp
bcftools mpileup -Ou -f nip_all.chrs.con.fasta sra1.sorted.bam | bcftools call -vm -Oz -o sra1.sorted.bam.vcf.gz
6-合并vcf文件
建立索引?bcftools index sra1.sorted.bam.vcf.gz
合并?bcftools merge *vcf.gz -Oz -o merged.vcf.gz
最終結(jié)果包含了SNP和Indel信息。