flags
1 0x1 這序列是PE雙端測(cè)序
2 0x2 這序列和參考序列完全匹配,沒(méi)有錯(cuò)配和缺失
4 0x4 這序列沒(méi)有mapping到參考序列上
8 0x8 這序列的mate序列沒(méi)有mapping到參考序列上
16 0x10 這序列比對(duì)到參考序列的負(fù)鏈上
32 0x20 這序列的mate序列比對(duì)到參考序列的負(fù)鏈上
64 0x40 這序列是read1
128 0x80 這序列是read2
256 0x100 這序列不是主要的比對(duì),因?yàn)樾蛄锌赡鼙葘?duì)到參考序列的多個(gè)位置上
512 0x200 這序列沒(méi)有通過(guò)QC
1024 0x400 這序列是PCR重復(fù)序列
2048 0x800 這序列是補(bǔ)充比對(duì)
1.查看
其中bam文件中用標(biāo)簽4代表read未比對(duì)上;所以查看未比對(duì)上的reads用
samtools view -f 4 *bam|less -S
2.提取
提取未比對(duì)到參考序列的結(jié)果:
samtools view -b -h -f 4 *.bam > unmapped.bam
-h 文件包含header line;-f,提取;-b,輸出為bam格式
###-F參數(shù)是過(guò)濾的意思(filter);這里類(lèi)似grep -v
所以提取比對(duì)到參考序列的結(jié)果:
samtools view -b -h -F 4 *.bam > mapped.bam
F意思為過(guò)濾掉以4為標(biāo)簽的序列
提取雙端序列都比對(duì)到參考序列(4+8)的結(jié)果
samtools view -bF 12 *.bam > mapped.bam
3.bam2fastq
bamToFastq -bam file_unmapped.bam -fq1 unmappedR1.fastq -fq2 unmappedR2.fastq
參考文獻(xiàn):http://blog.sina.com.cn/s/blog_9fe4fc830102x7s6.html
https://www.cnblogs.com/leezx/p/8655086.html