2021-04-22 bam文件中提取比對(duì)(mapped)或未比對(duì)上(unmapped)reads

flags

1 0x1 這序列是PE雙端測(cè)序

2 0x2 這序列和參考序列完全匹配,沒(méi)有錯(cuò)配和缺失

4 0x4 這序列沒(méi)有mapping到參考序列上

8 0x8 這序列的mate序列沒(méi)有mapping到參考序列上

16 0x10 這序列比對(duì)到參考序列的負(fù)鏈上

32 0x20 這序列的mate序列比對(duì)到參考序列的負(fù)鏈上

64 0x40 這序列是read1

128 0x80 這序列是read2

256 0x100 這序列不是主要的比對(duì),因?yàn)樾蛄锌赡鼙葘?duì)到參考序列的多個(gè)位置上

512 0x200 這序列沒(méi)有通過(guò)QC

1024 0x400 這序列是PCR重復(fù)序列

2048 0x800 這序列是補(bǔ)充比對(duì)

1.查看

其中bam文件中用標(biāo)簽4代表read未比對(duì)上;所以查看未比對(duì)上的reads用

samtools view -f 4 *bam|less -S

2.提取

提取未比對(duì)到參考序列的結(jié)果:

samtools view -b -h -f 4 *.bam > unmapped.bam

-h 文件包含header line;-f,提取;-b,輸出為bam格式

###-F參數(shù)是過(guò)濾的意思(filter);這里類(lèi)似grep -v

所以提取比對(duì)到參考序列的結(jié)果:

samtools view -b -h -F 4 *.bam > mapped.bam

F意思為過(guò)濾掉以4為標(biāo)簽的序列

提取雙端序列都比對(duì)到參考序列(4+8)的結(jié)果

samtools view -bF 12 *.bam > mapped.bam

3.bam2fastq

bamToFastq -bam file_unmapped.bam -fq1 unmappedR1.fastq -fq2 unmappedR2.fastq

參考文獻(xiàn):http://blog.sina.com.cn/s/blog_9fe4fc830102x7s6.html

https://www.cnblogs.com/leezx/p/8655086.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容