如何獲取sam文件中序列比對(duì)到哪條鏈,F(xiàn)LAG信息解讀

轉(zhuǎn)載自嘻皮悠的博客 http://blog.sina.com.cn/u/2054060511
————————————————————————————————————————————————
reads map到基因組上通常會(huì)產(chǎn)生bam/sam文件,但bam/sam文件中通常不直接給出reads mapping的正負(fù)鏈(+/-)信息。那么,如何獲取所有mapping到基因組正鏈或者負(fù)鏈的reads呢?

從sam文件的說明文檔中(http://samtools.github.io/hts-specs/SAMv1.pdf),我們得知,F(xiàn)LAG 0x10(十六進(jìn)制的10,相當(dāng)于十進(jìn)制的16)表示reads是否顯示為反向互補(bǔ)。因此,只需要對(duì)該位進(jìn)行過濾,即可知道read到底是map到了正鏈還是負(fù)鏈上。

第一種方法:(借鑒https://www.biostars.org/p/59388/
(1)獲取所有mapping的reads
samtools view -F 4 reads.bam >mapped_reads.sam
(2)正鏈mapping的reads
gawk '(and(16, 2))' mapped_reads.sam > reverse_mapped_reads.sam (3)反鏈mapping的reads gawk '(!and(16,2))' mapped_reads.sam > forward_mapped_reads.sam

第二種方法:(來自https://www.biostars.org/p/14378/
samtools view -F 20 ... : forward strand
samtools view -f 16 ... : reverse strand
samtools view -f 4 ... : unmapped

FLAG信息解讀網(wǎng)站:https://broadinstitute.github.io/picard/explain-flags.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容