SAM/BAM(SAM文件的二進制存儲形式,節(jié)省空間)文件列名解釋說明

A00265:483:HGYJHDSXY:4:1101:10004:16188 77      *       0       0       *       *       0       0
A00265:483:HGYJHDSXY:4:1101:10068:10473 141     *       0       0       *       *       0       0

這是一個SAM格式的文件,每一列的含義如下:
1.A00265:483:HGYJHDSXY:4:1101:10004:16188:這是序列的ID,通常包含了測序機的信息、測序的run信息、樣本的信息等。

  1. 77:這是FLAG字段,表示這個read的一些屬性。77的二進制是1001101,表示這個read是配對的,但是沒有比對到參考序列,而且它的配對read也沒有比對到參考序列。141的二進制表示是10001101,所以這個read的屬性包括:read是配對的; read沒有比對到參考序列; read的配對read沒有比對到參考序列; read是第二條read(在paired-end測序中)
    FLAG字段,是一個二進制數(shù),用來表示read的一些屬性; 每一位的含義如下:
1:read是配對的
2:read在配對中
4:read沒有比對到參考序列
8:read的配對read沒有比對到參考序列
16:read比對到參考序列的反鏈
32:read的配對read比對到參考序列的反鏈
64:read是第一條read(在paired-end測序中)
128:read是第二條read(在paired-end測序中)
256:read不是主要的比對結(jié)果
512:read沒有通過質(zhì)量控制
1024:read是PCR或克隆的重復(fù)
  1. *:這是參考序列的名字,*表示這個read沒有比對到任何參考序列。

  2. 0:這是read比對到參考序列的位置,0表示這個read沒有比對到任何參考序列。

  3. 0:這是MAPQ字段,表示比對的質(zhì)量,0表示這個read沒有比對到任何參考序列。

  4. *:這是CIGAR字符串,描述了read如何比對到參考序列。*表示這個read沒有比對到任何參考序列。

  5. *:這是配對read比對到的參考序列的名字,*表示配對的read沒有比對到任何參考序列。

  6. 0:這是配對read比對到的參考序列的位置,0表示配對的read沒有比對到任何參考序列。

  7. 0:這是插入片段的長度,0表示沒有插入片段。

  8. *:這是read的序列,*表示read的序列沒有給出。

總的來說,示例中的read和它的配對read都沒有比對到任何參考序列。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容