生信小白——初學(xué) samtools

上文提到用bowtie2獲得了三個sam文件,但通常會將其轉(zhuǎn)化為bam文件進(jìn)行查閱。

使用conda下載samtools工具,過程參考《生信小白——初學(xué)bowtie2》。


sam to bam

進(jìn)入之前獲得的read目錄下,其中有待轉(zhuǎn)化的sam文件。輸入$ samtools view -bS a_20_Tsa.sam(輸入sam文件) > a_20_Tsa.bam(輸出bam文件) 。

分別獲得對應(yīng)的bam文件

以此類推獲得相應(yīng)的bam文件,從文件大小可以看出轉(zhuǎn)換后的bam文件比sam文件要小很多。

bam文件不同于sam文件可以用文本編輯打開,因為它是一個二進(jìn)制文檔,不可讀。因此在bam文件所在目錄下輸入samtools view a_0_Tsa.bam(文件名) |less -SN查看。

查看bam文件
bam文件顯示的結(jié)果

sort指令

剛才的比對結(jié)果是以reads的輸入順序進(jìn)行排序的,但后續(xù)分析通常是用比對到基因組的位置進(jìn)行排序,這里就需要用到sort。輸入samtools sort a_0_Tsa.bam(輸入文件名) -o a_0_Tsa.sorted.bam(輸出文件名)

得到sort后的bam文件

再次查看結(jié)果,就和之前的結(jié)果不一樣了。

sort后bam文件顯示的結(jié)果

bam文件的具體介紹可以看(http://www.itdecent.cn/p/364e640d3c9f),非常詳細(xì)。

參考及感謝

黃樹嘉????從零開始完整學(xué)習(xí)全基因組測序數(shù)據(jù)分析:第5節(jié) 理解并操作BAM文件:http://www.itdecent.cn/p/364e640d3c9f

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容