Bedtools genomecov 計(jì)算覆蓋度

簡單說明:

  • 從2.28.0版開始,bedtools使用htslib庫支持CRAM格式
  • 除了BAM文件,bedtools默認(rèn)所有的輸入文件都以TAB鍵分割
  • 除非使用-sorted選項(xiàng),bedtools默認(rèn)不支持大于512M的染色體
  • 如果沒有使用-sorted參數(shù)對染色體按編碼順序進(jìn)行排序(e.g., sort -k1,1 -k2,2n ),則必須使用-g參數(shù)輸入相同排序染色體
  • bedtools要求染色體命名方案在比較文件中是相同的(例如‘chr1’和‘1’不能同時(shí)存在)

1 genomecov

計(jì)算基因組水平上的reads覆蓋度,可以以單個(gè)點(diǎn)位顯示(-d),或者以bed格式顯示(-bg)。

在運(yùn)行之前,保證
(1) 輸入的bed/vcf/gff 文件時(shí),要對齊進(jìn)行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 輸入ban文件時(shí),使用ibam 參數(shù),先對bam文件進(jìn)行sort,可不加-g 參數(shù)

如下

bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1  0   183326  0
YYchr1  183326  183590  1
YYchr1  183590  187919  0
YYchr1  187919  188138  1
YYchr1  188138  190127  0
YYchr1  190127  190272  1
YYchr1  190272  190354  0

# -bg: 以bed文件輸入
# -bga: 如上一樣,但同時(shí)輸入覆蓋度為0的區(qū)域

以上結(jié)果中,第一列染色體,2,3列,位置區(qū)域,第4列 coverage,該區(qū)域的定義如下所示

參考

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容