簡單說明:
- 從2.28.0版開始,bedtools使用htslib庫支持CRAM格式
- 除了BAM文件,bedtools默認(rèn)所有的輸入文件都以TAB鍵分割
- 除非使用-sorted選項(xiàng),bedtools默認(rèn)不支持大于512M的染色體
- 如果沒有使用-sorted參數(shù)對染色體按編碼順序進(jìn)行排序(e.g., sort -k1,1 -k2,2n ),則必須使用-g參數(shù)輸入相同排序染色體
- bedtools要求染色體命名方案在比較文件中是相同的(例如‘chr1’和‘1’不能同時(shí)存在)
1 genomecov
計(jì)算基因組水平上的reads覆蓋度,可以以單個(gè)點(diǎn)位顯示(-d),或者以bed格式顯示(-bg)。
在運(yùn)行之前,保證
(1) 輸入的bed/vcf/gff 文件時(shí),要對齊進(jìn)行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 輸入ban文件時(shí),使用ibam 參數(shù),先對bam文件進(jìn)行sort,可不加-g 參數(shù)
如下
bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1 0 183326 0
YYchr1 183326 183590 1
YYchr1 183590 187919 0
YYchr1 187919 188138 1
YYchr1 188138 190127 0
YYchr1 190127 190272 1
YYchr1 190272 190354 0
# -bg: 以bed文件輸入
# -bga: 如上一樣,但同時(shí)輸入覆蓋度為0的區(qū)域
以上結(jié)果中,第一列染色體,2,3列,位置區(qū)域,第4列 coverage,該區(qū)域的定義如下所示
