深度(depth)與覆蓋度(coverage)
假想實(shí)驗(yàn)
對(duì)長(zhǎng)100bp的目標(biāo)區(qū)域進(jìn)行捕獲測(cè)序:采用單端測(cè)序,每個(gè)read長(zhǎng)5bp;總共得到了200個(gè)reads;把所有的reads比對(duì)到目標(biāo)區(qū)域后,100bp的目標(biāo)區(qū)域中有98bp的位置至少有1個(gè)read覆蓋到,換言之,剩余的2bp沒有1個(gè)read覆蓋。
深度
200 x 5 / 100 = 10
我們說這此測(cè)序的深度為10X。
覆蓋度
98 / 100 × 100% = 98%
我們說這次測(cè)序的覆蓋度為98%
使用genomecov:
ref: genomecov — bedtools 2.27.0 documentation
'''
samtools view -b xxx.bam | genomeCoverageBed -ibam stdin -g hg18.genome -bga > cov.bedgraph
'''
hg19:hg19.chrom.sizes
mm10:mm10.chrom.sizes
或者samtools查看bam:
'''
samtools view -H xxx.bam
-bg Reporting genome coverage in BEDGRAPH format
-bga Reporting genome coverage for all positions in BEDGRAPH format
'''

使用samtools的depth:
samtools depth xxx.bam -a > xxx.bam.depth

結(jié)果: 一共得到3列以指標(biāo)分隔符分隔的數(shù)據(jù),第一列為染色體名稱,第二列為位點(diǎn),第三列為覆蓋深度。