計(jì)算測(cè)序深度和覆蓋度

深度(depth)與覆蓋度(coverage)

假想實(shí)驗(yàn)

對(duì)長(zhǎng)100bp的目標(biāo)區(qū)域進(jìn)行捕獲測(cè)序:采用單端測(cè)序,每個(gè)read長(zhǎng)5bp;總共得到了200個(gè)reads;把所有的reads比對(duì)到目標(biāo)區(qū)域后,100bp的目標(biāo)區(qū)域中有98bp的位置至少有1個(gè)read覆蓋到,換言之,剩余的2bp沒有1個(gè)read覆蓋。

深度

200 x 5 / 100 = 10

我們說這此測(cè)序的深度為10X。

覆蓋度

98 / 100 × 100% = 98%

我們說這次測(cè)序的覆蓋度為98%

使用genomecov:

ref: genomecov — bedtools 2.27.0 documentation

'''
samtools view -b xxx.bam | genomeCoverageBed -ibam stdin -g hg18.genome -bga > cov.bedgraph
'''
hg19:hg19.chrom.sizes

mm10:mm10.chrom.sizes

或者samtools查看bam:
'''
samtools view -H xxx.bam

-bg Reporting genome coverage in BEDGRAPH format

-bga Reporting genome coverage for all positions in BEDGRAPH format
'''

image.png

使用samtools的depth:

samtools depth xxx.bam -a > xxx.bam.depth

image.png

結(jié)果: 一共得到3列以指標(biāo)分隔符分隔的數(shù)據(jù),第一列為染色體名稱,第二列為位點(diǎn),第三列為覆蓋深度。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容