gatk DepthOfCoverage \
--input ../duplicates_marked_sorted_fixed.BQSR.bam \
-L whole_exome_illumina_hg38.targets.interval_list \
-O test.coverage.csv \
--create-output-variant-index \
-R Homo_sapiens_assembly38.fasta \
--output-format CSV \
--print-base-counts \
--QUIET
DepthOfCoverage會(huì)輸出7個(gè)文本結(jié)果。其中一個(gè)是按照interval上的每個(gè)堿基,輸出一行統(tǒng)計(jì)信息,所以會(huì)比較慢:
.DepthOfCoverage.txt結(jié)果

image.png
DepthOfCoverage為基因組上的每個(gè)堿基輸出一行結(jié)果,這導(dǎo)致結(jié)果文件太大,而且運(yùn)行速度極慢,如果不需要每個(gè)堿基,則可以設(shè)置--omit-depth-output-at-each-base,
.sample_interval_summary結(jié)果:

image.png
.sample_summary結(jié)果:

image.png
.sample_interval_statistics結(jié)果

image.png
.sample_statistics結(jié)果:

image.png
.sample_cumulative_coverage_counts結(jié)果:

image.png
另外如果可以將interval list拆分成更多的話,區(qū)間統(tǒng)計(jì)能夠合并,但是GATK不能輸出合并的結(jié)果
按照每個(gè)堿基的深度結(jié)果,可以寫腳本處理成為按染色體統(tǒng)計(jì)深度,和覆蓋度的表格:

image.png
最后用統(tǒng)計(jì)結(jié)果畫圖:

coverage and depth.png