GATK DepthOfCoverage 太慢

gatk DepthOfCoverage \
    --input ../duplicates_marked_sorted_fixed.BQSR.bam  \
    -L  whole_exome_illumina_hg38.targets.interval_list \
    -O test.coverage.csv \
    --create-output-variant-index \
    -R Homo_sapiens_assembly38.fasta \
    --output-format CSV \
    --print-base-counts \
    --QUIET

DepthOfCoverage會(huì)輸出7個(gè)文本結(jié)果。其中一個(gè)是按照interval上的每個(gè)堿基,輸出一行統(tǒng)計(jì)信息,所以會(huì)比較慢:

.DepthOfCoverage.txt結(jié)果


image.png

DepthOfCoverage為基因組上的每個(gè)堿基輸出一行結(jié)果,這導(dǎo)致結(jié)果文件太大,而且運(yùn)行速度極慢,如果不需要每個(gè)堿基,則可以設(shè)置--omit-depth-output-at-each-base,

.sample_interval_summary結(jié)果:


image.png

.sample_summary結(jié)果:


image.png

.sample_interval_statistics結(jié)果


image.png

.sample_statistics結(jié)果:


image.png

.sample_cumulative_coverage_counts結(jié)果:


image.png

另外如果可以將interval list拆分成更多的話,區(qū)間統(tǒng)計(jì)能夠合并,但是GATK不能輸出合并的結(jié)果

按照每個(gè)堿基的深度結(jié)果,可以寫腳本處理成為按染色體統(tǒng)計(jì)深度,和覆蓋度的表格:


image.png

最后用統(tǒng)計(jì)結(jié)果畫圖:


coverage and depth.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 一、簡(jiǎn)介 Samtools是一個(gè)用于操作sam和bam格式文件的應(yīng)用程序集合,具有眾多的功能。 它從SAM(序列比...
    Davey1220閱讀 21,869評(píng)論 2 34
  • 上次我們整理到bwa比對(duì)后得到bam文件,下一步我們要通過(guò)GATK流程從bam文件中call variant。 一...
    商乙農(nóng)林科技閱讀 2,447評(píng)論 0 2
  • 上次我們整理到bwa比對(duì)后得到bam文件,下一步我們要通過(guò)GATK流程從bam文件中call variant。 一...
    商乙農(nóng)林科技閱讀 2,202評(píng)論 0 4
  • GATK(全稱The Genome Analysis Toolkit)是Broad Institute開(kāi)發(fā)的用于二...
    Greatji閱讀 34,731評(píng)論 0 18
  • 第一課:安裝與基本操作 R的擴(kuò)展包在R官網(wǎng)CRAN;另外,R官網(wǎng)還包含很多擴(kuò)展資料,包括源代碼,手冊(cè),F(xiàn)AQ,推薦...
    lizi_sjtu閱讀 795評(píng)論 0 0

友情鏈接更多精彩內(nèi)容