GATK4-部分工具包常用參數(shù)記錄

  1. VariantFiltration
    Filter variant calls based on INFO and/or FORMAT annotaitions.
gatk VariantFiltration \
-R reference.fasta\
-V input.vcf.gz\
-O output.vcf.gz\
--fitler-expression "AB<0.2 || MQ0 >50" \
--fitler-name "my_filters"

不能使用VQSR,但需要對(duì)HaplotypeCaller的結(jié)果進(jìn)行handfilter時(shí)可以用這個(gè)工具。

  1. FixMateInformation(Picard)
    Verify mate-pair information between mates and fix if needed.
java -jar --Xmx4g picard.jar  FixMateInformation \
                  I=input.bam \
                  O=fixed_mate.bam \
                  ADD_MATE_CIGAR=true AS=true \
                  SO=coordinate 

這一步是放在MarkDuplicates后面,查到有別人說如果MarkDuplicates 把重復(fù)去掉了,會(huì)對(duì)mate信息產(chǎn)生影響。如果MarkDuplicates只是標(biāo)記而沒有去除重復(fù),則不會(huì)對(duì)mate信息產(chǎn)生影響,理論上可以不用做FixMate.
我比較了輸入文件和輸出文件的大小,fix之后的文件要大一些。

3.SelectVariants
Select a subset of variants from a VCF file.

gatk SelectVariants \
-R reference.fasta \
-V input.vcf \
-selectType SNP \
-O output.vcf

-selectType :INDEL,SNP,MIXED,MNP,SYMBOLIC,NO_VARIATION.(can be specified multiple times.)
常用的是從vcf中把snp和indel分別輸出到兩個(gè)文件。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Introduction What is Bowtie 2? Bowtie 2 is an ultrafast a...
    wzz閱讀 6,186評(píng)論 0 5
  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,871評(píng)論 0 10
  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,929評(píng)論 0 13
  • 想念,是無法言說的心事;是不能和人分享的,一個(gè)秘密;是不能與人傾訴的,一種心語(yǔ);它,止于唇齒,又藏于心底;它,縱有...
    云溪憶站閱讀 452評(píng)論 0 2
  • 大姑和表姐五一回老家,我們也回去團(tuán)聚,和母親在家里住了兩天,平時(shí)忙于工作和生活,已經(jīng)記不清幾年沒在家住過了。 哥哥...
    花下鋤月閱讀 1,539評(píng)論 2 9

友情鏈接更多精彩內(nèi)容