GATK4 非Spark模式運行

GATK4 非Spark模式運行

更新時間:2022-02-15 GMT+08:00

查看PDF

[分享](javascript:void(0);)

操作步驟

  1. 使用PuTTY工具,以root用戶登錄服務(wù)器。
  2. 執(zhí)行以下命令,BWA index對fasta文件構(gòu)建索引。
bwa index -a bwtsw human_g1k_v37.fasta
  1. 執(zhí)行以下命令,BWA mapping對fastq文件進行比對。
gatk CreateSequenceDictionary -R human_g1k_v37.fasta -O human_g1k_v37.dict
bwa mem -M -t 64 human_g1k_v37.fasta SRR742200_1.fastq SRR742200_2.fastq > SRR7.sam
  1. 執(zhí)行以下命令,Reorder對基因序列進行重新排序。
gatk ReorderSam -I SRR7.sam -O SRR7_reorder.bam -R human_g1k_v37.fasta
  1. 執(zhí)行以下命令,Sort對基因序列按照坐標順序從大到小排序。
gatk SortSam -I SRR7_reorder.bam -O SRR7_sorted.bam --SORT_ORDER coordinate
  1. 執(zhí)行以下命令,Add head對基因序列進行加頭處理。
gatk AddOrReplaceReadGroups -I SRR7_sorted.bam -O SRR7_addhead.bam -LB lib1 -PL illumina -PU unit1 -SM 20
  1. 執(zhí)行以下命令,Mark Duplicates對基因序列去重。
gatk MarkDuplicates -I SRR7_addhead.bam -M test.metric -O SRR7_markdup.bam
  1. 執(zhí)行以下命令,BQSR進行重新校準。
    1. 執(zhí)行以下命令對fasta參考文件進行重新排列生成fai文件。
samtools faidx human_g1k_v37.fasta > human_g1k_v37.fai
2.  執(zhí)行以下命令給vcf文件加index。
gatk IndexFeatureFile -F dbsnp132_20101103.vcf
gatk BaseRecalibrator -I SRR7_markdup.bam --known-sites dbsnp132_20101103.vcf -O SRR7_bqsr.bam -R human_g1k_v37.fasta
gatk ApplyBQSR -bqsr SRR7_bqsr.bam -I SRR7_markdup.bam -O SRR7_aybqsr.bam
  1. 執(zhí)行以下命令,HaplortypeCaller變異流程檢測。
gatk HaplotypeCaller -I SRR7_aybqsr.bam -O SRR7_raw.vcf -R human_g1k_v37.fasta

轉(zhuǎn)載自:
GATK4 非Spark模式運行鯤鵬BoostKit HPC使能套件移植指南(開源組件)其他GATK 4.0.0.0 移植指南(CentOS 7.6)運行和驗證華為云 (huaweicloud.com)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容