GATK4 非Spark模式運行
更新時間:2022-02-15 GMT+08:00
[分享](javascript:void(0);)
操作步驟
- 使用PuTTY工具,以root用戶登錄服務(wù)器。
- 執(zhí)行以下命令,BWA index對fasta文件構(gòu)建索引。
bwa index -a bwtsw human_g1k_v37.fasta
- 執(zhí)行以下命令,BWA mapping對fastq文件進行比對。
gatk CreateSequenceDictionary -R human_g1k_v37.fasta -O human_g1k_v37.dict
bwa mem -M -t 64 human_g1k_v37.fasta SRR742200_1.fastq SRR742200_2.fastq > SRR7.sam
- 執(zhí)行以下命令,Reorder對基因序列進行重新排序。
gatk ReorderSam -I SRR7.sam -O SRR7_reorder.bam -R human_g1k_v37.fasta
- 執(zhí)行以下命令,Sort對基因序列按照坐標順序從大到小排序。
gatk SortSam -I SRR7_reorder.bam -O SRR7_sorted.bam --SORT_ORDER coordinate
- 執(zhí)行以下命令,Add head對基因序列進行加頭處理。
gatk AddOrReplaceReadGroups -I SRR7_sorted.bam -O SRR7_addhead.bam -LB lib1 -PL illumina -PU unit1 -SM 20
- 執(zhí)行以下命令,Mark Duplicates對基因序列去重。
gatk MarkDuplicates -I SRR7_addhead.bam -M test.metric -O SRR7_markdup.bam
- 執(zhí)行以下命令,BQSR進行重新校準。
- 執(zhí)行以下命令對fasta參考文件進行重新排列生成fai文件。
samtools faidx human_g1k_v37.fasta > human_g1k_v37.fai
2. 執(zhí)行以下命令給vcf文件加index。
gatk IndexFeatureFile -F dbsnp132_20101103.vcf
gatk BaseRecalibrator -I SRR7_markdup.bam --known-sites dbsnp132_20101103.vcf -O SRR7_bqsr.bam -R human_g1k_v37.fasta
gatk ApplyBQSR -bqsr SRR7_bqsr.bam -I SRR7_markdup.bam -O SRR7_aybqsr.bam
- 執(zhí)行以下命令,HaplortypeCaller變異流程檢測。
gatk HaplotypeCaller -I SRR7_aybqsr.bam -O SRR7_raw.vcf -R human_g1k_v37.fasta
轉(zhuǎn)載自:
GATK4 非Spark模式運行鯤鵬BoostKit HPC使能套件移植指南(開源組件)其他GATK 4.0.0.0 移植指南(CentOS 7.6)運行和驗證華為云 (huaweicloud.com)