1 下載
注冊即可下載 http://www.openbioinformatics.org/annovar/annovar_download_form.php
2文件準(zhǔn)備
- ref.fa
- ref.gtf 或者gff3
- .vcf文件
3 gff文件轉(zhuǎn)換
用gff3ToGenePred與gtfToGenePred工具將gtf或gff3文件轉(zhuǎn)化為reference_refGene.txt
gff3ToGenePred.dms gff3 SP_refGene.txt
4 ref.fa 格式轉(zhuǎn)換
perl retrieve_seq_from_fasta.pl --format refGene --seqfile ref.fa SP_refGene.txt
5 vcf格式轉(zhuǎn)換
perl convert2annovar.pl -includeinfo -allsample -withfreq \
-format vcf4 sample.VCF >sample.avinput
# --includeinfo: 輸出文件含有特定額外的信息
# --allsample: 多樣本的vcf,輸出多個樣本的結(jié)果
# --withfreq: 輸出文件包含頻率信息
# --format: 輸入文件格式
6 注釋
用table_annovar.pl進行注釋(可一次性完成三種類型的注釋, 本次只有基于基因)
perl ../table_annovar.pl test.avinput sp/ --buildver SP --outfile myanno --protocol refGene --operation g
##參數(shù)
sp: 含有SP_refGeneMrna.fa和SP_refGene.txt文件夾
--buildver: 基因組建立的版本
--outfile: 輸出文件前綴
--protocol: 逗號分隔的注釋流程,代表庫的名字
--operation: g(gene),r(region),f(filter)
最終得到兩個注釋文件文件和一個log文件exonic_variant_function和variant_function