前兩天使用snpeff進(jìn)行基因注釋,結(jié)果發(fā)現(xiàn)不少錯誤,所以就是用vep來進(jìn)行注釋,同樣的位點(diǎn),發(fā)現(xiàn)vep的注釋是對的。
下面是使用筆記。
首先去官網(wǎng)上下載安裝包
現(xiàn)在的版本是98(動物),45(植物),如果下載安裝包后里面沒有INSTALL.pl那就可能是版本更新了(19.11.29)
mkdir vep && cd vep
wget -c https://github.com/Ensembl/ensembl-tools/archive/release/97.zip
unzip 97.zip
cd ensembl-vep-release-97
- 在安裝之前先修改cache的地址,就是將INSTALL.pl中209行得地址進(jìn)行修改,動物的版本和植物的版本不一樣 ,我又不知道怎么使用默認(rèn)的$DATA_VERSION隨著植物的版本更新而更新,所以就直接使用了現(xiàn)在最新的版本編號(同樣如果需要下載fasta序列的話也可以進(jìn)行修改)。
vi INSTALL.pl
image
修改過后進(jìn)行安裝
perl INSTALL.pl -c ~/reference/vep/
#有時候會報錯,可以使用下面的命令
#perl INSTALL.pl -c ~/ngs/reference/vep/ --NO_HTSLIB
- 安裝程序,-c 后面是你下載cache的位置,默認(rèn)是$HOME/.vep,安裝過程中需要安裝API文件,比較費(fèi)時間,可能需要安裝幾次才能安裝上。然后就是下載cache文件,選擇自己物種的編號進(jìn)行下載,以玉米為例
image
但是有時需要安裝一些模塊
cpanm DBI
cpanm DBD::mysql
然后將cpanm的安裝目錄添加到環(huán)境變量中去,或者在INSTALL.pl的文件中添加一行
BEGIN { unshift @INC, '/home/free22/perl5/lib/perl5/x86_64-linux-thread-multi' }
安裝好了就可以進(jìn)行使用了
~/biosoft/vep --fasta~/reference/Zea_mays.AGPv4.dna.toplevel.fa --offline --species zea_mays--cache_version 39 --dir_cache ~/reference/vep/ -i maize_file.vcf -o maize_file_vep_annotate.vcf