特別感謝賣萌哥對(duì)于R gene的資源分享和指導(dǎo)幫助
參考文獻(xiàn):RGAugury: a pipeline for genome-wide prediction of resistance gene analogs (RGAs) in plants
Resistance gene analogs(RGAs)包括編碼NBS的蛋白、受體激酶(receptor-like protein kinases,RLKs)和受體蛋白(receptor-like proteins,RLPs)。受體蛋白與受體激酶主要作為細(xì)胞表面的模式識(shí)別受體(pattern-recognition receptors,PRRs),對(duì)微生物/病原物相關(guān)分子模式(Microbe/Pathogen- associated molecular patterns, MAMPs/PAMPs)識(shí)別,引起的植物第一層免疫系統(tǒng)——微生物/病原物相關(guān)分子模式觸發(fā)的免疫(MAMP/PAMP-triggered immunity,MTI/PTI)。
R (Resistence) gene主要與植物防御機(jī)制中的ETI(Effector-triggered immunity)防御機(jī)制有關(guān),其主要功能結(jié)構(gòu)域?yàn)镹B-ARC(PF00931),與LRR相連發(fā)揮識(shí)別病原菌,并對(duì)其進(jìn)行防御。根據(jù)與R gene相連不同的domain分為不同類型的R gene。

RGAugury pipeline(希望大家的網(wǎng)速都很快,無論是使用conda,還是wget或者axel)
流程的幫助文檔:RGAugury Wiki
事先在簡(jiǎn)書中找到一篇相關(guān)解讀:文獻(xiàn)筆記四十八:在基因組水平上預(yù)測(cè)植物抗性基因類似物的流程RGAugury(這位老哥幫助我避免踩interproscan的坑)
正如他所言,RGAugury的麻煩主要是在它不僅需要安裝多種軟件,還需要安裝多種依賴perl模塊。熟悉生信的人一定會(huì)說能用conda安裝的軟件一定要用conda,conda里的perl也可以用于安裝模塊。但我在嘗試的最后放棄了使用conda的方法,原因主要有
1.初步嘗試時(shí)一定要弄清你用的是哪個(gè)perl,即which perl(細(xì)節(jié)蠻重要的)
2.Moose和Log::Log4perl兩個(gè)perl模塊十分重要,但我用conda的perl安裝Moose模塊的時(shí)候無法安裝(主要還是自己太菜,不懂perl)
3.conda中的pfam_scan.pl似乎與流程中設(shè)置好的PFAMDB無法關(guān)聯(lián)起來,導(dǎo)致了報(bào)錯(cuò)
Ps:其實(shí)安裝perl模塊直接用cpan install module,安裝不成功可能與cpan的設(shè)置有關(guān),像PFAMDB可能直接放在conda環(huán)境的路徑中,并加入環(huán)境變量,也許就能使用了,以后再嘗試吧
所以最終選擇了手動(dòng)安裝軟件的方法
(對(duì)于sudo用戶便捷,所以你可能需要麻煩你的管理員,注意系統(tǒng)位數(shù),有些軟件可能也事先也安裝過了)
1.BLAST+
# 下載ncbi-blast-2.10.1+-x64-linux.tar.gz
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.1+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.10.1+-x64-linux.tar.gz -C /your path/ #解壓到適當(dāng)目錄(你需要的路徑)
#我習(xí)慣裝好軟件就添加到環(huán)境變量中,并進(jìn)行測(cè)試。下同。你可以通過echo $PATH查看你的環(huán)境變量,選擇第一個(gè)屬于你帳號(hào)的路徑
vim ~/.bashrc
export PATH=$PATH:/your path/blast/bin #注意軟件路徑和軟件文件夾名稱
#保存.bashrc后進(jìn)行
source ~/.bashrc
后面軟件安裝完成后,利用blast任何一個(gè)功能進(jìn)行測(cè)試,例如blastn -h會(huì)有如下顯示,表明運(yùn)行成功(后面不再演示)。

2.hmmer3
# 下載ncbi-blast-2.10.1+-x64-linux.tar.gz
wget -c http://eddylab.org/software/hmmer/hmmer-3.3.tar.gz
tar -zxvf hmmer-3.3.tar.gz -C /your path/
# 下載pfam_scan
wget -c ftp://ftp.ebi.ac.uk/pub/databases/Pfam/Tools/PfamScan.tar.gz
tar -zxvf hmmer-3.3.tar.gz -C /your path/
#下載pfam數(shù)據(jù)庫(kù)
wget -c ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.hmm.gz
gunzip Pfam-A.hmm.gz
#解壓完成記得初始化
hmmpress Pfam-A.hmm
#文檔路徑有要求,參照幫助文檔
export PFAMDB=/home/user name/database/pfamdb #to specifiy the hmm pfam-A/B DB path,user name為用戶名
4.Phobius 1.01
需要安裝在32位環(huán)境下
這款軟件通過登記信息發(fā)送到郵箱進(jìn)行下載,之后通過ftp上傳到服務(wù)器中進(jìn)行解壓。

5.ncoils已經(jīng)存儲(chǔ)在RGAugury中
6.git
Download for Linux and Unix
7.jdk(強(qiáng)烈建議用sudo安裝)
#下載合適版本的jdk,注冊(cè)登錄后獲得網(wǎng)址
wget -c
tar -zxvf xxxx.tar.gz
#或者sudo模式安裝
sudo apt update
sudo apt install openjdk-8-jdk openjdk-8-jre
#詳情可以參照https://tecadmin.net/install-oracle-java-8-ubuntu-via-ppa/
8.interproscan下載合適的版本
建議安裝較低版本interproscan,例如interproscan-5.32-71.0interproscan的版本需要和jdk搭配,例如interproscan-5.32-71.0和jdk-,這里是最麻煩的。此外interproscan有9G左右的大小,請(qǐng)耐心等待。
可以參考InterProScan的使用教程
#下載interproscan-5.32-71.0
wget -c ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/5.32-71.0/interproscan-5.32-71.0-64-bit.tar.gz
wget -c ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/5.32-71.0/interproscan-5.32-71.0-64-bit.tar.gz.md5
#下載完成后檢查文件完整性
md5sum -c interproscan-5.32-71.0-64-bit.tar.gz.md5
#顯示interproscan-5.32-71.0-64-bit.tar.gz:ok則表示文件完整
tar -zxvf interproscan-5.32-71.0-64-bit.tar.gz -C/your path/
#加入環(huán)境變量后, 可選擇下載panther-data-xx.x.tar.gz壓縮包到interproscan-x.xx-xx.0/data/目錄下(大小有10G以上)
wget ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/data/panther-data-14.1.tar.gz
wget ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/data/panther-data-14.1.tar.gz.md5
md5sum -c panther-data-14.1.tar.gz.md5
#panther-data-14.1.tar.gz:ok
tar -zxvf panther-data-11.1.tar.gz
#可選項(xiàng),看你需要不要Match Lookup Service,因?yàn)槲沂潜镜鼗?,不想?lián)網(wǎng)操作,因此就會(huì)禁止這項(xiàng)操作
vim interproscan-5.24-63.0/interproscan.properties
#去掉下面這行代碼
precalculated.match.lookup.service.url=http://www.ebi.ac.uk/interpro/match-lookup
9.CViT
可視化過程未嘗試,有機(jī)會(huì)的話以后更新
10.perl模塊安裝
雖然幫助文檔里有很多l(xiāng)ibrary和module,但我們只需要RGAugury的依賴模塊和pfam_scan.pl的依賴模塊。
均采用cpan install module就可以快速安裝完成(建議在root用戶下安裝)
cpan insatll Log::Log4perl #這個(gè)也可手動(dòng)安裝,詳情http://search.cpan.org/~mschilli/
cpan install Moose
cpan install BioPerl
11.下載RGAugury
git clone https://bitbucket.org/yaanlpc/rgaugury.git
chmod 755 *.pl
chmod 755 scoils-ht
匯總下.bashrc或者.bash_profile環(huán)境變量設(shè)置(假設(shè)用戶名為xxx)
環(huán)境變量的路徑名稱一定要和軟件路徑名稱對(duì)應(yīng)
export PATH=$PATH:/home/xxx/your path/phobius1.01 # to specify the path of phobius.pl script and binary.
export PATH=$PATH:/home/xxx/your path/hmmer3/bin # binary path
export PATH=$PATH:/home/xxx/your path/blast/bin # binary path of blast+ package
export PATH=$PATH:/home/xxx/your path/RGAugury/rgaugury # this package scripts path
export PATH=$PATH:/home/xxx/your path/RGAugury/rgaugury/coils #the path to scoils-ht, which is a modified version of coils to adapt to RGAugury pipeline.
export PATH=$PATH:/home/xxx/your path/interproscan-x.xx-xx.0 #download latest one as your wish. Do not add the path of "bin" under interproscan directory.
export PATH=$PATH:/home/xxx/your path/PfamScan #to specify the path for script of pfam_scan.pl
export COILSDIR=/home/xxx/your path/RGAugury/rgaugury/coils # or create a plain file with putting this command only but a directory all user can access and drop it to /etc/profile.d/, file permission changes to 755, otherwise export it to user's profile and point to another user authorized directory
export PERL5LIB=/home/xxx/your path/PfamScan:$PERL5LIB #perl module for pfam_scan.pl
export PFAMDB=/home/xxx/database/pfamdb #to specifiy the hmm pfam-A/B DB path
大致樣子如下

終于可以運(yùn)行RGAugury試試看了
perl rgaugury/RGAugury.pl -p protein.faa -c 10 -pfx Output
#arguments:
-p protein fasta file
-n corresponding cDNA/CDS nucleotide for -p (optional)
-g genome file in fasta format (optional)
-gff a modified gff3-like file, see below format (optional)
-c cpu or threads number, default = 2
-pfx prefix for filename, useful for multiple speices input in same folder (optional)
關(guān)于gff文件格式在幫助文檔中也有說明。gff文件主要可以進(jìn)行可視化
最后放下運(yùn)行成功結(jié)果
無論是來自nohup.out還是程序自身的xxx.status.log(xxx為-pfx 文件前綴)

更多閱讀推薦
生信技能樹公益視頻合輯:學(xué)習(xí)順序是linux,r,軟件安裝,geo,小技巧,ngs組學(xué)!
B站鏈接:https://m.bilibili.com/space/338686099
YouTube鏈接:https://m.youtube.com/channel/UC67sImqK7V8tSWHMG8azIVA/playlists
生信工程師入門最佳指南:https://mp.weixin.qq.com/s/vaX4ttaLIa19MefD86WfUA
學(xué)徒培養(yǎng):https://mp.weixin.qq.com/s/3jw3_PgZXYd7FomxEMxFmw
文獻(xiàn)閱讀需搜索,推薦文獻(xiàn)鳥