以MYB為例
- 從pfam網(wǎng)站下載Myb_DNA-binding.hmm
#使用hmmsearch搜索結(jié)構(gòu)域
hmmsearch --cut_tc --domtblout MYB.out Myb_DNA-binding.hmm species.pep.fasta
grep -v "#" MYB.out|awk '($7 + 0) < 1E-10'|cut -f1 -d " "|sort -u > > MYB.out_id.txt
#提取研究物種的MYB蛋白序列
seqtk subseq ../data/10.pep.fasta MYB.out_id.txt >MYB.out_id.fasta
- 驗(yàn)證提取到的MYB蛋白是否都具有MYB的結(jié)構(gòu)域
1.可以使用網(wǎng)站 InterPro (ebi.ac.uk)

image.png
但是只能一條一條的進(jìn)行運(yùn)行
- 本地化批量使用InterPro
2.1 從InterProScan 5 Help and Documentation - Job Dispatcher Sequence Analysis Tools - EMBL-EBI 下載iprscan5.py文件
2.2 下載依賴的包
pip install xmltramp2==3.0.10
2.3 運(yùn)行
source /gss1/env/python3.9.4.env
python /gss1/home/gaozhh01/biosoft/interProScan/iprscan5.py --multifasta MYB.out_id.20.fasta --maxJobs 25 --useSeqId --email tanwei0817@163.com --outformat tsv
qq郵箱不行,嘗試后發(fā)現(xiàn)163郵箱可以。