蛋白三級結(jié)構(gòu)預(yù)測(I TASSER)

獻(xiàn)給初學(xué)者:手把手教你在線預(yù)測蛋白質(zhì)結(jié)構(gòu)
I TASSER算是比較好的華人教授開發(fā)的一個(gè)預(yù)測軟件,在線可以直接分析。但是需要等待挺長時(shí)間并且一次只能run一個(gè)。所幸我們HPC上有這個(gè)軟件所以我就直接run起來代碼如下。
先將RNA序列用CPC2預(yù)測下氨基酸序列,當(dāng)然也可以下已知的氨基酸序列,存儲(chǔ)為fasta格式,我上批量運(yùn)行的所以直接就批量遞交了,大家參考即可。
這里要注意的是他們會(huì)默認(rèn)序列名字為seq.fasta所以要將該序列放在工作目錄里面

#!/bin/bash
#SBATCH --time=1:00:00
#SBATCH --cpus-per-task=2
#SBATCH --mem=2g

data_dir=/I_TASSER
fa_dir=${data_dir}/fasta_files
job_dir=${data_dir}/job
log_dir=${data_dir}/log
mkdir -p ${log_dir}
mkdir -p ${job_dir}
thread=14

cd ${fa_dir}
for i in $(ls $pwd *.fa);do
job_file="${job_dir}/${i%.fa*}.job"

echo "#!/bin/bash
#SBATCH --job-name=${i%.fa*}.I-TASSER.job
#SBATCH --output=$log_dir/${i%.fa*}.I-TASSER.out
#SBATCH --time=40:00:00
#SBATCH --cpus-per-task=${thread}
#SBATCH --mem=30g
module load I-TASSER
out_dir=${fa_dir}/${i%.fa*}
mkdir -p \${out_dir}
cp ${fa_dir}/${i} \${out_dir}/seq.fasta
runI-TASSER.pl -runstyle gnuparallel \
-LBS true -EC true -GO true -seqname ${i%.fa*} \
-datadir \${out_dir}  -light true \
-outdir \${out_dir} && file2html.py \${out_dir}
" > $job_file
sbatch $job_file
done
image.png

結(jié)果看起來還可以,pdb文件用PyMol再美化下就好

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容