RNA-seq:STAR 軟件比對(SLURM遞交系統(tǒng))

索引構(gòu)建

#!/bin/bash
#SBATCH --job-name="star_index"
fastq_dir=~/hg38/GRCh38.p12.genome.fa #genecode下載,并放在目的目錄(自己隨意放),截止05072019 最新版本
gtf_dir=~/hg38/gencode.v30.annotation.gtf #(同上)
out_dir=~/STAR/hg38/genecodev30
ml STAR
STAR --runMode genomeGenerate --genomeDir $out_dir --genomeFastaFiles $fastq_dir --sjdbGTFfile $gtf_dir --sjdbOverhang 284 --runThreadN 20

構(gòu)建好索引后,第一次比對

#!/bin/bash

genome_dir=~/index/STAR/hg38/genecodev30
out_dir=~/STAR_Align_V30/First
data_dir=~/trimed/reads
job_directory=~/trimed/reads
mkdir -p out_dir
for i in $(ls $pwd *.fq.gz | sed s/.trimmed_R[12].fq.gz// | sort -u);do

    job_file="${job_directory}/${i}.job"

    echo "#!/bin/bash
#SBATCH --job-name=${i}.STAR.job
#SBATCH --output=$out_dir/${i}.out
#SBATCH --time=3:00:00
#SBATCH --cpus-per-task=10
#SBATCH --mem=30g
ml STAR
STAR --runThreadN 10 --genomeDir $genome_dir \
--readFilesCommand zcat \
--readFilesIn $data_dir/${i}.trimmed_R1.fq.gz  $data_dir/${i}.trimmed_R2.fq.gz \
--outSAMtype BAM SortedByCoordinate \
--outFileNamePrefix $out_dir/${i}">$job_file
sbatch $job_file
done

構(gòu)建二次比對的新索引:

#!/bin/bash
fastq_dir=~/hg38/GRCh38.p12.genome.fa
data_dir=~/STAR_Align_V30/First
job_directory=~STAR_Align_V30/First/job
out_dir=~/STAR_Align_V30/First/out
mkdir -p out_dir
mkdir -p job_directory
mkdir -p out_dir
for i in $(ls *SJ.out.tab); do

    job_file="${job_directory}/${i%SJ.out.tab*}.job"

    echo "#!/bin/bash
#SBATCH --job-name=${i%SJ.out.tab*}.job
#SBATCH --output=$out_dir/${i%SJ.out.tab*}.out
#SBATCH --time=5:00:00
#SBATCH --cpus-per-task=12
#SBATCH --mem=50g
ml  STAR
genomeDir=~/STAR_Align_V30/New_index/${i%SJ.out.tab*}
mkdir -p $genomeDir
STAR --runMode genomeGenerate --genomeDir $genomeDir --genomeFastaFiles $fastq_dir \
    --sjdbFileChrStartEnd $data_dir/${i} --sjdbOverhang 284 --runThreadN 10">$job_file
sbatch $job_file
done

PS
STAR緩存文件太大,7TB空間run 190個(gè)RNA-seq都吃不消,還是用For循環(huán)來做。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容