RNA-seq實(shí)戰(zhàn)

代碼如下

#1、下載電腦里沒有的的軟件
conda install Trim Galore cutadapt subread salmon
#2、下載數(shù)據(jù)
#只下載三個(gè)轉(zhuǎn)錄組數(shù)據(jù) 未經(jīng)處理、地塞米松處理組、沙丁胺醇處理組。剩下的那些數(shù)據(jù)太多,后面太難處理了。
prefetch SRR1039508
prefetch SRR1039509
prefetch SRR1039510 
#下載參考基因組,hg38.fa。用迅雷下載的
#下載注釋,gencode.v36.annotation.gtf.gz
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_36/gencode.v36.annotation.gtf.gz
#3、具體流程
#SRR--fastq
conda create -n rna python=2
source activate rna
fastq-dump --gzip --split-3 -O SRR1039508
fastq-dump --gzip --split-3 -O SRR1039509
fastq-dump --gzip --split-3 -O SRR1039510
#質(zhì)控
fastqc -t 2 -o SRR1039508_1.fastq.gz \ SRR1039508_2.fastq.gz
fastqc -t 2 -o SRR1039509_1.fastq.gz \ SRR1039509_2.fastq.gz
fastqc -t 2 -o SRR10395010_1.fastq.gz \ SRR1039510_2.fastq.gz
trim_galore -q 20 --phred33 --stringency 3 --length 20 -o  SRR1039508.fastq.gz
trim_galore -q 20 --phred33 --stringency 3 --length 20 -o  SRR1039509.fastq.gz
trim_galore -q 20 --phred33 --stringency 3 --length 20 -o  SRR1039510.fastq.gz
#比對(duì)
id="SRR1039508"
hisat2 -p 2 -x /home/xiaoying/hg38/genome \ -1 ${id}_1_val_1.fq.gz \ -2 ${id}_2_val_2.fq.gz \ -S ${id}.hisat.sam
id="SRR1039509"
hisat2 -p 2 -x /home/xiaoying/hg38/genome \ -1 ${id}_1_val_1.fq.gz \ -2 ${id}_2_val_2.fq.gz \ -S ${id}.hisat.sam
id="SRR1039510"
hisat2 -p 2 -x /home/xiaoying/hg38/genome \ -1 ${id}_1_val_1.fq.gz \ -2 ${id}_2_val_2.fq.gz \ -S ${id}.hisat.sam
#sam轉(zhuǎn)bam
samtools view -bS -h SRR103908.sam \ -o SRR1039508.bam
samtools view -bS -h SRR103909.sam \ -o SRR1039509.bam
samtools view -bS -h SRR103910.sam \ -o SRR1039510.bam
#bam排序
samtools sort -@ 5 SRR1039508.bam \ -o SRR1039508.sort.bam
samtools sort -@ 5 SRR1039509.bam \ -o SRR1039509.sort.bam
samtools sort -@ 5 SRR1039510.bam \ -o SRR1039510.sort.bam
#計(jì)數(shù)
for fn in {508..510}
do
featureCounts -T 5 -p -t exon -g gene_id \ -a /home/xiaoying/gencode.v25.annotation.gtf.gz \ -o SRR1039$fn.counts.txt SRR1039$fn.hisat.sort.bam
done
#salmon輸出結(jié)果
salmon index -t /home/xiaoying/Homo_sapiens.GRCh38.cdna.all.fa -i hg381_index
salmon quant -i hg381_index  -l A -1 SRR1039508_1.fastq -2 SRR1039508_2.fastq -o SRR1039510_quant
salmon quant -i hg381_index  -l A -1 SRR1039509_1.fastq -2 SRR1039509_2.fastq -o SRR1039509_quant
salmon quant -i hg381_index  -l A -1 SRR1039510_1.fastq -2 SRR1039510_2.fastq -o SRR1039510_quant
#salmon結(jié)果倒入R
image.png

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容