生信技能樹,RNA-seq

新開了jimmy老師開的服務(wù)器,下載數(shù)據(jù)還是跑流程,感覺(jué)飛起來(lái)了一下,感激萬(wàn)分。

言歸正傳:下面是新的流程:

文章:兩篇:

①、Cancers | Free Full-Text | Targeting Palbociclib-Resistant Estrogen Receptor-Positive Breast Cancer Cells via Oncolytic Virotherapy | HTML
https://www.mdpi.com/2072-6694/11/5/684/htm
②、Genes | Free Full-Text | Transcriptomic Profiling Identifies Differentially Expressed Genes in Palbociclib-Resistant ER+ MCF7 Breast Cancer Cells
https://www.mdpi.com/2073-4425/11/4/467
主要是研究:差異表達(dá)的基因和參與對(duì)palbociclib耐藥性發(fā)展的途徑(乳腺癌)

流程:

1、下載數(shù)據(jù):

conda  create -n rnaseq  python=2 bwa
source activate rnaseq

#安裝軟件aspera
wget [http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz](http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz)
tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz
bash aspera-connect-3.5.1.92523-linux-64.sh
echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc
source ~/.bashrc
ascp --help
#注意下一下,這里用bash。而不是sh。之前用sh會(huì)彈出很多錯(cuò)誤

############
#用aspera下載數(shù)據(jù)。比prefetch,應(yīng)該快不少
cat 'SRR_Acc_List (1).txt'|while read id
do
x=$(echo $id | cut -b1-6)
y=$(echo $id | cut -b10-10)
echo $id
ascp -QT -l 300m -P33001  -i \
~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
[era-fasp@fasp.sra.ebi.ac.uk](mailto:era-fasp@fasp.sra.ebi.ac.uk):/vol1/fastq/$x/00$y/$id/ ./
done
gzip -d SRR*gz

2、質(zhì)控

#安裝軟件:
conda install -y sra-tools
conda install -c bioconda multiqc

#質(zhì)檢
ls *fastq|xargs fastqc -t 10
multiqc .

瀏覽器打開multiqc_report.html。


image.png
image.png
image.png

3、比對(duì):

#軟件用hisat2吧
conda install -y hisat2
conda install -samtools

########
#比對(duì)
for ((i=23;i<=34;i++));
do 
hisat2 -p 6 -x /home/data/server/reference/index/hisat/hg38/genome 
-U /home/data/gmb29/data/chip_seq/SRR89845${i}.fastq 
-S SRR89845${i}.sam ;
done

4、sam轉(zhuǎn)bam,bam排序,計(jì)數(shù)gtf

#sam轉(zhuǎn)bam
for ((i=23;i<=34;i++));
do 
samtools view -@ 6 -bS -h SRR89845${i}.sam > SRR89845${i}.bam ;
done
###################
#bam排序
for ((i=23;i<=34;i++));
do 
samtools sort -@ 6 SRR89845${i}.bam -o SRR89845${i}.sort ;
done
#計(jì)數(shù)gft
featureCounts -T 6 -t \
-t exon -g gene_id \
-a /home/data/server/reference/gtf/ensembl/Homo_sapiens.GRCh38.98.chr.gtf.gz -o all.id.txt *.sort

得到了all -id的計(jì)數(shù)。
原文的流程是:tophat2 ——cufflinks

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容