tophat2+cufflinks轉(zhuǎn)錄組測(cè)序?qū)嵗?)-數(shù)據(jù)準(zhǔn)備

tophat2+cufflinks轉(zhuǎn)錄組測(cè)序?qū)嵗龑槟憬榻B轉(zhuǎn)錄組測(cè)序也就是最近熱門的RNAseq整個(gè)流程,有興趣的小伙伴可以一起討論學(xué)習(xí)!
本次實(shí)驗(yàn)需要的軟件有Aspera,SRA-toolki,tophat2,cufflinks,fastqc,Trimmomatic。下載和安裝的教程這篇文章有http://www.itdecent.cn/p/5750e8e6fd7e

人的基因組一共有兩萬多個(gè)基因,但這些基因并不是每時(shí)每刻都在表達(dá),在不同時(shí)間不同組織中,基因的表達(dá)是不同的,而檢測(cè)這些基因表達(dá)的有效方法就是RNAseq,它結(jié)合了下一代測(cè)序技術(shù)來對(duì)整個(gè)細(xì)胞的mRNA進(jìn)行測(cè)序,從而確定每一個(gè)基因的表達(dá)量以及表達(dá)區(qū)段,主要用在分析不同條件下細(xì)胞內(nèi)基因表達(dá)差異和分析基因表達(dá)的不同可變剪切上

RNAseq只要分為以下幾個(gè)步驟首先要把測(cè)到的序列比對(duì)到基因組上,然后根據(jù)map到的區(qū)段對(duì)細(xì)胞構(gòu)建轉(zhuǎn)錄本,然后比較幾種細(xì)胞的轉(zhuǎn)錄本并且合并,最后衡量差異和可變剪切和其他的分析

在現(xiàn)實(shí)生活中,待比對(duì)的mRNA序列都是通過實(shí)驗(yàn)得到的,由于這只是一個(gè)例子,主要用于講解RNAseq流程,所以我們先從NCBI上獲取本次實(shí)例的原始數(shù)據(jù)以及參考基因組

從NCBI上下載數(shù)據(jù)可以用Aspera 使用教程可參考

Aspera使用教程 作者曉明_再出發(fā)

這次我們實(shí)驗(yàn)的數(shù)據(jù)來源于這篇文獻(xiàn)https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177

image

我們把下面四個(gè)數(shù)據(jù)下載下來其中兩個(gè)作為對(duì)照組,兩個(gè)為實(shí)驗(yàn)組
代碼如下

mkdir -p RNA-seq/Sra
cd RNA-seq/Sra #將下載的數(shù)據(jù)保存在這個(gè)文件夾里面
~/.aspera/connect/bin/ascp -T -i /home/qiujunhui/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957677/SRR957677.sra ./
~/.aspera/connect/bin/ascp -T -i /home/qiujunhui/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957677/SRR957677.sra ./
~/.aspera/connect/bin/ascp -T -i /home/qiujunhui/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957677/SRR957677.sra ./
~/.aspera/connect/bin/ascp -T -i /home/qiujunhui/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957677/SRR957677.sra ./

然后又fastq-dump解壓sra文件

fastq-dump *sra 

然后用fastqc檢查一下數(shù)據(jù)質(zhì)量

cd RNA-seq
mkidr fastqc_out 創(chuàng)建一個(gè)存放fastqc質(zhì)檢結(jié)果的文件夾
fastqc -o ~/RNA-seq/fastqc_out --noextract ~/RNA-seq/Sra/*fastq

檢查一下質(zhì)檢結(jié)果還不錯(cuò)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容