最近在學RNA-Seq,從收集資料開始,將好用的鏈接先拷過來,方便閱讀:
背景:
生信技能樹:RNA-Seq這十年
嗯、這篇文章寫的很全,從一篇綜述翻譯過來的,介紹了短讀長和長讀長(PacBio / Oxford Nanopore(ONT)) 、還有direct RNA的一些特點(不需要cDNA合成和PCR擴增操作,消除了常規(guī)操作帶來的biase,且可以保留表觀遺傳學特性)...
long-read Sequencing較于短讀長優(yōu)缺點:
長讀長有助于檢測isoforms、 利于3’端alternative polyA分析
缺陷:
1、 測序通量小
在Illumina平臺上,運行單次的RNA-seq可以生成10E9-10E10條短讀長,但是在PacBio和ONT平臺上,一次RNA-seq則只能產生10E6-10E7條讀長。這種低通量限制了應用長讀長測序技術進行實驗的規(guī)模,并降低了對差異基因表達檢測的靈敏性。
2、測序錯誤率更高
這里要get一個詞CCS(circular consensus-sequencing,環(huán)形一致性測序),針對PacBio(PacBio測序原理圖如下)。

3、靈敏度受限
No. 31 RNA-Seq建庫用哪種策略?
- 第1方面,最終拿去測序儀進行測序的一定都是DNA片段,因此我們需要對實驗提取到的RNA序列進行反轉錄成cDNA,然后再進行連接adapter。
- 第2方面,細胞中含量最多的是rRNA,其次是tRNA,mRNA與lncRNA只占大約5%左右甚至更低,而我們真正關心的往往就是mRNA與lncRNA代表的基因表達量。
建庫策略
- PolyA
在絕大多數情況下,我們關心的gene都是protein coding gene或者是與其結構非常詳細的lncRNA(long non-coding RNA)這些gene在形成成熟的mRNA以后,往往都會在3'末端帶有polyA 尾巴;同時,成熟的tRNA,rRNA,miRNA等等都不帶有經典的polyA尾巴。
使用一段 帶有能與A配對的T的磁珠就可以與對應的帶有polyA尾巴的RNA結合,隨后再經過隨機打斷,反轉錄,加adapter就可以完成建庫,這樣的建庫策略叫做polyA + 或者 polyA positive。
- rRNA minus
那么polyA positive策略有個比較大的問題就是,會丟掉很多不帶有polyA尾巴的RNA序列,比如tRNA,比如有些lncRNA以及一些特殊的mRNA。
這個過程是對rRNA進行若干次的消化,使得rRNA都被降解而其他類型的RNA不受影響。隨后再進行隨機打斷,反轉錄,加adapter。這種RNA-Seq的建庫策略為rRNA - 或稱為 rRNA minus。
RNA質檢三步曲
1、 Nanodrop 2000
純RNA,其A260/A280約為2
OD260/OD280 介于1.8到2.1間,大于2.1,則為基因組污染;小于1.8則為蛋白質污染;
OD230/OD260 介于0.4-0.5間,大于0.5說明樣本中有鹽和小分子雜質污染,小于0.4則考慮基因組污染;
2、 Qubit 3.0 進行濃度定量
3、 Agilent 4200 測量RNA完整性RIN值
一般RIN值取值為1-10之間,mRNA大于7則為RNA完整性較好;lnc、circle、miRNA測序要求RIN值大于6。
Bioinformation:
1、 初始數據過濾、質控
GSEA
參考資料: GSEA富集分析
表達量驗證:
Date: 2019-10-29
昨晚轉錄組分析,需要用qRT-PCR進行定量檢驗基因表達量,今天正好和實驗組的人討論了一份用相對定量法檢測缺失的報告,記錄一些相關的信息。
個人理解:
擴增曲線基本如下所示,類似于細菌生長的S型曲線,主要是基線期、指數增長期和平臺期。其中指數增長期與初始的DNA量有關,初始DNA量越大,ct值越小,在圖中表示為越早出峰。這里面有個ct值的概念,ct值可以理解為每個反應管內的熒光信號達到設定的域值時所經歷的循環(huán)數 (cycle)。所以如果出現了DNA片段的缺失,ct值在擴增曲線上會表現出相對于陰性對照更晚出現的S型曲線。另外還有一個參考的值2^-ΔΔCt ,做這個分析時還需要對陰性對照和樣本取一個內參基因,例如GADPH,做校正,最后獲得目標基因的2^-ΔΔCt值。
