RNA-seq的三個(gè)主要步驟
- 建庫
- 測(cè)序
- 數(shù)據(jù)分析
1. 建庫

workflow
step1 分離RNA
step2 打斷RNA
測(cè)序機(jī)器一次最多只能測(cè)200-300bp
step3 逆轉(zhuǎn)錄成雙鏈cDNA
DNA比RNA更穩(wěn)定,更易擴(kuò)增和修飾
step4 加接頭
1)讓測(cè)序機(jī)器識(shí)別序列片段
2)用不同的接頭同時(shí)測(cè)序不同的樣品
step5 PCR擴(kuò)增
step6 QC
2. 測(cè)序

- 原理:序列片段垂直的連接到“flow cell”上,測(cè)序儀通過特異性熒光探針連接到堿基,一層一層測(cè)序,每測(cè)一層拍照識(shí)別,識(shí)別后洗脫顏色繼續(xù)測(cè)序。
- 質(zhì)量分?jǐn)?shù)的產(chǎn)生原因:
-
有些熒光探針會(huì)失效
-
低多樣性的產(chǎn)生(一般發(fā)生在測(cè)序開始,機(jī)器識(shí)別序列片段位置的時(shí)候)
-
有些熒光探針會(huì)失效
-
測(cè)序結(jié)果
- @ 唯一的序列ID標(biāo)識(shí)符,可選的序列描述內(nèi)容,以空格分開
- 序列信息
- +后為空或加上@后信息
- 堿基質(zhì)量字符 可以按一定規(guī)則轉(zhuǎn)換為堿基質(zhì)量得分,進(jìn)而反映該堿基的錯(cuò)誤率。
- 比對(duì)參考基因組
-
過濾低質(zhì)量基因reads
正常read
低質(zhì)量read - reads計(jì)數(shù)
-
標(biāo)準(zhǔn)化reads計(jì)數(shù)
舉例--為什么要標(biāo)準(zhǔn)化
影響計(jì)數(shù)的原因:1.reads質(zhì)量 2.reads濃度
3.數(shù)據(jù)分析
- PCA畫圖:1.可視化差異 2.排除異常樣本
- 差異表達(dá)分析:三大R包





