RPKM、FPKM、TPM的區(qū)別

測序read數(shù)會(huì)受到基因長度和測序深度影響,解決方案如下:
1、基因長度影響--將測序Read數(shù)除以基因長度;2、測序深度影響--將Read數(shù)除以總Read數(shù)進(jìn)行標(biāo)準(zhǔn)化

簡寫

RPM/CPM: Reads/Counts of exon model per Million mapped reads (每百萬映射讀取的reads)
--本次某個(gè)基因read數(shù)/本次測序總read數(shù)(先對測序深度歸一化)

RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的reads)
--(某樣本特定基因read數(shù) /某樣本測序總read數(shù))*10^3 *10^6/ 基因長度 (先對測序深度歸一化得到RPM,再對基因長度歸一化RPKM)

FPKM: Fragments Per Kilobase of exon model per Million mapped fragments(每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的fragments)
--(某樣本特定基因read數(shù) /某樣本測序總read數(shù))*10^3 10^62(雙端)/ 基因長度(先對測序深度歸一化得到FPM,再對基因長度歸一化得到FPKM)

TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)
--(某樣本特定基因read數(shù)/基因長度)*10^3 *10^6 /某樣本測序總read數(shù)(先進(jìn)行基因長度標(biāo)準(zhǔn)化得到RPK,后進(jìn)行測序深度標(biāo)準(zhǔn)化得到TPM )

RPKM

RPKM--代表每百萬reads中來自于某基因每千個(gè)堿基轉(zhuǎn)錄得到的reads數(shù)。是將map到基因的read數(shù)除以map到基因組上的所有read數(shù)(以million為單位)與RNA的長度(以KB為單位)之積。

RPKM計(jì)算公式

total exon reads:樣本中某個(gè)基因mapping到外顯子上的所有的reads數(shù)

mapped reads (Millions) :樣本總reads數(shù)

exon length(KB):某個(gè)基因的長度(外顯子長度的總和,以KB為單位)

RPKM公式簡化

FPKM

FPKM與RPKM計(jì)算方法基本一致。FPKM 計(jì)算的是DNA片段(fragments),也就是一對reads。與RPKM 的差別主要體現(xiàn)在,F(xiàn)PKM在一對reads map上的情況下只計(jì)數(shù)1,而RPKM 會(huì)計(jì)為2。適用于雙端測序。

FPKM計(jì)算公式

在單端測序中,一個(gè)Fragments只測一條Reads,所以,Reads數(shù)與Fragments數(shù)目相等;
在雙端測序中,一個(gè)Fragments測兩端,會(huì)得到2條Reads,但由于后期質(zhì)量或比對的過濾,有可能一個(gè)Fragments的2條Reads最后只有一條進(jìn)入最后的表達(dá)量分析。
總之,對某一對Reads而言,這2條Reads只能算一個(gè)Fragments,所以,F(xiàn)ragment的最終數(shù)目是Reads的1到2倍之間??

FPKM(RPKM)適用于:同一個(gè)樣本中基因A和基因B的相對表達(dá)量

TPM

TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)

TPM計(jì)算公式

Ni:比對到第i個(gè)exon的reads數(shù)

Li:第i個(gè)exon的長度

sum(N1/L1+N2/L2 + ... + Nn/Ln):所有 (n個(gè))exon按長度進(jìn)行標(biāo)準(zhǔn)化之后數(shù)值的和

TPM其實(shí)跟RPKM,F(xiàn)PKM也很相似。TPM唯一不同的地方就是計(jì)算次序不一樣。所以,當(dāng)計(jì)算TPM的時(shí)候,先對基因長度進(jìn)行歸一化,其次是測序深度的歸一化。然而,歸一化次序不一樣,對結(jié)果影響差別就很大。當(dāng)使用TPM時(shí)候,每個(gè)樣本的TPM總和是一樣的(=10^6)。這使得比較同一個(gè)基因的reads數(shù)在不同樣本間的比例變得容易。FPKM和RPKM與此相反,每個(gè)樣本的FPKM或RPKM的累加和可以不一樣,造成樣本間不能直接比較FPKM或RPKM值。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容