RPKM、FPKM、TPM計(jì)算公式

基因表達(dá)量的衡量指標(biāo)有:RPKM、FPKM、TPM。

RPKM:Reads Per Kilobase Million=Reads Per Kilobase Per Million Reads,即每一百萬條Reads中,對基因的每1000個(gè)Base而言,比對到該1000個(gè)base的Reads數(shù)。

image
R1=map到該基因的reads總數(shù)
L1=該基因長度
RT=map到基因組的總reads數(shù)

FPKM:Fragments Per Kilobase Million=Fragments Per Kilobase Per Million Reads。

image
F1=map到該基因的fragments總數(shù)
L1=該基因長度
FT=map到基因組的總fragments數(shù)

FPKM與RPKM的區(qū)別僅在于,F(xiàn)ragment 與 Read。
RPKM的誕生是針對早期的單端測序,F(xiàn)PKM則是在雙端測序上對RPKM的校正。
Reads即是指下機(jī)后fastq數(shù)據(jù)中的每一條Reads,F(xiàn)ragments則是指每一段用于測序的核酸片段。
在單端測序中,一個(gè)Fragments只測一條Reads,所以,Reads數(shù)與Fragments數(shù)目相等;
在雙端測序中,一個(gè)Fragments測兩端,會得到2條Reads,但由于后期質(zhì)量或比對的過濾,有可能一個(gè)Fragments的2條Reads最后只有一條進(jìn)入最后的表達(dá)量分析。
總之,對某一對Reads而言,這2條Reads只能算一個(gè)Fragments,所以,F(xiàn)ragment的最終數(shù)目是Reads的1到2倍之間。

TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)。
TPM的計(jì)算分3步:
step1:根據(jù)基因/轉(zhuǎn)錄本長度校正count值;假設(shè)某基因count值為R1,則校正后count值為:
R1/(L1/1000) : L1為該基因的長度;為什么要除以1000,是因?yàn)榛蜷L度要按照kb計(jì)算
step2:計(jì)算total 校正后count值;即所有基因的校正后count值總和,Rtotal;再除以1百萬(1000000)。
step3:計(jì)算TPM;TPM結(jié)果為:

image.png

來自:http://www.itdecent.cn/p/fb113ca65a46

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容