基因表達(dá)量的衡量指標(biāo)有:RPKM、FPKM、TPM。
RPKM:Reads Per Kilobase Million=Reads Per Kilobase Per Million Reads,即每一百萬條Reads中,對基因的每1000個(gè)Base而言,比對到該1000個(gè)base的Reads數(shù)。

R1=map到該基因的reads總數(shù)
L1=該基因長度
RT=map到基因組的總reads數(shù)
FPKM:Fragments Per Kilobase Million=Fragments Per Kilobase Per Million Reads。

F1=map到該基因的fragments總數(shù)
L1=該基因長度
FT=map到基因組的總fragments數(shù)
FPKM與RPKM的區(qū)別僅在于,F(xiàn)ragment 與 Read。
RPKM的誕生是針對早期的單端測序,F(xiàn)PKM則是在雙端測序上對RPKM的校正。
Reads即是指下機(jī)后fastq數(shù)據(jù)中的每一條Reads,F(xiàn)ragments則是指每一段用于測序的核酸片段。
在單端測序中,一個(gè)Fragments只測一條Reads,所以,Reads數(shù)與Fragments數(shù)目相等;
在雙端測序中,一個(gè)Fragments測兩端,會得到2條Reads,但由于后期質(zhì)量或比對的過濾,有可能一個(gè)Fragments的2條Reads最后只有一條進(jìn)入最后的表達(dá)量分析。
總之,對某一對Reads而言,這2條Reads只能算一個(gè)Fragments,所以,F(xiàn)ragment的最終數(shù)目是Reads的1到2倍之間。
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的Transcripts)。
TPM的計(jì)算分3步:
step1:根據(jù)基因/轉(zhuǎn)錄本長度校正count值;假設(shè)某基因count值為R1,則校正后count值為:
R1/(L1/1000) : L1為該基因的長度;為什么要除以1000,是因?yàn)榛蜷L度要按照kb計(jì)算
step2:計(jì)算total 校正后count值;即所有基因的校正后count值總和,Rtotal;再除以1百萬(1000000)。
step3:計(jì)算TPM;TPM結(jié)果為:
