分位數(shù)/百分位數(shù)
舉個(gè)例子,我們將某樣本的基因表達(dá)量按表達(dá)量降序排列在坐標(biāo)軸上:

image.png
我們?nèi)≈形粩?shù),該中位數(shù)即50%分位數(shù),表示比它大的數(shù)占總體的50%,比它小的數(shù)占總體的50%
按照這個(gè)標(biāo)準(zhǔn),可取25%分位數(shù),75%分位數(shù)

image.png
Q-Q圖
接著上個(gè)例子,

image.png
我們做出15給基因的表達(dá)量

image.png
根據(jù)每個(gè)基因的表達(dá)情況求出相應(yīng)的分位數(shù),然后畫出任意做出個(gè)正態(tài)曲線,因?yàn)橛?5個(gè)數(shù)據(jù)點(diǎn),所以在正態(tài)曲線上可以分為16個(gè)面積相等的group,即每個(gè)group是等可能的,結(jié)合分位數(shù)的概念不難理解,每塊“面積”代表含百分之多少的數(shù)據(jù)點(diǎn)

image.png
接下來以正態(tài)分布的橫坐標(biāo)為橫坐標(biāo),以分位數(shù)為縱坐標(biāo),將分位數(shù)橫線與正態(tài)曲線的交點(diǎn)畫上去,

image.png
若數(shù)據(jù)符合正態(tài)分布,那么應(yīng)該是擬合成一條直線
分位數(shù)標(biāo)準(zhǔn)化
標(biāo)準(zhǔn)化最大的意義是能夠更正技術(shù)產(chǎn)生的影響,卻不改變生物學(xué)重復(fù)之間的差異。
如何進(jìn)行分位數(shù)標(biāo)準(zhǔn)化,假設(shè)我有三個(gè)樣本,4個(gè)基因的表達(dá)情況:
-
首先計(jì)算每個(gè)樣品表達(dá)量最高的基因的均值,然后將該均值畫到新的坐標(biāo)中
image.png - 依次計(jì)算第二高的,第三高的,第四高的........
-
對(duì)應(yīng)畫到新坐標(biāo)上
image.png
這個(gè)過程就稱為分位數(shù)標(biāo)準(zhǔn)化

