學(xué)習(xí):StatQuest-分位數(shù)與百分位,Q-Q圖,分位數(shù)標(biāo)準(zhǔn)化

分位數(shù)/百分位數(shù)

舉個(gè)例子,我們將某樣本的基因表達(dá)量按表達(dá)量降序排列在坐標(biāo)軸上:


image.png

我們?nèi)≈形粩?shù),該中位數(shù)即50%分位數(shù),表示比它大的數(shù)占總體的50%,比它小的數(shù)占總體的50%
按照這個(gè)標(biāo)準(zhǔn),可取25%分位數(shù),75%分位數(shù)


image.png

Q-Q圖

接著上個(gè)例子,


image.png

我們做出15給基因的表達(dá)量


image.png

根據(jù)每個(gè)基因的表達(dá)情況求出相應(yīng)的分位數(shù),然后畫出任意做出個(gè)正態(tài)曲線,因?yàn)橛?5個(gè)數(shù)據(jù)點(diǎn),所以在正態(tài)曲線上可以分為16個(gè)面積相等的group,即每個(gè)group是等可能的,結(jié)合分位數(shù)的概念不難理解,每塊“面積”代表含百分之多少的數(shù)據(jù)點(diǎn)
image.png

接下來以正態(tài)分布的橫坐標(biāo)為橫坐標(biāo),以分位數(shù)為縱坐標(biāo),將分位數(shù)橫線與正態(tài)曲線的交點(diǎn)畫上去,


image.png

若數(shù)據(jù)符合正態(tài)分布,那么應(yīng)該是擬合成一條直線

分位數(shù)標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化最大的意義是能夠更正技術(shù)產(chǎn)生的影響,卻不改變生物學(xué)重復(fù)之間的差異。
如何進(jìn)行分位數(shù)標(biāo)準(zhǔn)化,假設(shè)我有三個(gè)樣本,4個(gè)基因的表達(dá)情況:

  1. 首先計(jì)算每個(gè)樣品表達(dá)量最高的基因的均值,然后將該均值畫到新的坐標(biāo)中


    image.png
  2. 依次計(jì)算第二高的,第三高的,第四高的........
  3. 對(duì)應(yīng)畫到新坐標(biāo)上


    image.png

    這個(gè)過程就稱為分位數(shù)標(biāo)準(zhǔn)化

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容