(109條消息) p-value,p-adjust,q-value三者的定義與使用_小C_先生的博客-CSDN博客_adjust p value
(109條消息) p-value,q-value,FDR_hyena_7的博客-CSDN博客_pvalue和qvalue區(qū)別
假陰性錯(cuò)誤(false-negative errors): 高水平的基因可能偶爾沒有檢測(cè)到
假陽性錯(cuò)誤(false-positive errors): 低水平表達(dá)的基因由于擴(kuò)增偏差,可能顯得過于豐富,導(dǎo)致假陽性錯(cuò)誤
錯(cuò)誤發(fā)現(xiàn)率(False Discovery Rate,FDR):事先犯I-型錯(cuò)誤的最大概率,控制FDR值來決定p值的值域,F(xiàn)DR用比較溫和的方法對(duì)p值進(jìn)行了校正。其試圖在假陽性和假陰性間達(dá)到平衡,將假/真陽性比例控制到一定范圍之內(nèi)
p-value
概率,反應(yīng)某一事件發(fā)生的可能性大小。
統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法得到的P值,通常以P<0.05為顯著,P<0.01為極顯著,其含義為:
抽樣誤差導(dǎo)致的樣本間的差異的概率小于0.05或0.01。
根據(jù)定義,P值可簡(jiǎn)單理解為判斷結(jié)果的“出錯(cuò)率
(即假陽性比率,假陽性:不是樣本本身有差異,是其他原因(比如抽樣)導(dǎo)致的檢測(cè)結(jié)果有差異)”。
p-adjust
有時(shí)候我們會(huì)在樣本中發(fā)現(xiàn)許多0值,然后少量其它值,這種情況就會(huì)對(duì)p-value的可靠性造成影響,往往這種情況p-value會(huì)很顯著,但很明顯這樣不符合現(xiàn)實(shí)。這種時(shí)候我們就需要對(duì)p-value進(jìn)行校正,校正的流程這里不細(xì)說了,我們可以簡(jiǎn)單理解為,p-adjust是用來判斷p-value是否可信的一個(gè)參數(shù),它來自于p-value,但是相對(duì)于p-value可信度更高。這樣我們就可以知道,在同時(shí)有p-value和p-adjust時(shí),我們應(yīng)該選擇p-adjust用來作為顯著性的閾值。
q-value
q-value另有一些區(qū)別,它也來自于p-value。
q-value可以簡(jiǎn)單理解為表示p-value產(chǎn)生假陽性的概率,當(dāng)q-value < 0.05時(shí),p-value顯著的假陽性小于0.05。
q值(q-value)是p值校正后的結(jié)果。
可定義為:多重假設(shè)檢驗(yàn)過程中,錯(cuò)誤拒絕(拒絕真的原假設(shè)(零假設(shè)))的個(gè)數(shù)占所有拒絕的原假設(shè)個(gè)數(shù)的比例的期望值(也是代表出錯(cuò)率)。
總結(jié):
?p-value和q-value是統(tǒng)計(jì)學(xué)檢驗(yàn)變量,衡量“假陽性概率”,應(yīng)用到基因檢測(cè)結(jié)果中,可衡量“某個(gè)基因差異表達(dá)的假陽性概率”,代表差異顯著性,小于0.05代表結(jié)果有差異。
?如果p-value或q-value/越低,那么“該基因差異結(jié)果”是假陽性的概率就越低,可靠性就越高。
?q-value相比于p-value更加嚴(yán)格,當(dāng)差異基因結(jié)果較少時(shí),可退而求其次根據(jù)p-value篩選。
當(dāng)然,用q值篩選可能會(huì)過濾掉少部分真的有差異的基因,所以,q值是個(gè)雙刃劍。但,相比絕大部分基因的假陽性,以及真陽性被濾掉的小概率,這部分的真陽性的丟失也不是很重要了。