什么是假設(shè)檢驗(yàn)

什么是假設(shè)檢驗(yàn)

image-20200217233648814.png

假設(shè)檢驗(yàn):

參數(shù)檢驗(yàn):T檢驗(yàn), 對照組為122,實(shí)驗(yàn)組為234,檢測實(shí)驗(yàn)組比對照組顯著,認(rèn)為各組結(jié)果是服從正態(tài)分布的,所以比較的是各組的平均值。

非參數(shù)檢驗(yàn):不用T檢驗(yàn),不符合正態(tài)分布,需要用非參數(shù)檢驗(yàn),結(jié)果說那個偏大,那個偏小。參數(shù)檢驗(yàn)要比非參要好。

image-20200217234348959.png
假設(shè)檢驗(yàn)的基本思想
image-20200217234859267.png
假設(shè)檢驗(yàn)的一般步驟:
image-20200217235108361.png
舉例

當(dāng)?shù)鼐蹬c國家均值不同可能有兩種情況

image-20200217235249391.png

P Value

(??)P Value的含義

[圖片上傳中...(image-20200217235725683.png-9d2406-1583768770435-0)]

R語言中的P Value

計(jì)算P Value 由于多函數(shù),但都包括p、q、d、r


image-20200218000646033.png
pnorm(-1.96,mean = 0,sd = 1)#p和q是反著的,計(jì)算概率  
qnorm(0.99,mean = 0,sd = 1)#計(jì)算分位數(shù),正態(tài)分布的3 sigma法則
dnorm(-10:10,mean = 0,sd = 1)#概率密度
plot(dnorm(seq(-10,10,length.out = 1000),mean = 0,sd =1))#概率密度曲線
#模擬正態(tài)分布
rnorm(1000,mean = 5,sd = 2)
set.seed(20200218)#加隨機(jī)種子,保證隨機(jī)取樣重復(fù)出現(xiàn)、
rnorm(2,mean = 5,sd = 2)
image-20200218002317096.png
生信中的例子1
image-20200218002619715.png
image-20200218002717809.png
生信中例子2

ChiP-Seq:染色體免疫共沉淀技術(shù)

1??藍(lán)色和黃色都是蛋白,想知道藍(lán)色結(jié)合DNA的序列

2??先用甲醛使蛋白和DNA結(jié)合鉸鏈

3??用藍(lán)色蛋白抗體結(jié)合,把蛋白和DNA拽下來

4??進(jìn)行測序,找鼓包


image-20200218003003952.png

input為對照樣本

image-20200218003514949.png
> ppois(20,lambda = 5)#小于等于20的時候
[1] 0.9999999
> 1-ppois(20,lambda = 5)#pvalue為極端值概率,則大于20時候
[1] 8.10925e-08
#pvalue很小,則認(rèn)為可能是個peak, 但是在全基因組中reads多,pvalue都很小,則需要進(jìn)行pvalue的校正。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容