什么是假設(shè)檢驗(yàn)

image-20200217233648814.png
假設(shè)檢驗(yàn):
參數(shù)檢驗(yàn):T檢驗(yàn), 對照組為122,實(shí)驗(yàn)組為234,檢測實(shí)驗(yàn)組比對照組顯著,認(rèn)為各組結(jié)果是服從正態(tài)分布的,所以比較的是各組的平均值。
非參數(shù)檢驗(yàn):不用T檢驗(yàn),不符合正態(tài)分布,需要用非參數(shù)檢驗(yàn),結(jié)果說那個偏大,那個偏小。參數(shù)檢驗(yàn)要比非參要好。

image-20200217234348959.png
假設(shè)檢驗(yàn)的基本思想

image-20200217234859267.png
假設(shè)檢驗(yàn)的一般步驟:

image-20200217235108361.png
舉例
當(dāng)?shù)鼐蹬c國家均值不同可能有兩種情況

image-20200217235249391.png
P Value
(??)P Value的含義
[圖片上傳中...(image-20200217235725683.png-9d2406-1583768770435-0)]
R語言中的P Value
計(jì)算P Value 由于多函數(shù),但都包括p、q、d、r

image-20200218000646033.png
pnorm(-1.96,mean = 0,sd = 1)#p和q是反著的,計(jì)算概率
qnorm(0.99,mean = 0,sd = 1)#計(jì)算分位數(shù),正態(tài)分布的3 sigma法則
dnorm(-10:10,mean = 0,sd = 1)#概率密度
plot(dnorm(seq(-10,10,length.out = 1000),mean = 0,sd =1))#概率密度曲線
#模擬正態(tài)分布
rnorm(1000,mean = 5,sd = 2)
set.seed(20200218)#加隨機(jī)種子,保證隨機(jī)取樣重復(fù)出現(xiàn)、
rnorm(2,mean = 5,sd = 2)

image-20200218002317096.png
生信中的例子1

image-20200218002619715.png

image-20200218002717809.png
生信中例子2
ChiP-Seq:染色體免疫共沉淀技術(shù)
1??藍(lán)色和黃色都是蛋白,想知道藍(lán)色結(jié)合DNA的序列
2??先用甲醛使蛋白和DNA結(jié)合鉸鏈
3??用藍(lán)色蛋白抗體結(jié)合,把蛋白和DNA拽下來
4??進(jìn)行測序,找鼓包

image-20200218003003952.png
input為對照樣本

image-20200218003514949.png
> ppois(20,lambda = 5)#小于等于20的時候
[1] 0.9999999
> 1-ppois(20,lambda = 5)#pvalue為極端值概率,則大于20時候
[1] 8.10925e-08
#pvalue很小,則認(rèn)為可能是個peak, 但是在全基因組中reads多,pvalue都很小,則需要進(jìn)行pvalue的校正。