練習(xí)一
用mas5方法計(jì)算每個(gè)探針的表達(dá)是否是真實(shí)的,可以用mas5calss()實(shí)現(xiàn),結(jié) 果中P,M,A分別表示present(表達(dá)),margina,absent(未表達(dá)),請(qǐng)將至少在一個(gè)樣本中表 達(dá)的探針提取出來(lái),并寫入本地result文件夾中(要求:提交代碼和文件)
mas5calls <- mas5calls(raw)
exp.mas5calls <- exprs(mas5calls)
AP <- apply(exp.mas5calls , 1, function(x)any(x=="P"))
exp.mas5calls.filted <- exp.mas5calls[AP,]
write.table(exp.mas5calls.filted,"exp.mas5calls.filted.txt")

提取至少在一個(gè)樣本中表達(dá)的探針
練習(xí)二
請(qǐng)基于樣本間pearson相關(guān)系數(shù),補(bǔ)齊下述代碼,給樣本聚類: (要求:提交代碼和圖文件)
pearson_cor=cor(exp.rma) ###兩兩樣本間的pearson 相關(guān)系數(shù)
dist.lower=as.dist(1-pearson_cor) ###計(jì)算距離矩陣
H <- hclust(dist.lower)
plot(H,cex=0.5); #不然太大了有點(diǎn)
cutree(H,2)

聚類結(jié)果
參考→ R 聚類分析
limma包的貝葉斯檢驗(yàn)原理
貝葉斯所要解決的問(wèn)題就是在有條件限制的情況下,求取某一事件發(fā)生的概率。
例如你去理發(fā)店理發(fā),有可能是發(fā)型總監(jiān)給你服務(wù),也有可能是新來(lái)的實(shí)習(xí)生給你服務(wù)。發(fā)型總監(jiān)給你服務(wù),你的滿意度為99%,實(shí)習(xí)生給你服務(wù),你的滿意度可能只有90%。假定你是第一次去這家理發(fā)店且隨機(jī)指定了一個(gè)人給你服務(wù),結(jié)果你很滿意,那么求發(fā)型總監(jiān)給你服務(wù)的概率或者實(shí)習(xí)生給你服務(wù)的概率這個(gè)問(wèn)題就屬于貝葉斯分類問(wèn)題。
條件概率
條件概率通常記為P(B/A),表示在事件A發(fā)生的情況下,事件B發(fā)生的概率。
上即為事件A發(fā)生的條件下事件B發(fā)生的概率。設(shè)試驗(yàn)的基本事件總數(shù)為n,事件A包含的所有情況數(shù)量為m(m>0),事件AB包含的情況數(shù)量為s,則有

對(duì)于上述公式,注意P(A)>0
條件概率P( · |A)符合概率定義的三個(gè)條件:
- 非負(fù)性 對(duì)于每個(gè)事件B,有P(B|A) >= 0
- 規(guī)范性 對(duì)于必然事件S,有P(S|A)= 1;
- 可列可加 設(shè)B1,B2,..是兩兩互斥 →樸素貝葉斯
image.png
