以下兩張圖引用芯片數(shù)據(jù)標(biāo)準(zhǔn)化

1.png

2.png
表達芯片包括affymetrix系列芯片和illumina出廠的芯片兩種。
其中affymetrix系列芯片最常用,分析套路很簡單,直接用R的affy包,就可以把cel文件經(jīng)過RMA或者MAS5方法得到表達矩陣。
而illumina出廠的芯片略微有點不一樣,它的原始數(shù)據(jù)有3個層級,一般拿到的是Processed data, 仍然需要一系列的統(tǒng)計學(xué)方法才能提取到表達矩陣。
參考生信技能書,用lumi包來處理這個芯片數(shù)據(jù)。
lumi包的使用代碼和說明書如下:
http://bioconductor.org/packages/release/bioc/html/lumi.html
http://bioconductor.org/packages/release/bioc/manuals/lumi/man/lumi.pdf
實戰(zhàn)
https://zhuanlan.zhihu.com/p/148801147
方法一、lumi包
##加載lumi包
library(lumi)
# 賦值文件名稱給fileName
fileName <- 'GSE76427_non-normalized.txt.gz'
#讀入GSE***_non-normalized.txt文件數(shù)據(jù)
data <- lumiR.batch(fileName)
##1.得到樣本數(shù)據(jù)
pData<-pData(phenoData(data))
## 2.從原始數(shù)據(jù)中得到得到標(biāo)準(zhǔn)化后的表達數(shù)據(jù)
data <- lumiExpresso(data)
boxplot(data)

標(biāo)準(zhǔn)化.png

lumi.png