DNA甲基化會調(diào)控基因的表達水平,進而影響基因的相互作用。將基因的相互作用網(wǎng)絡和差異甲基化信息結(jié)合起來,基于那些甲基化水平發(fā)生差異的基因,從整個相互作用網(wǎng)絡挖掘出這些基因的相互作用模塊,這些模塊可以看是與樣本表型數(shù)據(jù)相關(guān)的基因集合,這種研究方式叫做Functional Epigenetic Modules(FEMs), 也叫做hotspots。
在ChAMP中,通過champ.EpiMod函數(shù)進行FEM分析,用法如下:
> library(ChAMP)
> testDir=system.file(“extdata”,package=”ChAMPdata”)
> myLoad <- champ.load(testDir,arraytype=”450K”)
> myNorm <- champ.norm()
> myEpiMod <-champ.EpiMod(beta=myNorm,pheno=myLoad$pd$Sample_Group)
EpiMod 基于兩個輸入數(shù)據(jù):
PPI network ?蛋白質(zhì)相互作用網(wǎng)絡
在ChAMP中,蛋白質(zhì)相互網(wǎng)絡使用的是別人提供的數(shù)據(jù)集hprdAsigH.m。 整個網(wǎng)絡采用鄰接矩陣的表示方式,網(wǎng)絡中中每個節(jié)點是Entrez Gene ID。
> data(hprdAsigH)
> class(hprdAsigH.m)
[1] “matrix”
> str(hprdAsigH.m)
num [1:8434, 1:8434] 0 1 1 0 0 0 0 0 0 0 …
attr(*, “dimnames”)=List of 2
..$ : chr [1:8434] “1510” “10436” “7917” “4173” …
..$ : chr [1:8434] “1510” “10436” “7917” “4173” …
需要注意的是,這個數(shù)據(jù)集是在champ.EpiMod函數(shù)中直接定義的,也就是說在不修改源代碼的情況下,我們只能基于這個數(shù)據(jù)集的PPI網(wǎng)絡進行分析。
但是通常情況下,我們會從其他數(shù)據(jù)庫中獲取到基因的PPI網(wǎng)絡,比如STRING數(shù)據(jù)庫,如果要基于STRING數(shù)據(jù)庫的PPI網(wǎng)絡進行挖掘,就必須修改源代碼了。
2. 差異甲基化信息
首先讀取預處理之后的beta matrix和分組信息Sample_Group,然后進行差異分析
PPI和甲基化差異信息準備好之后,就可以基于這兩個數(shù)據(jù)進行EpiMod分析。分析的結(jié)果是一個一個的module, 每個module看作是從整個PPI網(wǎng)絡中提取出來的sub network。
默認情況下,module的PDF格式的圖片保存在工作目錄下的CHAMP_EpiMod下,同時還會生成topEpiModLists-Epi-X.txt和topEPI-Epi-X.txt兩個文件
CHAMP_EpiMod目錄下是所有的module 的PDF 圖片
以第一個module ANK2為例,
圖中的每個節(jié)點是一個基因,其相互關(guān)系是PPI網(wǎng)絡中定義好的,節(jié)點的顏色根據(jù)差異甲基化的T值定義,小于-1.5的為黃色到白色的漸變色,大于1.5為淺藍色到藍色的漸變色,中間的是灰色。
ChAMP只提供了基于差異甲基化信息從PPI網(wǎng)絡中挖掘核心module的功能,本值上是通過調(diào)用FEM這個R包實現(xiàn)的,在這個R包中,還實現(xiàn)了基于基因水平的差異表達信息從PPI網(wǎng)絡中挖掘核心module 的功能,具體的可以查看FEM的幫助文檔。