在上一篇文章《GEO數(shù)據(jù)挖掘:(一)尋找共同差異基因》中我們通過兩個實驗的數(shù)據(jù)尋找到了一些差異基因,本篇文章將對這些差異基因的互作關(guān)系進行簡單的分析,用到的工具主要有String和Cytoscape.
1、利用String進行蛋白互作網(wǎng)絡(luò)分析
STRING是蛋白質(zhì)相互作用數(shù)據(jù)庫,可用來分析已知蛋白之間和預(yù)測蛋白質(zhì)之間相互作用。
這里我們是分析多個蛋白質(zhì)之間的互作關(guān)系,如上圖依次進行操作:
(1)選擇輸入選項--Multiple proteins;
(2)選擇輸入文件,也可復(fù)制所有基因粘貼到上面的輸入框中;
(3)選擇物種,這里選擇人類;
(4)點擊SEARCH進行搜索分析。
進入主頁,如下圖,這里既可以輸入一個蛋白分析其與已知蛋白質(zhì)之間的聯(lián)系,還可以輸入多個蛋白分析他們之間的互作關(guān)系。

搜索分析后會出現(xiàn)多個結(jié)果,一般選擇默認的直接點擊continue即可,如下:

最后便會出現(xiàn)我們輸入基因的檢索結(jié)果:

上面展示了默認的蛋白互作網(wǎng)絡(luò)圖,通過下方的settings選項,我們可以設(shè)置建立互作關(guān)系的閾值以及網(wǎng)絡(luò)圖中邊線表示的意義:
(1)evidence:不同顏色的線表示不同證據(jù);
(2)confidence:兩個蛋白質(zhì)相互作用越強連線越粗;
(3)actions:不同顏色和形狀的線表示不同的作用。
其中各種不同邊線表示的意思可以在Legend中進行查看。
在Analysis中可以查看GO和KEGG通路分析結(jié)果,但在這里沒有發(fā)現(xiàn)KEGG分析結(jié)果:

點擊下方的download下載GO分析結(jié)果。
在Exports選項中可以根據(jù)自己的需要導(dǎo)出網(wǎng)絡(luò)圖以及表示網(wǎng)絡(luò)中各個節(jié)點關(guān)系的文本文件。
這里我們導(dǎo)出存有各基因關(guān)系的tsv文件和互作網(wǎng)絡(luò)圖。

2、利用cytoscape繪制蛋白互作網(wǎng)絡(luò)
利用從String中導(dǎo)出的蛋白互作關(guān)系文件在cytoscape中繪制網(wǎng)絡(luò)圖。
2.1 簡介
先簡單的介紹一下cytoscape的界面:

其中較為值得注意的是菜單欄的select和網(wǎng)絡(luò)處理面板。select可用來簡單的挑選子網(wǎng)絡(luò),而網(wǎng)絡(luò)處理面板則是對網(wǎng)絡(luò)進行相關(guān)的設(shè)置:
(1)network:包括所有創(chuàng)建的網(wǎng)絡(luò),可以選擇相應(yīng)的網(wǎng)絡(luò)進行操作
(2)style:屬性(node/edge/network)
- Node:對點進行設(shè)置,包括:點的形狀、顏色、大??;點邊界線的類型、顏色、寬度;點標簽的顏色、大??;點背景色的透明度等
- Edge:對邊進行設(shè)置,包括:邊的類型、顏色、寬度;目標處箭頭類型等。
- Network:對網(wǎng)絡(luò)整體屬性進行設(shè)置,包括:背景標題等
(3) Select:面板用于篩選符合特定標準的邊
2.2 生成初始網(wǎng)絡(luò)互作圖
導(dǎo)入tab分隔文件(這里為string中導(dǎo)出的tsv文件),生成網(wǎng)絡(luò)互作圖:

選擇好文件打開后,會出現(xiàn)下面的界面,表示哪些列的信息會在我們繪圖中用到。第一列一般表示source gene,第二列則表示target gene,表示關(guān)系則為source與target相連。后面的多列可用來表示相關(guān)的一些附加信息,映射(map)到網(wǎng)絡(luò)圖形元素(如形狀大小、線條粗細、顏色等),非必須信息。這里我們只用前兩列,因此需要把后面的多列都給禁用掉。

最后點擊ok便會生出網(wǎng)絡(luò)圖:

可以看到這個網(wǎng)絡(luò)圖與string中生成的網(wǎng)絡(luò)圖是一致的。
可以用鼠標選擇節(jié)點移動,還可以通過ctrl+鼠標進行選擇多個節(jié)點一起移動使網(wǎng)絡(luò)圖看起來更美觀。
2.3 網(wǎng)絡(luò)圖美化以附加信息的可視化
美化網(wǎng)絡(luò)主要在style選項,如下:

style中各個圖形參數(shù)除了可以直接指定外還可以進行映射(map),也就是將附加信息在各個圖形元素上反映出來,下面將先會先對網(wǎng)絡(luò)圖進行分析,然后將node degree映射到節(jié)點大小上。
Degree:指的是有多少節(jié)點與我直接相連,也就是與我距離為1,有一條邊直接相連的鄰居,對于有向圖中要分為出度和入度,從名字就可以看出差別,出度數(shù)是從我這個節(jié)點指向別的節(jié)點邊的條數(shù),入度數(shù)指的鄰居節(jié)點有邊與我相連,并且方向是指向我這個節(jié)點的邊的條數(shù)。
Betweenness centrality:指的是圖中有路勁相連的兩個節(jié)點這樣的邊中有多少條邊經(jīng)過本節(jié)點,也就是說這個計算的是它處在其他節(jié)點相連路勁中間的比例。
closeness:計算的是到圖中其他節(jié)點的距離總和比較小,這個更接近與中心度,計算的是這個節(jié)點處于圖中間位置的程度。作者:lemondy
鏈接:https://www.zhihu.com/question/22610633/answer/89577479
來源:知乎
先對網(wǎng)絡(luò)圖進行分析,依次點擊Tools->NetworkAnalyzer->Network Analysis->Analyze Network,生成統(tǒng)計分析結(jié)果如下:

接下來我們將,Node degree統(tǒng)計結(jié)果映射到節(jié)點大小上面:

除了大小外,顏色也可進行映射。另一個較為有用的映射是蛋白間上調(diào)、抑制關(guān)系的映射,這種一般需要提前將信息放在輸入文件中。
2.5 提取子網(wǎng)絡(luò)
對于做好的網(wǎng)絡(luò)圖提取子網(wǎng)絡(luò)既可以直接通過工具欄中的select選項來進行選擇所需節(jié)點,還可以使用插件MCODE來分析得到子網(wǎng)絡(luò)。在Apps中可直接安裝MCODE。
這個分析主要能夠幫我們發(fā)現(xiàn)在network中聯(lián)系更緊密的群組或者基因。安裝好后在Apps中打開MCODE,一般使用默認參數(shù)來生成子網(wǎng)絡(luò)即可:


在結(jié)果框中可以看到我們的分析結(jié)果,包括得分以及其他信息。
3、GO、KEGG富集分析
最后,我們再使用David來對差異基因做個富集分析。網(wǎng)址:https://david.ncifcrf.gov/summary.jsp

提交后,會轉(zhuǎn)到list項頁面,選擇物種進行分析:


下載通路注釋文件:

最后,看看下載的文件是什么樣子把:

可以看到對每個基因都有相關(guān)通路的詳細注釋。