使用Cytoscape中的Enrichmen進(jìn)行富集分析可視化tMap

Enrichment Map是一個用于功能豐富可視化Cytoscape軟件的插件,必須使用任何可用方法在EnrichmentMap之外生成富集結(jié)果。將基因集(例如通路和Gene Ontology terms)組織成網(wǎng)絡(luò)(即“enrichment map”)可以是GSEA和g:Profiler的結(jié)果,當(dāng)然也可以是DAVID,BINGO等其他的富集結(jié)果。 通過這種方式,相互重疊的基因組聚集在一起,使解釋更加容易,Nodes代表基因集,edge代表每個set間的重疊。? EnrichmentMap還可以在同一個map中比較兩種不同的富集結(jié)果。

一.對g:Profiler的通路富集分析結(jié)果進(jìn)行可視化

1. 打開Cytoscape軟件,點(diǎn)擊Apps,選擇EnrichmentMap; 如果沒在Cytoscape中安裝EnrichmentMap,點(diǎn)擊Apps,選擇Managers,在搜索框中搜索EnrichmentMap, 點(diǎn)擊install.然后再點(diǎn)擊Apps選擇EnrichmentMap.

2.在Create Enrichment Map中點(diǎn)擊文件夾圖標(biāo)

3. 找到你的g:Profiler_result的文件夾之后點(diǎn)擊打開,然后在右邊的框中就會自動加載g:Profiler得到的結(jié)果文件。


加載了g:Profiler_result文件夾中的數(shù)據(jù)

4.可以在Name框中修改分析的名字,默認(rèn)情況下是和加載到的Enrichments中的文件名字是一樣的,可以進(jìn)行修改。

5. Analysis Type選擇Generic/gProfiler,如果你是對GSEA富集分析結(jié)果進(jìn)行可視化,則選擇GSEA,此外還有David和Bingo可以選擇。

6. Enrichment中的文件是在3步中自動填充的數(shù)據(jù)文件,這個文件是g:Profiler分析之后下載得到的結(jié)果文件。

7.選項(xiàng) Expressions:這里可以選擇上傳g:Profiler中分析的基因的表達(dá)矩陣,或者上傳所有基因的表達(dá)數(shù)據(jù)集。 如果表達(dá)數(shù)據(jù)集包含未用于g:Profiler搜索的其他基因,則它們的表達(dá)值仍將顯示在富集圖的熱圖中。

8.選項(xiàng)Rank:可以指定基因列表或表達(dá)數(shù)據(jù)的排列。

9. 選項(xiàng)Classes: 這是GSEA CLS文件,定義表達(dá)文件中每個樣品的表型(即生物學(xué)條件),此文件僅適用于GSEA中的表型隨機(jī)化。但是,將它提供給EnrichmentMap,則會按表現(xiàn)型在mentmap heat map viewer中標(biāo)記表達(dá)文件的列。

10.選項(xiàng)Phenotypes: 如果表達(dá)數(shù)據(jù)中存在兩種不同的表型,則更新表型標(biāo)簽,使“陽性”表示與陽性值相關(guān)的表型(本例中為間充質(zhì)),“陰性”表示與陰性值相關(guān)的表型(如免疫反應(yīng)性)。

調(diào)參數(shù):

Number of Nodes通常情況下,g:Profiler僅返回統(tǒng)計學(xué)上顯著的結(jié)果(Q <0.05),因此可以在EnrichmentMap輸入面板中將FDR q值截止參數(shù)設(shè)置為1,除非需要更嚴(yán)格的過濾。這里將FDR Q值設(shè)置為0.01。選項(xiàng) 勾選Filter genes by expressions,用于排除在提供的表達(dá)文件中找不到的定義的基因集文件(即GMT文件)中的任何基因。如果不勾選Filter genes by expressions,則將保留表達(dá)文件中未找到的任何基因,并且將在expression heat map viewer中顯示其所有關(guān)聯(lián)的表達(dá)值,顯示為灰色。

Number of Nodes參數(shù)


Number of Edges:將連接性滑塊放在中間。如果網(wǎng)絡(luò)由于太多的連接(邊緣)而過于雜亂,那么將滑塊向左移動,使網(wǎng)絡(luò)更加稀疏?;蛘?,如果網(wǎng)絡(luò)過于稀疏(即,則將滑塊向右移動,以獲得連接更緊密的網(wǎng)絡(luò)。


保持在中間,左邊為稀疏右邊為緊密

將滑塊向左(或向右)移動將調(diào)整基礎(chǔ)相似性統(tǒng)計閾值,以得到的網(wǎng)絡(luò)更稀疏(或更)?;瑝K設(shè)置為預(yù)定義的默認(rèn)值,但用戶可以通過選擇“Create Enrichment Map”面板底部的“Show advanced options”來微調(diào)相似性度量。預(yù)定義值在滑塊上顯示為刻度線,包括Jaccard > 0.35, Jaccard > 0.25, combined >0.375, overlap > 0.5, and overlap > 0.25.


Show advanced options
點(diǎn)擊Show advanced options


combined


Jaccard


overlap

單擊EnrichmentMap輸入面板底部的“Build”按鈕。 將出現(xiàn)Building EnrichmentMap框并指示進(jìn)度狀態(tài)。 成功創(chuàng)建map后,此框?qū)⑾А?/p>


右下角的build按鈕

加載完數(shù)據(jù)之后點(diǎn)擊build運(yùn)行結(jié)果。


選擇結(jié)束


正在運(yùn)行的進(jìn)度條



結(jié)束后就可以看到結(jié)果

放大圖片可以看到每個紅色的點(diǎn)(代表通路)中還標(biāo)有通路的名字


放大結(jié)果圖


EnrichmentMap結(jié)果解釋:

以個Enrichment map必須闡述一些關(guān)于一個dataset的新發(fā)現(xiàn)的信息,因此必須要手動去創(chuàng)建一個具有發(fā)表質(zhì)量的圖。

可以使用“Control Panel”最左側(cè)的選項(xiàng)卡選擇“Network Panel”,選擇Network Panel之后會出現(xiàn)一個主窗口,使用Cytoscape控件導(dǎo)航到它(縮放和平移),并通過讀取基因集標(biāo)簽來探索通路。具有許多共同基因的途徑通常代表相似的生物過程并且被組合在一起作為網(wǎng)絡(luò)中的子網(wǎng)絡(luò)或主題。單擊節(jié)點(diǎn)(被單擊的節(jié)點(diǎn)顯示黃色)可以在網(wǎng)絡(luò)視圖下方的表格中顯示出相應(yīng)的基因。


單擊節(jié)點(diǎn)之后的得到的Heat Map格

如果要查找感興趣的基因或通路,請?jiān)谟疑辖堑乃阉鳈谥休斎肫涿Q,包含這個基因的通路都會被高亮顯示。如:搜索TP53基因

搜索TP53基因

要查找最富集的通路,可以查看網(wǎng)絡(luò)視圖下方的“Table Panel”, 選擇Node Table選項(xiàng)卡,然后通過單擊列標(biāo)題選擇并排序名為'EM#_fdr_qvalue'(對于g:Profiler富集結(jié)果可視化圖)或'EM#_NES'(對于GSEA富集結(jié)果可視化圖)的列。要突出顯示網(wǎng)絡(luò)中這些通路的子集,需要選擇與你感興趣的通路對應(yīng)的行,右鍵單擊表中的任何你所選定的行,然后選擇“Select nodes from selected rows”。

例如下圖:


選中一行右鍵單擊選擇“Select nodes from selected rows”

可以將分析圖片以PDF的格式保存到本地:Cytoscape菜單欄,選擇“File”——Export as Image,然后設(shè)置為PDF格式。除了PDF格式之外,還有其他的格式。推薦基于矢量的PDF和SVG格式用作出版物質(zhì)量的圖,因?yàn)樗鼈兛梢栽诓粨p失質(zhì)量的情況下進(jìn)行縮放。而不推薦使用JPG格式,因?yàn)樗赡軙蛴袚p壓縮而導(dǎo)致視覺偽像。


二.對GSEA通路富集分析結(jié)果進(jìn)行EnrichmentMap可視化分析

與g:Profiler的操作類似:加載數(shù)據(jù),設(shè)在參數(shù)

用Mesenchymal替代na_pos,Immunoreactive替代na_neg.


紅色節(jié)點(diǎn)表示Mesenchymal,因?yàn)閜ositive phenotype,而藍(lán)色節(jié)點(diǎn)表達(dá)Immunoreactive


三.根據(jù)分析的重點(diǎn),可以對得到的Enrichment map進(jìn)行不同的操作。


1.探索Table Panel 的heat map。

(1)當(dāng)提供基因表達(dá)矩陣(Expressions選項(xiàng)中輸入表達(dá)矩陣文件)作為EnrichmentMap的輸入時,我們可以研究包含在富集通路中的基因的表達(dá)模式。 單擊單個節(jié)點(diǎn)或一組節(jié)點(diǎn)以生成基因表達(dá)的熱圖,該熱圖將顯示在“able Panel”面板的“heat map”選項(xiàng)卡中。如果分析基于GSEA結(jié)果并且提供了Ranks文件,則“l(fā)eading edge”基因?qū)⒁渣S色突出顯示以用于單個節(jié)點(diǎn)選擇,有多種熱圖可視化選項(xiàng)可供選擇。


單擊一個節(jié)點(diǎn)得到的Heat map,其中Expressions選擇"Row Norm", Compress選擇“None”

(2)調(diào)整“sort”選項(xiàng)。 排序選項(xiàng)包括分層聚類,排名或不排序。 要更改排序選項(xiàng),請單擊熱圖表左上角可見的“Sort”按鈕。默認(rèn)情況下,如果提供了Rank文件,則熱圖按Rank排序。 如果沒有rank文件,則不應(yīng)用排序。 可以通過位于“熱圖”面板右上角的“設(shè)置”菜單(values后面有一個設(shè)置按鈕)上傳其他等級文件以進(jìn)行比較。

(3)定義您希望在熱圖中可視化的基因??梢圆榭此x節(jié)點(diǎn)中包含的所有基因(節(jié)點(diǎn)的并集)的數(shù)據(jù),或僅針對所選節(jié)點(diǎn)(節(jié)點(diǎn)的交集)共有的基因的數(shù)據(jù)。 默認(rèn)情況下,顯示所有基因。

(4)根據(jù)您的數(shù)據(jù)類型更改“Expression”(在heat map圖的上方)值可視化。 數(shù)據(jù)可以在加載時查看(Value),如行標(biāo)準(zhǔn)化,在這種情況下,從每個值中減去行平均值,然后除以行的標(biāo)準(zhǔn)偏差(行標(biāo)準(zhǔn)),或者作對數(shù)轉(zhuǎn)換(Log)。

(5)Compress (在heat map上方的一個選項(xiàng)卡)heat map的列。默認(rèn)情況下,對于包含<50個樣本的表達(dá)集,所有表達(dá)的值都可以作為熱圖中的單個列顯示。通過選擇Compress下的一個聚合方法 - Median,Max或Min),可以將數(shù)據(jù)壓縮為單個列。 如果已上傳CLS文件,則可以使用“Class”選項(xiàng)使用每個已定義樣本組的一列壓縮表達(dá)集。如果表達(dá)矩陣包含≥50個樣本,則EnrichmentMap將默認(rèn)自動將值壓縮為其Median。

(6)點(diǎn)擊Values,除熱圖顏色標(biāo)度外,還顯示表達(dá)式數(shù)值。


勾選Values之后的heat map

(7)使用“set”面板對熱圖進(jìn)行額外微調(diào),單擊齒輪圖標(biāo)即可訪問。這包括添加新rank文件的功能,將熱圖數(shù)據(jù)導(dǎo)出為制表符分隔的文本文件或PDF圖像,更改層次聚類的距離度量,或打開節(jié)點(diǎn)表熱圖自動對焦。得到的熱圖可以在上圖中看到。在該圖中,使用GSEA的rank文件對基因進(jìn)行分類,突出顯示黃色的“l(fā)eading edge”。 顯示了所選節(jié)點(diǎn)中包含的所有基因,表達(dá)值是行標(biāo)準(zhǔn)化的,未應(yīng)用Compress并且未顯示單獨(dú)的表達(dá)數(shù)值。

(8)可以將熱圖導(dǎo)出到文本文件以進(jìn)行進(jìn)一步分析:單擊熱圖的“設(shè)置”圖標(biāo)并選擇“Export as TXT”。

(9)如果僅選擇單個節(jié)點(diǎn),則會出現(xiàn)一個對話框,Leading edge only for GSEA analysis, 如果選中,只會輸出突出顯示的基因; 否則,整個基因組就被保存了下來


2.組織和闡明 network

(1)如果網(wǎng)絡(luò)中有太多節(jié)點(diǎn),請轉(zhuǎn)到“Control Panel”中的“EnrichmentMap”選項(xiàng)卡,然后使用“Node Cutoff Q-value threshold”滑塊。 調(diào)整到接近0的數(shù)值將刪除不太重要的節(jié)點(diǎn)。如果網(wǎng)絡(luò)太過緊密連接,請轉(zhuǎn)到“控制面板”中的“EnrichmentMap”選項(xiàng)卡,然后增加“Edge Cutoff (Similarity)”閾值,這將刪除較少相關(guān)節(jié)點(diǎn)之間的連接。

Filter過濾選項(xiàng)卡可以通過調(diào)節(jié)Q值和Edge Cutoff來過濾節(jié)點(diǎn)數(shù)

(2)調(diào)整截止值后再次應(yīng)用network layout(請參閱Cytoscape中的Layout菜單)。默認(rèn)布局算法是未加權(quán)的Prefuse Force Directed布局??梢允褂没蚣痵imilarity coefficient對prefuse force-directed layout進(jìn)行加權(quán),也可以使用其他的布局算法。

tip: Cytoscape中有許多不同的布局算法可用于EnrichmentMap。 建議使用edge-weighted layout,該布局考慮路徑之間的重疊分?jǐn)?shù)。大多數(shù)layout(yFiles除外)提供了僅組織所選節(jié)點(diǎn)的功能。 嘗試使用不同的布局,以查看哪種布局最適合您的數(shù)據(jù)。 如果您不喜歡生成的布局,可以在Mac上按下command-z或在Windows上按Ctrl-z,或單擊編輯→撤消以恢復(fù)到上一個??視圖。

(3)要恢復(fù)nodes或edges,可以將閾值滑塊調(diào)整到其原始位置。

(4)分開兩種不同的表型。 Control Panel中的Select選項(xiàng)卡可以將所有紅色節(jié)點(diǎn)置于一側(cè),將所有藍(lán)色節(jié)點(diǎn)置于另一側(cè),這有助于分離兩種不同的表型。


Control Panel中的Select選項(xiàng)卡


(4)單擊“+”符號并選擇“Column filter”。

(5)點(diǎn)擊選擇欄…選擇 NES (Mesem vs Immuno)。


選擇 NES

(6)單擊“between”框,將值更改為0。單擊面板底部的“Apply”。


更改為0后點(diǎn)擊Apply

(7)現(xiàn)在應(yīng)該選擇所有紅色節(jié)點(diǎn)。 單擊并按住任何選定節(jié)點(diǎn)并將選擇拖動到左側(cè),直到它不與任何藍(lán)色節(jié)點(diǎn)重疊。


托拉藍(lán)色節(jié)點(diǎn)之前


托拉藍(lán)色節(jié)點(diǎn)到左邊之后(修正一下,這里只能托紅色節(jié)點(diǎn),不能托藍(lán)色節(jié)點(diǎn),而這幅圖中我托了紅色和藍(lán)色節(jié)點(diǎn))

(8)從Cytoscape菜單中選擇Layouts并應(yīng)用Prefuse Force Directed Layout→Selected Nodes Only→(無)。

(9)返回“Control Panel ”中的“Select tab”并調(diào)整滑塊以選擇所有負(fù)值。 單擊“Select”選項(xiàng)卡底部的“Apply”。


Select選項(xiàng)卡

(10)現(xiàn)在應(yīng)該選擇所有藍(lán)色節(jié)點(diǎn)。 單擊并按住任何選定節(jié)點(diǎn)并向右拖動選擇,直到它不與任何紅色節(jié)點(diǎn)重疊。

(11)從Cytoscape菜單中選擇Layouts并應(yīng)用Prefuse Force Directed Layout→Selected Nodes Only→(無)。(這步的作用是清除剛剛拖動節(jié)點(diǎn)的操作,恢復(fù)原來的樣子)


3. 定義主要的生物學(xué)主題

Enrichment maps通常包含代表主要生物學(xué)主題的類似通路的簇。 可以使用AutoAnnotate Cytoscape應(yīng)用程序自動定義和匯總?cè)杭疉utoAnnotate首先使用clusterMaker2應(yīng)用程序?qū)W(wǎng)絡(luò)進(jìn)行群集,然后通過WordCloud應(yīng)用程序根據(jù)路徑名稱中的詞頻來匯總每個群集。

(1)從Cytoscape菜單欄,加載AutoAnnotate。通過Apps → AutoAnnotate →New Annotation Set...

將會出現(xiàn)Create Annotation Set panel

(2)在Quick Start tab, 單擊 Create Annotations.

(3) network中的每個群集都有一個圍繞它繪制的圓形注釋,并且將與一組對應(yīng)于群集中最頻繁的節(jié)點(diǎn)標(biāo)簽的words(默認(rèn)為三個)相關(guān)聯(lián)。這些words是自動選擇的,通常必須手動重命名。在群集中移動單個節(jié)點(diǎn)將自動調(diào)整周圍圓的大小,移動整個群集將重新繪制新群集位置中的周圍圓。

(4)手動排列群集以清理圖形。 移動節(jié)點(diǎn)減少節(jié)點(diǎn)和標(biāo)簽重疊。


4.創(chuàng)建一個簡化的網(wǎng)絡(luò)視圖

這將為每個集群創(chuàng)建一個具有匯總名稱的組節(jié)點(diǎn),并提供富集結(jié)果主題的概述,這對于包含許多節(jié)點(diǎn)的富集map非常有用。

(1)在Control Panel選擇AutoAnnotate tab

(2)單擊右上角的“Menu”圖標(biāo)

(3)選擇Collapse All.

(4)Scale the collapsed network for better viewing。在Cytoscape菜單欄中,選擇View →Show Tool Panel

(5)轉(zhuǎn)到位于Control Panel的Node Layout Tools版面

(6)找到“Scale”滑塊并在未選定的節(jié)點(diǎn)上使用它(取消選中“Selected only”)

(7)向左移動滑塊以收緊節(jié)點(diǎn)間距。 完成后關(guān)閉“Node Layout Tools”面板。


5. 手動安排network節(jié)點(diǎn)并更新主題標(biāo)簽

最清晰的網(wǎng)絡(luò)視圖和發(fā)表質(zhì)量的圖,進(jìn)行這一步非常有必要。 例如,將相似的主題(例如信號通路或代謝通路)匯集在一起??是很有用的,即使它們未在地圖中連接。應(yīng)該優(yōu)化空間的使用,以便沒有大量的空白區(qū)域。 這是一個耗時的步驟,但花費(fèi)的精力越多,所得結(jié)果圖質(zhì)量就越高。

(1)如果圖的焦點(diǎn)僅在網(wǎng)絡(luò)的子集上,則可以更容易地僅使用子集。選擇感興趣的節(jié)點(diǎn),然后在Cytoscape菜單欄中選擇File → New → Network → From selected nodes → all edges來創(chuàng)建它。

(2)當(dāng)圖的目的是顯示大型網(wǎng)絡(luò)并僅突出顯示主要主題時,單擊位于Control Panel中的EnrichmentMap底部的Publication ready以刪除節(jié)點(diǎn)標(biāo)簽。 要恢復(fù)到原始網(wǎng)絡(luò),請?jiān)俅螁螕簟癙ublication ready”按鈕。

(3)重命名AutoAnnotate生成的主題名稱,以更好地解釋通路組,自動生成WordCloud的主題名稱對于快速瀏覽enrichment map非常有用,但經(jīng)常需要重命名為發(fā)表質(zhì)量的圖。命名時應(yīng)該仔細(xì)考慮每個主題內(nèi)的所有的通路和基因。 通過右鍵單擊“Cluster”列中“AutoAnnotate”面板中的名稱,然后選擇“Rename”,可以在“AutoAnnotate”中重命名主題。


6.創(chuàng)建突出顯示特定主題子集的subnetwork

豐富的組學(xué)數(shù)據(jù)集的Enrichment maps通常是大而復(fù)雜的,并且在最后的圖中強(qiáng)調(diào)特定主題或相關(guān)通路通常是很有必要的。 例如,將選擇頂部間充質(zhì)和免疫反應(yīng)通路,并為詳細(xì)的可視化創(chuàng)建subnetwork.

(1)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容