蛋白質(zhì)互作網(wǎng)絡(luò)PPI的可視化

一、力導(dǎo)向布局(Force-directed Layout)

力導(dǎo)向布局可以通過模擬物理力(例如斥力和引力)來擺放節(jié)點(diǎn),使得相互作用較強(qiáng)的蛋白質(zhì)會被拉得更近,反之則相隔更遠(yuǎn)。這種布局能夠清晰地展示網(wǎng)絡(luò)的整體結(jié)構(gòu)和蛋白質(zhì)之間的關(guān)聯(lián)性。

需要代碼留言~

二、層次布局(Hierarchical Layout):

適用于展示蛋白質(zhì)的功能模塊或?qū)蛹壗Y(jié)構(gòu),可以通過該圖發(fā)現(xiàn)某些蛋白質(zhì)是否處于信號通路的上游或下游。層次布局可以突出顯示PPI網(wǎng)絡(luò)中的層次關(guān)系。

樹形布局(Tree Layout):在 ggraph 中,樹形布局 (layout = 'tree') 是一種從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的結(jié)構(gòu)。它呈現(xiàn)了圖中節(jié)點(diǎn)之間的層級關(guān)系。與其他布局相比,樹形布局具有更加清晰的上下級結(jié)構(gòu),它適用于具有自然層次關(guān)系的數(shù)據(jù)(例如家譜、文件系統(tǒng)等)。對于本圖,這表示不同基因或蛋白質(zhì)之間的關(guān)系可能按照某種層級結(jié)構(gòu)(例如,某些基因是上游調(diào)控基因)來進(jìn)行組織。

三、比較

1、力導(dǎo)向布局與層次布局的區(qū)別:

① 力導(dǎo)向布局(Force-directed layout):力導(dǎo)向圖(如 layout = 'fr')是根據(jù)節(jié)點(diǎn)間的“力”來安排位置的,節(jié)點(diǎn)之間通過“彈簧”連接,試圖將相互關(guān)聯(lián)的節(jié)點(diǎn)拉近,而不相關(guān)的節(jié)點(diǎn)則推得較遠(yuǎn)。它適用于表示沒有明確層級結(jié)構(gòu)的數(shù)據(jù)關(guān)系,圖的形狀通常比較松散,視覺上會根據(jù)關(guān)聯(lián)程度自適應(yīng)調(diào)整位置。它主要依賴于節(jié)點(diǎn)之間的關(guān)系強(qiáng)度來確定圖的形狀。

② 層次布局(Hierarchical layout):層次布局(如 layout = 'dendrogram' 或 layout = 'tree')適用于有明確父子關(guān)系或?qū)哟谓Y(jié)構(gòu)的數(shù)據(jù)。例如,分類樹、家譜等。層次布局的節(jié)點(diǎn)排列通常遵循從上到下、從左到右的層級方式,節(jié)點(diǎn)與節(jié)點(diǎn)之間的連接順序反映了它們之間的層級關(guān)系。

2、樹形布局與力導(dǎo)向布局的視覺差異:

① 力導(dǎo)向布局:節(jié)點(diǎn)的位置更為自由,形成較為松散的結(jié)構(gòu)。相鄰節(jié)點(diǎn)會被拉得較近,而不相鄰的節(jié)點(diǎn)則較遠(yuǎn),節(jié)點(diǎn)的布局看起來更為“散開”,適合展示圖中節(jié)點(diǎn)間的相互關(guān)系強(qiáng)度。適用場景:當(dāng)你關(guān)注的是節(jié)點(diǎn)之間的關(guān)聯(lián)強(qiáng)度(如基因相互作用、蛋白質(zhì)網(wǎng)絡(luò)等)時,力導(dǎo)向布局更加直觀。

②?樹形布局:節(jié)點(diǎn)一般會垂直或水平對齊,形成類似樹狀的結(jié)構(gòu),每一層的節(jié)點(diǎn)之間較為有序,顯示的是基于層次關(guān)系的分布。適用場景:當(dāng)你需要表示基因、蛋白質(zhì)或其他數(shù)據(jù)的層次關(guān)系時,例如,表示基因家族、進(jìn)化樹等。

3、總結(jié):

① 力導(dǎo)向布局圖:更側(cè)重節(jié)點(diǎn)之間的相互作用,節(jié)點(diǎn)之間的布局由力學(xué)模型決定,通常適用于較為復(fù)雜且沒有嚴(yán)格層級關(guān)系的數(shù)據(jù)。在力導(dǎo)向布局圖中,觀察節(jié)點(diǎn)的相互關(guān)系強(qiáng)度,根據(jù)節(jié)點(diǎn)之間的接近程度可以判斷它們的相互關(guān)聯(lián)是否強(qiáng)。

②?層次布局圖:側(cè)重展示層級結(jié)構(gòu),便于觀察數(shù)據(jù)之間的關(guān)系和順序。在樹形布局圖中,觀察節(jié)點(diǎn)的層級結(jié)構(gòu),看哪些基因或蛋白質(zhì)屬于同一層級,哪個是根節(jié)點(diǎn)或起始節(jié)點(diǎn)。


四、K-Core 分解圖(K-Core Decomposition):

可以通過K-Core分解法,識別出PPI網(wǎng)絡(luò)中的核心結(jié)構(gòu)。這種方法通過移除節(jié)點(diǎn)及其相關(guān)邊,逐步逼近最強(qiáng)的子網(wǎng)絡(luò),揭示在整個網(wǎng)絡(luò)中最具影響力的核心蛋白質(zhì)。

K-Core 分解圖展示了圖中不同核心層級的結(jié)構(gòu)。K-Core 是一個子圖,其中每個節(jié)點(diǎn)至少與 k 個其他節(jié)點(diǎn)連接。換句話說,K-Core 圖顯示的是圖中“核心”部分的節(jié)點(diǎn)和邊。通過這種方式,K-Core 能幫助我們識別哪些節(jié)點(diǎn)在網(wǎng)絡(luò)中處于中心位置,哪些是外圍的、邊緣的節(jié)點(diǎn)。當(dāng)你選擇 k = 3 時,圖中每個節(jié)點(diǎn)至少與3個其他節(jié)點(diǎn)有連接,這就是所謂的 K-3 核心。你通過 core_numbers > 3 過濾出這些節(jié)點(diǎn),從而得到這個核心子圖。

K-Core 分解圖展示了圖中不同核心層級的結(jié)構(gòu)。K-Core是一個子圖,其中每個節(jié)點(diǎn)至少與k個其他節(jié)點(diǎn)連接。換句話說,K-Core 圖顯示的是圖中“核心”部分的節(jié)點(diǎn)和邊。通過這種方式,K-Core 能幫助我們識別哪些節(jié)點(diǎn)在網(wǎng)絡(luò)中處于中心位置,哪些是外圍的、邊緣的節(jié)點(diǎn)。

當(dāng)你選擇k = 3時,圖中每個節(jié)點(diǎn)至少與3個其他節(jié)點(diǎn)有連接,這就是所謂的 K-3 核心。你通過core_numbers > 3過濾出這些節(jié)點(diǎn),從而得到這個核心子圖。


五、為什么與力導(dǎo)向布局相似?

1、力導(dǎo)向布局(Force-Directed Layout) 是一種算法,通常用于展示網(wǎng)絡(luò)中節(jié)點(diǎn)間的相對關(guān)系。在力導(dǎo)向圖中,節(jié)點(diǎn)之間的連接力作用和推斥力作用會使得圖像盡量平衡,節(jié)點(diǎn)彼此之間的距離是基于它們的連接關(guān)系來決定的。

2、K-Core 分解圖和力導(dǎo)向布局圖的相似性,主要體現(xiàn)在以下幾點(diǎn):

① 節(jié)點(diǎn)之間的相互聯(lián)系:1)力導(dǎo)向布局通過物理力的模擬讓節(jié)點(diǎn)在空間中根據(jù)連接關(guān)系自動排列,從而也能呈現(xiàn)出結(jié)構(gòu)上的緊密關(guān)系。2)K-Core 圖通過篩選核心節(jié)點(diǎn),這些節(jié)點(diǎn)之間的連接關(guān)系會顯得更為緊密,類似力導(dǎo)向圖中的密集區(qū)域。

② 布局和美學(xué):在力導(dǎo)向圖和 K-Core 分解圖中,節(jié)點(diǎn)都通過空間布局進(jìn)行展示,而且兩個圖通常都會進(jìn)行邊的顏色編碼和節(jié)點(diǎn)的大小調(diào)整。由于核心節(jié)點(diǎn)通常具有較高的度數(shù),它們可能會集中在圖的中央部分,從而與力導(dǎo)向布局的中央密集區(qū)域相似。

3、區(qū)別

① 核心性質(zhì):K-Core 圖通過計算圖中每個節(jié)點(diǎn)的核心值,篩選出具有較高連接度的核心部分。這些節(jié)點(diǎn)通常在網(wǎng)絡(luò)中占據(jù)重要位置,并且在圖中位置通常較為緊密。

②? 布局方式:力導(dǎo)向布局更側(cè)重于視覺上的平衡和力學(xué)模擬,節(jié)點(diǎn)會根據(jù)連接關(guān)系自動調(diào)整位置,呈現(xiàn)出力學(xué)上的“穩(wěn)定”狀態(tài)。雖然核心節(jié)點(diǎn)通常會在圖中形成緊密結(jié)構(gòu),但力導(dǎo)向布局的重點(diǎn)在于圖的視覺效果,而非核心層次的結(jié)構(gòu)。

4、總結(jié)

雖然 K-Core 分解圖 和 力導(dǎo)向布局圖 可能看起來相似(都展示了節(jié)點(diǎn)之間的連接關(guān)系),它們的重點(diǎn)是不同的:

① K-Core 分解圖重點(diǎn)是揭示圖中重要節(jié)點(diǎn)的結(jié)構(gòu)(核心節(jié)點(diǎn))。

② 力導(dǎo)向布局圖重點(diǎn)是以力學(xué)方式呈現(xiàn)圖的視覺結(jié)構(gòu)。


六、社區(qū)發(fā)現(xiàn)圖(Community Detection)

通過社區(qū)發(fā)現(xiàn)算法(如Louvain算法),可以識別出PPI網(wǎng)絡(luò)中的模塊或群體。每個模塊代表一組在生物學(xué)上可能相關(guān)的蛋白質(zhì)。

(社區(qū)發(fā)現(xiàn)圖通常通過 社區(qū)檢測算法(如 Louvain 或 Infomap)來識別網(wǎng)絡(luò)中緊密連接的子圖。我們可以使用 igraph 包的 cluster_louvain 函數(shù)來進(jìn)行社區(qū)檢測,并繪制社區(qū)圖。)

這個圖是基于之前的 PPI 網(wǎng)絡(luò)圖 的基礎(chǔ)上,通過 Infomap 算法 進(jìn)行社區(qū)發(fā)現(xiàn)得到的。Infomap 是一種基于信息流的算法,適用于有向圖,用來將圖中的節(jié)點(diǎn)劃分到不同的社區(qū)中,目的是使得社區(qū)內(nèi)的節(jié)點(diǎn)之間的連接密度最大,而社區(qū)間的連接密度最小。

我們之前已經(jīng)創(chuàng)建了 PPI 網(wǎng)絡(luò)圖,這個圖展示的是基于節(jié)點(diǎn)之間的相互作用(combined_score)生成的網(wǎng)絡(luò)結(jié)構(gòu)。而通過 Infomap 算法進(jìn)行社區(qū)劃分,可以幫助發(fā)現(xiàn)網(wǎng)絡(luò)中的模塊或子結(jié)構(gòu),這些模塊或子結(jié)構(gòu)內(nèi)的節(jié)點(diǎn)更加密切相關(guān)。這張 社區(qū)發(fā)現(xiàn)圖 是對之前構(gòu)建的 PPI 網(wǎng)絡(luò)圖 進(jìn)行進(jìn)一步分析和可視化的結(jié)果。


生物信息學(xué)領(lǐng)域非常廣泛,難以一次說盡。我們下次繼續(xù)更新,一起深入學(xué)習(xí)生物信息學(xué)的內(nèi)容!

喜歡的寶子們點(diǎn)個贊吧~碼字不易,且行且珍惜~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容