一、力導(dǎo)向布局(Force-directed Layout):
力導(dǎo)向布局可以通過模擬物理力(例如斥力和引力)來擺放節(jié)點(diǎn),使得相互作用較強(qiáng)的蛋白質(zhì)會被拉得更近,反之則相隔更遠(yuǎn)。這種布局能夠清晰地展示網(wǎng)絡(luò)的整體結(jié)構(gòu)和蛋白質(zhì)之間的關(guān)聯(lián)性。


二、層次布局(Hierarchical Layout):
適用于展示蛋白質(zhì)的功能模塊或?qū)蛹壗Y(jié)構(gòu),可以通過該圖發(fā)現(xiàn)某些蛋白質(zhì)是否處于信號通路的上游或下游。層次布局可以突出顯示PPI網(wǎng)絡(luò)中的層次關(guān)系。


三、比較
1、力導(dǎo)向布局與層次布局的區(qū)別:
① 力導(dǎo)向布局(Force-directed layout):力導(dǎo)向圖(如 layout = 'fr')是根據(jù)節(jié)點(diǎn)間的“力”來安排位置的,節(jié)點(diǎn)之間通過“彈簧”連接,試圖將相互關(guān)聯(lián)的節(jié)點(diǎn)拉近,而不相關(guān)的節(jié)點(diǎn)則推得較遠(yuǎn)。它適用于表示沒有明確層級結(jié)構(gòu)的數(shù)據(jù)關(guān)系,圖的形狀通常比較松散,視覺上會根據(jù)關(guān)聯(lián)程度自適應(yīng)調(diào)整位置。它主要依賴于節(jié)點(diǎn)之間的關(guān)系強(qiáng)度來確定圖的形狀。
② 層次布局(Hierarchical layout):層次布局(如 layout = 'dendrogram' 或 layout = 'tree')適用于有明確父子關(guān)系或?qū)哟谓Y(jié)構(gòu)的數(shù)據(jù)。例如,分類樹、家譜等。層次布局的節(jié)點(diǎn)排列通常遵循從上到下、從左到右的層級方式,節(jié)點(diǎn)與節(jié)點(diǎn)之間的連接順序反映了它們之間的層級關(guān)系。
2、樹形布局與力導(dǎo)向布局的視覺差異:
① 力導(dǎo)向布局:節(jié)點(diǎn)的位置更為自由,形成較為松散的結(jié)構(gòu)。相鄰節(jié)點(diǎn)會被拉得較近,而不相鄰的節(jié)點(diǎn)則較遠(yuǎn),節(jié)點(diǎn)的布局看起來更為“散開”,適合展示圖中節(jié)點(diǎn)間的相互關(guān)系強(qiáng)度。適用場景:當(dāng)你關(guān)注的是節(jié)點(diǎn)之間的關(guān)聯(lián)強(qiáng)度(如基因相互作用、蛋白質(zhì)網(wǎng)絡(luò)等)時,力導(dǎo)向布局更加直觀。
②?樹形布局:節(jié)點(diǎn)一般會垂直或水平對齊,形成類似樹狀的結(jié)構(gòu),每一層的節(jié)點(diǎn)之間較為有序,顯示的是基于層次關(guān)系的分布。適用場景:當(dāng)你需要表示基因、蛋白質(zhì)或其他數(shù)據(jù)的層次關(guān)系時,例如,表示基因家族、進(jìn)化樹等。
3、總結(jié):
① 力導(dǎo)向布局圖:更側(cè)重節(jié)點(diǎn)之間的相互作用,節(jié)點(diǎn)之間的布局由力學(xué)模型決定,通常適用于較為復(fù)雜且沒有嚴(yán)格層級關(guān)系的數(shù)據(jù)。在力導(dǎo)向布局圖中,觀察節(jié)點(diǎn)的相互關(guān)系強(qiáng)度,根據(jù)節(jié)點(diǎn)之間的接近程度可以判斷它們的相互關(guān)聯(lián)是否強(qiáng)。
②?層次布局圖:側(cè)重展示層級結(jié)構(gòu),便于觀察數(shù)據(jù)之間的關(guān)系和順序。在樹形布局圖中,觀察節(jié)點(diǎn)的層級結(jié)構(gòu),看哪些基因或蛋白質(zhì)屬于同一層級,哪個是根節(jié)點(diǎn)或起始節(jié)點(diǎn)。
四、K-Core 分解圖(K-Core Decomposition):
可以通過K-Core分解法,識別出PPI網(wǎng)絡(luò)中的核心結(jié)構(gòu)。這種方法通過移除節(jié)點(diǎn)及其相關(guān)邊,逐步逼近最強(qiáng)的子網(wǎng)絡(luò),揭示在整個網(wǎng)絡(luò)中最具影響力的核心蛋白質(zhì)。


K-Core 分解圖展示了圖中不同核心層級的結(jié)構(gòu)。K-Core是一個子圖,其中每個節(jié)點(diǎn)至少與k個其他節(jié)點(diǎn)連接。換句話說,K-Core 圖顯示的是圖中“核心”部分的節(jié)點(diǎn)和邊。通過這種方式,K-Core 能幫助我們識別哪些節(jié)點(diǎn)在網(wǎng)絡(luò)中處于中心位置,哪些是外圍的、邊緣的節(jié)點(diǎn)。
當(dāng)你選擇k = 3時,圖中每個節(jié)點(diǎn)至少與3個其他節(jié)點(diǎn)有連接,這就是所謂的 K-3 核心。你通過core_numbers > 3過濾出這些節(jié)點(diǎn),從而得到這個核心子圖。
五、為什么與力導(dǎo)向布局相似?
1、力導(dǎo)向布局(Force-Directed Layout) 是一種算法,通常用于展示網(wǎng)絡(luò)中節(jié)點(diǎn)間的相對關(guān)系。在力導(dǎo)向圖中,節(jié)點(diǎn)之間的連接力作用和推斥力作用會使得圖像盡量平衡,節(jié)點(diǎn)彼此之間的距離是基于它們的連接關(guān)系來決定的。
2、K-Core 分解圖和力導(dǎo)向布局圖的相似性,主要體現(xiàn)在以下幾點(diǎn):
① 節(jié)點(diǎn)之間的相互聯(lián)系:1)力導(dǎo)向布局通過物理力的模擬讓節(jié)點(diǎn)在空間中根據(jù)連接關(guān)系自動排列,從而也能呈現(xiàn)出結(jié)構(gòu)上的緊密關(guān)系。2)K-Core 圖通過篩選核心節(jié)點(diǎn),這些節(jié)點(diǎn)之間的連接關(guān)系會顯得更為緊密,類似力導(dǎo)向圖中的密集區(qū)域。
② 布局和美學(xué):在力導(dǎo)向圖和 K-Core 分解圖中,節(jié)點(diǎn)都通過空間布局進(jìn)行展示,而且兩個圖通常都會進(jìn)行邊的顏色編碼和節(jié)點(diǎn)的大小調(diào)整。由于核心節(jié)點(diǎn)通常具有較高的度數(shù),它們可能會集中在圖的中央部分,從而與力導(dǎo)向布局的中央密集區(qū)域相似。
3、區(qū)別
① 核心性質(zhì):K-Core 圖通過計算圖中每個節(jié)點(diǎn)的核心值,篩選出具有較高連接度的核心部分。這些節(jié)點(diǎn)通常在網(wǎng)絡(luò)中占據(jù)重要位置,并且在圖中位置通常較為緊密。
②? 布局方式:力導(dǎo)向布局更側(cè)重于視覺上的平衡和力學(xué)模擬,節(jié)點(diǎn)會根據(jù)連接關(guān)系自動調(diào)整位置,呈現(xiàn)出力學(xué)上的“穩(wěn)定”狀態(tài)。雖然核心節(jié)點(diǎn)通常會在圖中形成緊密結(jié)構(gòu),但力導(dǎo)向布局的重點(diǎn)在于圖的視覺效果,而非核心層次的結(jié)構(gòu)。
4、總結(jié)
雖然 K-Core 分解圖 和 力導(dǎo)向布局圖 可能看起來相似(都展示了節(jié)點(diǎn)之間的連接關(guān)系),它們的重點(diǎn)是不同的:
① K-Core 分解圖重點(diǎn)是揭示圖中重要節(jié)點(diǎn)的結(jié)構(gòu)(核心節(jié)點(diǎn))。
② 力導(dǎo)向布局圖重點(diǎn)是以力學(xué)方式呈現(xiàn)圖的視覺結(jié)構(gòu)。
六、社區(qū)發(fā)現(xiàn)圖(Community Detection):
通過社區(qū)發(fā)現(xiàn)算法(如Louvain算法),可以識別出PPI網(wǎng)絡(luò)中的模塊或群體。每個模塊代表一組在生物學(xué)上可能相關(guān)的蛋白質(zhì)。
(社區(qū)發(fā)現(xiàn)圖通常通過 社區(qū)檢測算法(如 Louvain 或 Infomap)來識別網(wǎng)絡(luò)中緊密連接的子圖。我們可以使用 igraph 包的 cluster_louvain 函數(shù)來進(jìn)行社區(qū)檢測,并繪制社區(qū)圖。)


這個圖是基于之前的 PPI 網(wǎng)絡(luò)圖 的基礎(chǔ)上,通過 Infomap 算法 進(jìn)行社區(qū)發(fā)現(xiàn)得到的。Infomap 是一種基于信息流的算法,適用于有向圖,用來將圖中的節(jié)點(diǎn)劃分到不同的社區(qū)中,目的是使得社區(qū)內(nèi)的節(jié)點(diǎn)之間的連接密度最大,而社區(qū)間的連接密度最小。
我們之前已經(jīng)創(chuàng)建了 PPI 網(wǎng)絡(luò)圖,這個圖展示的是基于節(jié)點(diǎn)之間的相互作用(combined_score)生成的網(wǎng)絡(luò)結(jié)構(gòu)。而通過 Infomap 算法進(jìn)行社區(qū)劃分,可以幫助發(fā)現(xiàn)網(wǎng)絡(luò)中的模塊或子結(jié)構(gòu),這些模塊或子結(jié)構(gòu)內(nèi)的節(jié)點(diǎn)更加密切相關(guān)。這張 社區(qū)發(fā)現(xiàn)圖 是對之前構(gòu)建的 PPI 網(wǎng)絡(luò)圖 進(jìn)行進(jìn)一步分析和可視化的結(jié)果。
生物信息學(xué)領(lǐng)域非常廣泛,難以一次說盡。我們下次繼續(xù)更新,一起深入學(xué)習(xí)生物信息學(xué)的內(nèi)容!
喜歡的寶子們點(diǎn)個贊吧~碼字不易,且行且珍惜~