蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)
蛋白質(zhì)互作網(wǎng)絡(luò)(Protein-Protein Interaction Networks,PPI)是由蛋白通過(guò)彼此之間的相互作用構(gòu)成,來(lái)參與生物信號(hào)傳遞、基因表達(dá)調(diào)節(jié)、能量和物質(zhì)代謝及細(xì)胞周期調(diào)控等生命過(guò)程的各個(gè)環(huán)節(jié)。系統(tǒng)分析大量蛋白在生物系統(tǒng)中的相互作用關(guān)系,對(duì)了解生物系統(tǒng)中蛋白質(zhì)的工作原理,了解疾病等特殊生理狀態(tài)下生物信號(hào)和能量物質(zhì)代謝的反應(yīng)機(jī)制,以及了解蛋白之間的功能聯(lián)系都有重要意義。
STRING數(shù)據(jù)庫(kù)介紹
STRING數(shù)據(jù)庫(kù)是一個(gè)搜索已知蛋白質(zhì)之間和預(yù)測(cè)蛋白質(zhì)之間相互作用的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)可應(yīng)用于2031個(gè)物種,包含960萬(wàn)種蛋白和1380萬(wàn)中蛋白質(zhì)之間的相互作用。它除了包含有實(shí)驗(yàn)數(shù)據(jù)、從PubMed摘要中文本挖掘的結(jié)果和綜合其他數(shù)據(jù)庫(kù)數(shù)據(jù)外,還有利用生物信息學(xué)的方法預(yù)測(cè)的結(jié)果。
研究蛋白之間的相互作用網(wǎng)絡(luò),有助于挖掘核心的調(diào)控基因,目前已經(jīng)有很多的蛋白質(zhì)相互作用的數(shù)據(jù)庫(kù),而STRING是其中覆蓋的物種最多,相互作用信息最大的一個(gè)。目前最新版本為2019年1月19日發(fā)布的String 11.0。
STRING 使用彈簧模型來(lái)生成網(wǎng)絡(luò)圖像。節(jié)點(diǎn)被模擬為彈簧的質(zhì)量和連線;通過(guò)最小化系統(tǒng)的“能量”來(lái)計(jì)算圖像中節(jié)點(diǎn)的最終位置。首先,圖中連線的兩個(gè)節(jié)點(diǎn)間的物理距離沒(méi)有意義。其次,雖然算法是確定的,但是新的節(jié)點(diǎn)添加到網(wǎng)絡(luò)會(huì)導(dǎo)致新圖像中節(jié)點(diǎn)位置完全改變。
STRING網(wǎng)站的使用
(1)界面是這樣的

如果我們輸入的是單個(gè)蛋白質(zhì)名稱,數(shù)據(jù)庫(kù)將會(huì)輸出與該蛋白質(zhì)互作的所有蛋白質(zhì)的互作圖;如果我們一次輸入多個(gè)蛋白質(zhì)名稱或者序列,數(shù)據(jù)庫(kù)將只輸出輸入蛋白質(zhì)之間的互作網(wǎng)絡(luò)圖。
例如:輸入單個(gè)基因名稱:mxt (Drosophila melanogaster)


點(diǎn)擊節(jié)點(diǎn)和連線會(huì)給出蛋白質(zhì)詳情和證據(jù)詳情。


(2)節(jié)點(diǎn)和邊


(3)選項(xiàng)
String 11.0

Legend
節(jié)點(diǎn)和邊的樣式和含義
Settings
「meaning of network edges」:1)證據(jù):其中顏色表示交互證據(jù)的類型;2)置信線厚度表示數(shù)據(jù)支持的強(qiáng)度;3)分子作用線形狀表示預(yù)測(cè)的作用模式。
「active interaction sources」:可以選擇哪種類型的證據(jù)將有助于預(yù)測(cè)分?jǐn)?shù)。
「minimum required interaction score」:將置信度得分設(shè)置為閾值,使得只有大于該分的關(guān)系才包括在蛋白網(wǎng)絡(luò)中。較低的分?jǐn)?shù)意味著更多的互動(dòng),更多的假陽(yáng)性。
「network display mode」:1)靜態(tài)圖像:圖像是一個(gè)簡(jiǎn)單位圖圖像;2)交互式 svg:圖像是一個(gè)可擴(kuò)展的矢量圖形;3)交互式閃存:蛋白網(wǎng)絡(luò)顯示在 Flash 程序中,可實(shí)現(xiàn)更多功能(如,聚類)。
Analysis
給出了蛋白網(wǎng)絡(luò)的簡(jiǎn)要統(tǒng)計(jì),如節(jié)點(diǎn)數(shù)和邊數(shù)。平均節(jié)點(diǎn)度是蛋白質(zhì)在網(wǎng)絡(luò)中平均有多少相互作用。聚類系數(shù)是網(wǎng)絡(luò)節(jié)點(diǎn)連接的度量。在Analysis可對(duì)網(wǎng)絡(luò)進(jìn)行功能富集,包括Biological Process (GO)、Molecular Function
(GO)、Cellular Component (GO)、KEGG Pathways與Reactome
Pathways等。
Exports
可導(dǎo)出PNG和SVG格式的網(wǎng)絡(luò)圖。如果想自己用Cytoscape調(diào),也可以將蛋白網(wǎng)絡(luò)導(dǎo)出為T(mén)SV,可以用Excel打開(kāi),其中包括節(jié)點(diǎn)信息、node1_string_internal_id與combined_score等諸多信息。

位圖:PNG 文件格式的網(wǎng)絡(luò)圖像。
高分辨率位圖:PNG格式的圖像,分辨率為400 dpi。
矢量圖形:可以在Illustrator、CorelDraw、Dia等中打開(kāi)和編輯的SVG格式圖像。
表格文本: TSV 格式的數(shù)據(jù)??梢栽?Excel 中打開(kāi)。(…as simple tabular text output)
XML 摘要:結(jié)構(gòu)化XML格式的數(shù)據(jù)。
網(wǎng)絡(luò)坐標(biāo):描述網(wǎng)絡(luò)中節(jié)點(diǎn)坐標(biāo)和顏色的平面文件格式。
蛋白質(zhì)序列 - MFA:多基因格式,含有網(wǎng)絡(luò)中的氨基酸序列。
蛋白質(zhì)注釋:制表符分隔的文件,描述網(wǎng)絡(luò)蛋白質(zhì)的名稱,結(jié)構(gòu)域和功能。
Clusters
將PPI網(wǎng)絡(luò)進(jìn)行聚類。蛋白通過(guò)聚類形成不同顏色的成簇分布的蛋白互作網(wǎng)絡(luò)圖。

More/Less
點(diǎn)擊上圖More可以得到更復(fù)雜的網(wǎng)絡(luò),同理點(diǎn)擊Less會(huì)使網(wǎng)絡(luò)節(jié)點(diǎn)減少。
(4)STRING得到的TSV文件,導(dǎo)入Cytoscape:Import Networks from File System
