生信寶典之傻瓜式(四)蛋白蛋白互作網(wǎng)絡(luò)在線搜索


歡迎關(guān)注生信寶典微信公眾號(hào):http://mp.weixin.qq.com/s/JO1J66BtzuY-9a20x0XQcg
傻瓜系列重啟了,今天要介紹的是一款在線查詢蛋白-蛋白互作網(wǎng)絡(luò)的工具 STRING (https://string-db.org/)。

STRING數(shù)據(jù)庫(kù)收錄了2031個(gè)物種,9.6 Million個(gè)蛋白和1380 Million種相互作用。

最開(kāi)始知道它是用來(lái)查詢蛋白-蛋白相互作用,查找關(guān)注的蛋白的調(diào)控因子。最近增加了共表達(dá),基因組共線性,物種共存在文本挖掘,實(shí)驗(yàn)驗(yàn)證信息等。

[圖片上傳失敗...(image-c930d6-1517210942582)]

可以按蛋白名字搜索,也可以按序列搜索,都可以輸入多個(gè)或多條,也可以按照蛋白家族或者物種瀏覽。

[圖片上傳失敗...(image-3fedf8-1517210942582)]

其給出的示例中有一個(gè)是Top 20 頻繁突變的癌基因的搜索結(jié)果。PIK3CA, NRAS, TP53之前都存在相互作用。表觀修飾的癌基因如IDH1, DNMT3A則與其它癌基因發(fā)現(xiàn)的互作少,可以是一個(gè)研究突破點(diǎn)。

[圖片上傳失敗...(image-eb3dc1-1517210942582)]

每個(gè)點(diǎn)是可以拖動(dòng)的,點(diǎn)擊每個(gè)蛋白,可以查看其詳細(xì)注釋信息, 結(jié)構(gòu)信息 (做分子對(duì)接,來(lái)一場(chǎng)蛋白和小分子的風(fēng)花雪月, 不是原配也可以-對(duì)接非原生配體, 簡(jiǎn)單可視化-送你一雙發(fā)現(xiàn)美的眼睛, 你需要知道的那些前奏),功能域信息,序列信息,同源基因,還能以此基因?yàn)楹诵?strong>重構(gòu)網(wǎng)絡(luò) (與其相互作用最強(qiáng)的基因的網(wǎng)絡(luò)展示)等。

[圖片上傳失敗...(image-2069cd-1517210942582)]

不同顏色的線代表相互作用確定的依據(jù),有基于認(rèn)證過(guò)的數(shù)據(jù)庫(kù),實(shí)驗(yàn)驗(yàn)證,基因鄰近,共表達(dá),同源推測(cè),文本挖掘等。具體可見(jiàn)圖下方的圖例 (也可直接點(diǎn)擊連線,各種證據(jù)一目了然)。自己輸入的點(diǎn)是帶顏色的,系統(tǒng)找出的點(diǎn)是白色的。

[圖片上傳失敗...(image-7e6cb6-1517210942582)]

[圖片上傳失敗...(image-d1275a-1517210942582)]

同時(shí)可以進(jìn)行篩選,調(diào)整線型的含義,相互作用的數(shù)目,數(shù)據(jù)來(lái)源,可信度篩選, 互作點(diǎn)數(shù)目限制等。

[圖片上傳失敗...(image-e97349-1517210942582)]

增加一些相互作用,結(jié)果如下圖。形成了2個(gè)子網(wǎng)絡(luò)。右下角子網(wǎng)絡(luò)是剪接復(fù)合體構(gòu)成的調(diào)控,可變剪接在癌癥過(guò)程中的作用是研究比較火的一個(gè)點(diǎn)。它們與傳統(tǒng)癌基因的研究之間形成了兩個(gè)孤島,這一現(xiàn)象值得深思。

[圖片上傳失敗...(image-9b7e12-1517210942582)]

這么多基因,可以做個(gè)功能富集分析,看看有什么功能偏好性 (關(guān)于富集分析,看我們之前的文章GO、GSEA富集分析一網(wǎng)打進(jìn)GSEA富集分析 - 界面操作)。結(jié)果跟直接看基因也比較相似,一部分是激酶,與蛋白修飾相關(guān),一部分是剪接復(fù)合體,與剪接相關(guān)。KEGG富集的結(jié)果就更直接了,各種癌癥。這些結(jié)果可以導(dǎo)出,再作圖 (可以使用高顏值可定制在線作圖工具)。

[圖片上傳失敗...(image-ad2bd8-1517210942582)]

還可以根據(jù)整體的相互作用得分聚類,聚類完之后,同一個(gè)cluster的點(diǎn)有一樣的顏色,Cluster間的連線為虛線。(做聚類前,點(diǎn)了兩下More增加了更多的相互作用)

[圖片上傳失敗...(image-ce6c81-1517210942582)]

網(wǎng)絡(luò)中的基因做一個(gè)本物種和同源物種中的雙重共表達(dá)分析,顏色越飽和,共表達(dá)越強(qiáng)。繪制熱圖,除了上面提到的在線工具,試試熱圖三部曲 熱圖繪制熱圖美化, 熱圖簡(jiǎn)化。

[圖片上傳失敗...(image-cbd8b-1517210942582)]

從物種進(jìn)化角度,看哪些基因是在多個(gè)物種存在的(存在為有色塊,不存在為白色塊,矩形塊缺角越大,說(shuō)明存在越少,純白色表示完全缺失)和保守程度(顏色越飽和越保守)。

[站外圖片上傳中...(image-777f7a-1517210942582)]

部分癌基因TP53, PIK3R1只在進(jìn)化程度比較高的物種中才存在,光譜調(diào)控基因如IDH1則比較物種普遍。

[圖片上傳失敗...(image-fd3bae-1517210942582)]

還有TextMining,可以迅速獲取相互作用出現(xiàn)在文章中的描述,方便快速閱讀、篩選文章,人工判斷互作的準(zhǔn)確性,是讀文章的一大利器。獲取全文不放試試基于人工智能的文獻(xiàn)檢索,導(dǎo)師查找,更聰明,GeenMedical:文獻(xiàn)查詢、篩選、引用排序、相似文獻(xiàn)、全文下載、雜志分區(qū)、影響因子、結(jié)果導(dǎo)出、雜志評(píng)述、直接投稿,一站服務(wù)

[圖片上傳失敗...(image-b3d81b-1517210942582)]

整個(gè)網(wǎng)絡(luò)結(jié)果可以導(dǎo)出為矢量圖 (可以使用Adobe Illustrator修改,AI視頻教程)、表格(導(dǎo)入Cytoscape重新繪制,關(guān)聯(lián)表達(dá)數(shù)據(jù)等,Cytoscape視頻教程,下周還會(huì)推出基于Cytoscape的蛋白-蛋白相互作用多庫(kù)聯(lián)篩)、蛋白多序列比對(duì)結(jié)果和注釋結(jié)果等。

[站外圖片上傳中...(image-b7d179-1517210942582)]

更多傻瓜系列

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容