蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction, PPI)是指兩個或兩個以上的蛋白質(zhì)分子通過非共價鍵形成蛋白質(zhì)復(fù)合體(protein complex)的過程。在進行數(shù)據(jù)挖掘的時候往往會得到很多的差異表達的基因,當你對著一堆基因毫無頭緒時,此時PPI數(shù)據(jù)庫對你的數(shù)據(jù)挖掘起了很大的助攻作用。
常用的PPI分析數(shù)據(jù)庫有STRING,bioGRID,然而在分析時其功能也是有一定的局限性,所以今天我給大家這個數(shù)據(jù)庫在預(yù)測分析上功能更加強大,廢話不多說,直接往下看。
該數(shù)據(jù)庫名字叫做GeNets(網(wǎng)址:http://apps.broadinstitute.org/genets#),我們可以利用這個數(shù)據(jù)通過機器學(xué)習(xí)方法對差異基因(你尋找的一組差異基因)進行分析,找出其關(guān)鍵基因以及信號通路;同時該數(shù)據(jù)庫也可以通過聚類講尋找到的差異基因進行聚類;更人性化的是可以長期保存你所輸入的一組數(shù)據(jù),每次用的時候直接調(diào)用數(shù)據(jù)就可以了。(進入數(shù)據(jù)庫后直接簡單注冊就能免費使用, 推薦使用谷歌瀏覽器)。

<article class="_2rhmJa">
進入數(shù)據(jù)庫后選擇快速可視化選項,基因列表可以選擇你以前保存的,也可以選擇粘貼新的,將需要分析的基因列表粘貼進去即可在網(wǎng)絡(luò)選擇中可以選擇GEO數(shù)據(jù)庫作為數(shù)據(jù)的訓(xùn)練集,同時也可選擇Web3(包括多個數(shù)據(jù)庫,推薦使用),選好之后直接點綠色圖標就可以了。
該圖就是你所分析的數(shù)據(jù)庫,點擊箭頭3所指向的鏈接即可對輸入的基因列表進行可視化。
可視化結(jié)果如下圖:其中不同的顏色代表不同的分類,通過機器學(xué)習(xí)的方法將其聚類到不同的疾病模型和信號通路上,點擊箭頭1所指向的區(qū)域可以查看富集分析的結(jié)果。
同時將頁面下拉可以得到具體的分析結(jié)果,同時得到對輸入基因進行注釋的結(jié)果:
點擊GENE SET ANALYSIS中的pre-GWAS分析可以得到下面的結(jié)果:
蛋白質(zhì)之間的相互作用構(gòu)成了細胞生化反應(yīng)網(wǎng)絡(luò)的一個主要組成部分,對調(diào)控細胞及其信號有重要意義。
相互作用蛋白質(zhì)數(shù)據(jù)庫收集了由實驗驗證及文獻挖掘的蛋白質(zhì)-蛋白質(zhì)相互作用,常用的在線工具有DIP(Database of Interacting Protein)、BioGRID (database of protein and genetic interaction)、HPRD (human protein reference database)、STRING、EVEX。
DIP可以使用基因的名字等關(guān)鍵詞、序列、模體/功能域、文獻、實驗等進行查詢。
image
BioGRID是一個經(jīng)典的蛋白質(zhì)相互作用數(shù)據(jù)庫, 目前版本是3.5.170,該版本從68,754篇文獻中整理出了1,670,339個蛋白質(zhì)和遺傳相互作用,28,093個嵌合體信息以及726,378個來自主要模式生物物種翻譯后修飾信息。
image
HPRD 數(shù)據(jù)庫只收錄人的蛋白相互作用信息,來源于文獻挖掘的最大的人蛋白相互作用數(shù)據(jù)庫,有PTM(翻譯后修飾)、亞細胞定位、結(jié)構(gòu)域等信息。
image
STRING數(shù)據(jù)庫是一個覆蓋的物種最多,相互作用信息做大的,查詢已知蛋白質(zhì)之間和預(yù)測蛋白質(zhì)之間相互作用的數(shù)據(jù)庫。
image
EVEX是一款以基因為檢索對象,以PubMed和PubMed Central中發(fā)表文章的摘要和全文為依據(jù)的文本挖掘(text mining)數(shù)據(jù)庫。




