如何查詢一個(gè)基因和某一個(gè)通路的相關(guān)性

前幾天一個(gè)小伙伴問:怎么查看一個(gè)基因和某一個(gè)通路之間的相關(guān)性。這里就簡單的提供一個(gè)可能的解決辦法,供有相同需求的小伙伴參考。

這里我們就假設(shè)我們想要查看ACE2Cell Cycle信號通路之間有沒有關(guān)系。對于這樣的目的,我們第一步肯定是要查詢兩者在之前的研究當(dāng)中是否有關(guān)系。

1. 確定之前的研究結(jié)果

對于之前研究結(jié)果的確定的話,我們可以通過genecards來查詢。genecards當(dāng)中總結(jié)了這個(gè)基因應(yīng)該參與哪些經(jīng)典的通路。在genecards里面匯總了KEGG等多個(gè)通路數(shù)據(jù)庫當(dāng)中的信息。所以在這里,我們基本上能清楚這個(gè)基因主要是參與哪些基因

image

經(jīng)過查詢,我們發(fā)現(xiàn)基于這個(gè)基因本身的功能,它和Cell Cycle信號通路是沒有關(guān)系的。

2. 確定基因和信號通路內(nèi)的基因的關(guān)系

經(jīng)過上面的查詢,我們發(fā)現(xiàn)這個(gè)基因并不參與細(xì)胞周期信號通路的調(diào)控。那這個(gè)基因不參與這個(gè)通路并不能代表這個(gè)基因和通路內(nèi)的基因沒有關(guān)系。因此,我們查看查看這個(gè)基因和通路內(nèi)的基因是否存在關(guān)系。那么首先第一步,就是需要知道通路內(nèi)都有哪些基因。

2.1 查詢通路內(nèi)的基因

我們可以通過KEGG等通路數(shù)據(jù)庫來查詢某一個(gè)通路內(nèi)的基因都有哪些。這里我們推薦另外一個(gè)通路查詢數(shù)據(jù)庫: PathCards(https://pathcards.genecards.org/)。這個(gè)數(shù)據(jù)庫和我們剛剛提到的genecards是一個(gè)機(jī)構(gòu)的。這個(gè)數(shù)據(jù)庫匯總了KEGG等多個(gè)數(shù)據(jù)庫的一個(gè)綜合性通路查詢數(shù)據(jù)庫。

image

在這個(gè)數(shù)據(jù)庫,我們輸入Cell Cycle即可獲得符合檢索條件的通路,進(jìn)一步的我們可以看到這個(gè)通路內(nèi)都有哪些基因。

image

就這樣,我們就獲得了目標(biāo)通路的所有基因了。

2.2 蛋白相互作用分析

在我們獲得基因之后,最基本的相互作用分析,能想到的就是我們之前介紹的蛋白相互所有分析(PPI),我們可以把獲得的基因內(nèi)的所有基因以及目標(biāo)基因(ACE2),統(tǒng)一放到STRING里面,就可以查看ACE2和其他基因有沒有關(guān)系了。具體STRING的使用以及網(wǎng)絡(luò)分析,可以看我們之前的帖子:

Here is yuque doc card, click on the link to view:https://www.yuque.com/go/doc/5856170

Here is yuque doc card, click on the link to view:https://www.yuque.com/go/doc/5857187

經(jīng)過分析,我們發(fā)現(xiàn),ACE2只是在文本挖掘的結(jié)果當(dāng)中與CDK4基因可能存在相互作用關(guān)系。這個(gè)結(jié)果照這個(gè)情況來看,還不是特別確定。因此在目前的蛋白相互相互作用的層面,有可能這這個(gè)基因和細(xì)胞周期相關(guān)基因是沒有關(guān)系的。

image

2.3 共表達(dá)分析

??我們做的是在蛋白層面觀察基因之前是否存在相互作用關(guān)系。但是在mRNA層面的話,還沒有查看具體的相關(guān)性。這個(gè)時(shí)候,我們用到的就是類似芯片或者RNA-seq方面的東西了。之前我們在單基因如果開展研究的帖子當(dāng)中,提到了過最好是能在GEO里面找到有人做過的相關(guān)敲除或者過表達(dá)這個(gè)基因的芯片。這樣的話,我們查看一下差異基因就可以了。經(jīng)過查詢,我們發(fā)現(xiàn)并沒有ACE2相關(guān)的過表達(dá)/敲除芯片

image

既然沒有的話,那我們就只能使用疾病相關(guān)的數(shù)據(jù)來提取目標(biāo)基因的表達(dá),來進(jìn)行相關(guān)分析,進(jìn)而來查看這些基因的是否存在共表達(dá)關(guān)系了。如果是腫瘤研究的話,那直接就使用TCGA的數(shù)據(jù)就可以來進(jìn)行研究。如果是其他疾病的話,那可能就需要去GEO里面搜索自己想有的數(shù)據(jù)集了。對于TCGA的數(shù)據(jù),也是有很好的數(shù)據(jù)庫來直接得到分析結(jié)果的。例如,我們這里想要看在腸癌當(dāng)中ACE2和這些基因的關(guān)系,那么我們就可以在cbioportal數(shù)據(jù)庫當(dāng)中,尋找共表達(dá)基因。這樣,我們就可以獲得和ACE2存在共表達(dá)關(guān)系的基因了。

image

由于細(xì)胞周期相關(guān)的基因有100+,我們不能一個(gè)一個(gè)來檢索相關(guān)結(jié)果。所以我們就把相關(guān)的結(jié)果全部下載下來之后,在excel當(dāng)中進(jìn)行一下vlookup一下。最后我們發(fā)現(xiàn),ACE2和16個(gè)細(xì)胞周期相關(guān)基因存在共表達(dá)關(guān)系。

image

寫到最后

最后我們的共表達(dá)分析當(dāng)中,可以找到和16個(gè)和目標(biāo)基因相關(guān)的存在共表達(dá)關(guān)系。但是由于只是相關(guān)分析,我們并不清楚說這些基因和目標(biāo)基因到底是誰影響誰,所以只能說通過后續(xù)的實(shí)驗(yàn)來進(jìn)行驗(yàn)證。另外的話,我們這里做的還是簡單的看基因和基因之間的相關(guān)性。進(jìn)一步的,我們其實(shí)可以通過一些算法類似GSVA來評價(jià)細(xì)胞周期的整個(gè)通路和基因是否具有相關(guān)性。這樣的話,可能更好吧。不過這樣做法需要一定的門檻。沒有上面我們介紹的這些簡單。所以還是可以先從簡單的來學(xué)習(xí)的。

作者:xhog
鏈接:http://www.itdecent.cn/p/fcffec7e2607

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容