R-下載某一條通路的所有基因名字(KEGG)

實(shí)例:如何拿到KEGG數(shù)據(jù)庫(kù)中多巴胺通路相關(guān)的基因集

一、確定目標(biāo)通路

打開(kāi)KEGG選擇pathway,在搜索框前輸入物種,框內(nèi)填入關(guān)鍵詞。



篩選結(jié)果顯示僅有hsa04728符合我們的研究目的

二、下載hsa04728通路中的全部基因

1.安裝R包KEGGREST

首次安裝時(shí)電腦可能會(huì)顯示與當(dāng)前R語(yǔ)言版本不配,可以從bioconductor 的官網(wǎng)下載安裝

if(!requireNamespace("BiocManager", quietly = TRUE))      
   install.packages("BiocManager") 
BiocManager::install("KEGGREST", version = "3.10") 

可以library一下這個(gè)包,里面包含了KEGG數(shù)據(jù)庫(kù)的19個(gè)子數(shù)據(jù)庫(kù)
,"pathway"、"genes" 、"ligand"、 "brite"為4個(gè)主要的數(shù)據(jù)庫(kù),其他的子數(shù)據(jù)庫(kù)是在這4個(gè)數(shù)據(jù)庫(kù)的基礎(chǔ)上衍生出來(lái)的。

> library("KEGGREST") 
> listDatabases()  
[1] "pathway"  "brite"    "module"   "ko"       "genome"   "vg"       
[7] "ag"       "compound" "glycan"   "reaction" "rclass"   "enzyme"  
[13] "disease"  "drug"     "dgroup"   "environ"  "genes"    "ligand"  
[19] "kegg"  
  • "pathway"數(shù)據(jù)庫(kù)提供發(fā)生在細(xì)胞內(nèi)各種反應(yīng)的人工繪制途徑圖,以網(wǎng)絡(luò)形式-呈現(xiàn)。"genes" 數(shù)據(jù)庫(kù)存儲(chǔ)KEGG中注冊(cè)的已經(jīng)測(cè)序的基因組信息。
  • "ligand"數(shù)據(jù)庫(kù)可以查詢化合物、多糖以及酶促反應(yīng)等信息。
  • "brite"是將生物信息按等級(jí)層次分類歸納的數(shù)據(jù)庫(kù),其中所包含的KEGG、KO是用于同源性識(shí)別的系統(tǒng)。

2.提取通路信息

keggGet('hsa04728') 
gs<-keggGet('hsa04728')
  • 使用 keggGet 函數(shù)獲取人類基因信號(hào)通路 hsa04650 的信息,并緩存
    逐步run可以看到結(jié)果包括了通路介紹、基因,基因間的聯(lián)系方式,以及鏈接等等。


三.提取全部基因

#獲取通路中g(shù)ene信息 
gs[[1]]$GENE 
#查找所有基因 
genes<-unlist(lapply(gs[[1]]$GENE,function(x) strsplit(x,';'))) 
genelist <- genes[1:length(genes)%%3 ==2] 
genelist <- data.frame(genelist)  
#把結(jié)果寫入表格中 
write.table(genelist, "C:\\Users\\xxx\\Desktop\\hsa04728.csv",            
row.names=FALSE,col.names=TRUE,sep=",") 

最終可以獲得一個(gè)表格,genelist中有132個(gè)基因name,即多巴胺通路hsa04718中涉及的所有的基因。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容