2019-12-13 小白新手筆記 GEO數(shù)據(jù)庫下載及ID轉(zhuǎn)換

GEO數(shù)據(jù)庫下載

library(Biobase)

library(BiocGenerics)

library(parallel)

library(GEOquery)


gest<-getGEO("GSE9579",destdir=".",GSEMatrix=T,AnnotGPL=FALSE,getGPL= F)? # "."可填保存的路徑


從GPL平臺直接下載平臺基因信息

gpl570=read.delim("C:\\Users\\zhouwenqing789\\Desktop\\base\\GPL570anotation.txt",header = T,stringsAsFactors = F,sep ="\t")??#讀取下載的平臺信息

g579symbol=gpl570[,c(1,11)]

write.table(g579symbol,"g570symlol.txt",col.names

= T,row.names = F,quote = F,sep = "\t")#取需要的基因ID和gene symbol 并保存

?#找出哪些是空值并刪除?which(is.na())??

length(intersect(gse47389na[,1],g579symbol[,1]))#查看有多少交際并合并

colnames(g579symbol)

expr=merge(gse47389na,g579symbol,by.x

= "ID_REF",by.y = "ID")


其它ID轉(zhuǎn)換方式

1?? DAVID網(wǎng)站提供了id轉(zhuǎn)換的功能

1 選擇上傳gene list文件

2 選擇上傳ID的類型,我們ID-list.txt中的是Ensembl Gene ID,所以這里選ENSEMBL_GENE_ID

3 這個是類型,因為只做ID轉(zhuǎn)換,所以選Gene List就ok了

4 選擇你要轉(zhuǎn)換的ID類型,這里我選的ENTREZ_GENE_ID

5 然后選擇提交就ok了

2bioDBnet

1 輸入文件ID類型

2 輸出ID類型,這里的Gene ID就是指ENTREZ GENE ID

3 輸入ID列表,點擊確定。測試的時候發(fā)現(xiàn)輸出的結(jié)果不會超過5000個ID,如果需要轉(zhuǎn)換的id比較多可以考慮分割文件再轉(zhuǎn)換

3.ENSEMBL biomart

ensembl

的官方網(wǎng)站提供的工具,ID轉(zhuǎn)換比較齊全,而且除了轉(zhuǎn)換ID之外,還有其他有意思的功能(留給你們自己去挖掘了),缺點就是不能做大量的ID轉(zhuǎn)化,不過2000應該能行吧。

1 選擇數(shù)據(jù)庫:Ensembl Gene 86,Homo sapiens就ok

2,3 過濾,主要是輸入要轉(zhuǎn)換的ID,選擇Ensembl Gene ID,將ID-list.txt導進去,如果想獲取這個物種所有的對應關(guān)系,那么久什么都不用選;

4 attribute,主要是選擇輸出的內(nèi)容,這里作為ID轉(zhuǎn)換,輸出就是Ensembl Gene ID和ENTREZ GENE ID就行。

5 設置完了以后最后點擊results就會返回結(jié)果了。


4 從NCBI下載Gene ID 對應Ensemble ID的文件,寫腳本進行轉(zhuǎn)換ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/

Ensembl的Gene ID想要得到它的GENE Symbol的時候,一轉(zhuǎn)換之后就有些對應不上了,有的Ensembl Gene ID對應不上Gene Symbol了,其實這是正常的,因為Ensembl屬于EMBL-EBI,也就是歐洲生物信息學中心,NCBI屬于美國生物信息學中心,他們對于基因組注釋肯定是不同的,但是比較公認的一個觀點是Ensembl Gene ID的注釋更加詳細,所以會出現(xiàn)一個Ensembl Gene ID對應幾個Entrez Gene ID(Gene Symbol),或者一個Entrez Gene ID對應幾個Ensembl Gene ID也是可能的,而我在對測序數(shù)據(jù)進行注釋的時候幾乎都是選用Ensembl提供的參考序列以及注釋文件,一般不用NCBI的。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容