四個(gè)GEO分析的萬能R包來自大神Jimmy

今天想復(fù)現(xiàn)一下一篇芯片平臺(tái)為GPL17077的文章,發(fā)現(xiàn)該平臺(tái)沒有對(duì)應(yīng)的R包。
按照之前的思路:

一般有三種方法可以得到芯片探針與gene的對(duì)應(yīng)關(guān)系:

金標(biāo)準(zhǔn)當(dāng)然是去基因芯片的廠商的官網(wǎng)直接去下載啦

一種是直接用bioconductor的包。

一種是從NCBI里面下載文件來解析好!

嘗試第三種方法,發(fā)現(xiàn)下載速度真的是......無解。

雖然前面分享了生信技能樹良心佳作-Jimmy的四個(gè)GEO分析的萬能R包內(nèi)容如下:軟件剛剛出爐的時(shí)候只是演示了一下,還沒有真正用過。發(fā)現(xiàn)GPL17077在idmap2中?,F(xiàn)在還不知為啥分為兩個(gè)包。

options(stringsAsFactors = F)#在調(diào)用as.data.frame的時(shí),將stringsAsFactors設(shè)置為FALSE可以避免character類型自動(dòng)轉(zhuǎn)化為factor類型
#加載萬能包
library(GEOmirror)
library(idmap1)
library(idmap2) 
library(idmap3)
#了解一下每個(gè)包
ls('package:GEOmirror')
ls('package:idmap1')
ls('package:idmap2')
ls('package:idmap3')

#下載數(shù)據(jù)
geoChina('GSE97368')
load("GSE97368_eSet.Rdata")
gset
a=exprs(gset[[1]])
a[1:4,1:4]
gset[[1]]@annotation
#發(fā)現(xiàn)GPL17077在idmap2包中
ids <- getIDs("GPL17077")#失敗
idmap2::get_soft_IDs('GPL17077')#成功
head(ids)

ls('package:idmap1')
ls('package:idmap2')
idmap2::get_soft_IDs('GPL17077')

idmap1解決了bioconductor包下載困難的問題,idmap2解決了GPL平臺(tái)的soft文件下載困難,而這個(gè)idmap3解決了那些并不提供探針的注釋信息的平臺(tái)。

GEO數(shù)據(jù)庫中國區(qū)鏡像橫空出世

第一個(gè)萬能芯片探針I(yè)D注釋平臺(tái)R包

第二個(gè)萬能芯片探針I(yè)D注釋平臺(tái)R包

第三個(gè)萬能芯片探針I(yè)D注釋平臺(tái)R包

最關(guān)鍵的是還有一個(gè)萬能的包,AnnoProbe。Jimmy創(chuàng)建這個(gè)一系列的包初衷可以從 :有趣的是,因?yàn)檫@些包存儲(chǔ)在GitHub,而且每個(gè)包自帶的數(shù)據(jù)是40~50M,對(duì)很多在中國大陸的朋友來說, 幾乎是不可能完成,所以我把這4個(gè)包整合成為了一個(gè)GitHub包(AnnoProbe)!總共不到5M,相信大家使用起來應(yīng)該是很方便啦!看出來。

保姆式的教學(xué)-----為大家更好的學(xué)習(xí)體驗(yàn)操碎了心。

致敬Jimmy!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容