GEO數(shù)據(jù)庫學(xué)習(xí)總結(jié)(二)關(guān)于網(wǎng)頁下載

一般R代碼下載其實(shí)挺好的,但是網(wǎng)絡(luò)狗是一件每個(gè)探索GEO小伙伴們都要經(jīng)歷的,有時(shí)候我們選擇更換鏡像,想避開蝸牛一般的的網(wǎng)速,但是也是不行,大家就可以去官網(wǎng)下載這個(gè)數(shù)據(jù)集(GSE)

網(wǎng)站連接


網(wǎng)頁頁面

(一)GEO官網(wǎng)

GEO官網(wǎng)

1.此處可進(jìn)行一些簡單的探索,例如輸入Lung(肺),可以找到一些你感興趣的數(shù)據(jù)集或者實(shí)驗(yàn)
2. 也可以輸入你想找的數(shù)據(jù)集(GSE)或者平臺(tái)(GPL)


(二)GSE網(wǎng)頁

GSE42872
  • SOFT——可下載GPL文件
  • Series——下載矩陣

(三)GSE與GPL下載

  • 點(diǎn)擊上圖,出現(xiàn)下面的頁面,大同小異
GPL下載
GSE下載
  • 點(diǎn)擊上圖下載

我用的是谷歌瀏覽器
下載中............
  • 下載成功!?

    下載的*GSE 的 gz.文件

  • ①打開txt文件

    打開GSE的txt文件

觀察讀取文件內(nèi)容,根據(jù)特性選擇讀取R的函數(shù),代碼
  • ②打開soft文件

(四)網(wǎng)站下載后其文件讀取

  • GSE 的 gz.文件讀取
eSet = read.table('GSE42872_series_matrix.txt.gz',
             sep='\t',quote = "",fill = T,
             comment.char="!",header=T)
#也可以解壓后,直接讀取txt文件
eSet =read.table('GSE42872_series_matrix.txt',
             sep='\t',quote = "",fill = T,
             comment.char="!",header=T)

關(guān)于參數(shù)
comment.char="!" ——不讀取文件中“!”后的內(nèi)容
header=T——列名

  • GPL的soft文件讀取
##注意 函數(shù) getGEO
GPL6244=getGEO(filename = 'GSE42872_family.soft')
  • GPL也可以代碼下載
library(GEOquery)
GPL6244<- getGEO('GPL6244', destdir=".") 
  • 關(guān)于文件讀取也總結(jié)了一下小傳輸門——>
R讀取GSE文件后
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容