一般R代碼下載其實(shí)挺好的,但是網(wǎng)絡(luò)狗是一件每個(gè)探索GEO小伙伴們都要經(jīng)歷的,有時(shí)候我們選擇更換鏡像,想避開蝸牛一般的的網(wǎng)速,但是也是不行,大家就可以去官網(wǎng)下載這個(gè)數(shù)據(jù)集(GSE)
網(wǎng)站連接
- 官網(wǎng)連接 https://www.ncbi.nlm.nih.gov/geo/
- 數(shù)據(jù)集下載連接 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE42872
若想下載不同的數(shù)據(jù)集,只需要更換GSE編號(hào)
例如https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE42872
更換為https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE33335
網(wǎng)頁頁面
(一)GEO官網(wǎng)

GEO官網(wǎng)
1.此處可進(jìn)行一些簡單的探索,例如輸入Lung(肺),可以找到一些你感興趣的數(shù)據(jù)集或者實(shí)驗(yàn)
2. 也可以輸入你想找的數(shù)據(jù)集(GSE)或者平臺(tái)(GPL)
(二)GSE網(wǎng)頁

GSE42872
- SOFT——可下載GPL文件
- Series——下載矩陣
(三)GSE與GPL下載
-
點(diǎn)擊上圖,出現(xiàn)下面的頁面,大同小異

GPL下載

GSE下載
-
點(diǎn)擊上圖下載

下載中............
-
下載成功!?
下載的*GSE 的 gz.文件 -
①打開txt文件
打開GSE的txt文件
觀察讀取文件內(nèi)容,根據(jù)特性選擇讀取R的函數(shù),代碼
- ②打開soft文件
(四)網(wǎng)站下載后其文件讀取
- GSE 的 gz.文件讀取
eSet = read.table('GSE42872_series_matrix.txt.gz',
sep='\t',quote = "",fill = T,
comment.char="!",header=T)
#也可以解壓后,直接讀取txt文件
eSet =read.table('GSE42872_series_matrix.txt',
sep='\t',quote = "",fill = T,
comment.char="!",header=T)
關(guān)于參數(shù)
comment.char="!" ——不讀取文件中“!”后的內(nèi)容
header=T——列名
- GPL的soft文件讀取
##注意 函數(shù) getGEO
GPL6244=getGEO(filename = 'GSE42872_family.soft')
- GPL也可以代碼下載
library(GEOquery)
GPL6244<- getGEO('GPL6244', destdir=".")
- 關(guān)于文件讀取也總結(jié)了一下小傳輸門——>

R讀取GSE文件后

