wget下載GEO數(shù)據(jù)

問題描述:使用wget下載GEO數(shù)據(jù)_weixin_43551076的博客-CSDN博客
本來打算下載一點(diǎn)GEO的單細(xì)胞數(shù)據(jù)(直接得到表達(dá)矩陣而非原始數(shù)據(jù)),但是復(fù)制了http鏈接后wget卻無法下載?

http

我固然可以逐個(gè)點(diǎn)開GSM文件下載ftp,但這未免也太麻煩了吧?

我嘗試改寫http的格式:

  1. 先觀察wget可下載的文件鏈接的格式
# RAW文件給出的鏈接,wget無法下載,但是點(diǎn)擊該鏈接可以實(shí)現(xiàn)網(wǎng)頁下載
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE156441&format=file
# GSM文件給出的可以用wget下載的鏈接
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSM4731566&format=file&file=GSM4731566%5FMTXDBA1%5F2rps%5FcountsMatrix%2Etxt%2Egz
https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSM4731562&format=file&file=GSM4731562%5FMTXBP04rpl%5FcountsMatrix%2Etxt%2Egz
https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM4731nnn/GSM4731566/suppl/GSM4731566_MTXDBA1_2rps_countsMatrix.txt.gz
https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM4731nnn/GSM4731562/suppl/GSM4731562_MTXBP04rpl_countsMatrix.txt.gz

我的改寫:
Samples (GSM)
Series (GSE)

https://ftp.ncbi.nlm.nih.gov/geo/series/GSE15nnn/GSE156441_RAW.tar

運(yùn)行失敗,仔細(xì)查看
erythropoiesis - GEO DataSets - NCBI (nih.gov)
點(diǎn)擊Download data
可以查看GEO文件的各種組織形式
下載.soft文件可以找到series的下載地址
ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE156nnn/GSE156441/suppl/GSE156441_RAW.tar

#運(yùn)行wget
wget ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE156nnn/GSE156441/suppl/GSE156441_RAW.tar

下載成功

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容