這節(jié)按生信技能樹(shù)的要求進(jìn)行數(shù)據(jù)下載,同時(shí)下載一組肝癌數(shù)據(jù)。
文章:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到數(shù)據(jù)地址GSE81916 這樣就可以下載sra文件作業(yè),看文章里的methods部分,把它用到的軟件和參數(shù)摘抄下來(lái),然后理解GEO/SRA數(shù)據(jù)庫(kù)的數(shù)據(jù)存放形式,把規(guī)律和筆記發(fā)在論壇上面!
1.0 論壇作業(yè)數(shù)據(jù)下載
首先,按照這個(gè)方法可以去查找文章和數(shù)據(jù)。共下載7個(gè)文件,代碼如下:
運(yùn)行起來(lái)速度還是很好,平均5M/S.
cd /mnt/f/rna_seq/data
for ((i=56;i<=62;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR358/SRR35899${i}/SRR35899${i}.sra .;done
備注:下載總共大概6h。
1.00下載自己的數(shù)據(jù)
文章在https://sci-hub.tw/http://doi.org/10.1038/onc.2013.424
首先在https://www.ncbi.nlm.nih.gov/sra,輸入liver cancer,下載個(gè)較小的肝癌數(shù)據(jù)。選定https://www.ncbi.nlm.nih.gov/sra?term=SRP007560
(這個(gè)過(guò)程我是反著來(lái)的,現(xiàn)在SRA找到合適的數(shù)據(jù),然后再下載文章)
具體信息見(jiàn)這里和這里
需要下載的四個(gè)數(shù)據(jù)為SRR316212 -215
同樣,代碼為
for ((i=2;i<=5;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR316/SRR31621${i}/SRR31621${i}.sra .;done