慚愧,文章拖了這么久又有重新審稿了,之前的編輯挺看好的,結(jié)果2020年年底閉刊了,編輯覺(jué)得還有問(wèn)題需要修改,來(lái)不及2020年12月前見(jiàn)刊,于是改了2次還是被斃了,這提示我之后不能這么拖延癥。
投到了bmc genomics,那邊說(shuō)要這個(gè)測(cè)序數(shù)據(jù)。
首先要去NCBI注冊(cè),這個(gè)別人寫(xiě)的很多,就不說(shuō)了。然后我這個(gè)人比較不熟悉這些玩意,就寫(xiě)得清楚一點(diǎn)。
類(lèi)似這個(gè)人的博客就說(shuō)的比較清楚了,這里我直接把測(cè)序數(shù)據(jù)release了,應(yīng)該沒(méi)人偷我的數(shù)據(jù)吧。
https://www.maimengkong.com/m/?post=647
http://www.itdecent.cn/p/6d5f735dafcc?from=singlemessage

補(bǔ)充一下,我們提交的時(shí)候如果有組織一點(diǎn),都是需要建立bioproject和biosample,然后上傳SRA數(shù)據(jù)到對(duì)應(yīng)的bioproject或者sample,這些要一點(diǎn)時(shí)間,填SAMN號(hào)的時(shí)候需要。
填表的時(shí)候,如果是雙端測(cè)序,就要兩個(gè)文件。
然后就是上傳測(cè)序數(shù)據(jù),可以用網(wǎng)頁(yè)上傳也可以用Aspera,本地網(wǎng)頁(yè)實(shí)在太慢了。
下載地址
https://d3gcli72yxqn2z.cloudfront.net/connect_latest/v4/bin/ibm-aspera-connect-3.11.1.58-linux-g2.12-64.tar.gz
也可以去官網(wǎng)自己找版本,https://www.ibm.com/products/aspera/downloads?list
要下載的是,IBM Aspera Connect,現(xiàn)在最新就是我發(fā)的這個(gè)3.11了
# 在linux環(huán)境下,找一個(gè)目錄下載;從網(wǎng)頁(yè)中下載該軟件,w是斷點(diǎn)續(xù)傳
wget -c https://d3gcli72yxqn2z.cloudfront.net/connect_latest/v4/bin/ibm-aspera-connect-3.11.1.58-linux-g2.12-64.tar.gz
# 解壓縮這個(gè)軟件包,然后安裝軟件
tar -zxvf ibm-aspera-connect-3.11.1.58-linux-g2.12-64.tar.gz
sh ibm-aspera-connect-3.11.1.58-linux-g2.12-64.tar.gz
*安裝完了之后會(huì)在用戶(hù)的家目錄生成一個(gè).aspera
# 切換到家目錄找到bin文件,添加一下環(huán)境變量
cd ~/
cd .aspera/
cd connect/
cd bin/
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
ascp --help # 用法可以用這個(gè)看

然后就是去ncbi下載key_file那個(gè)私鑰文件,然后照抄
我這邊的文件夾在我們組其他人的目錄下,我建了個(gè)軟鏈接上傳的。
ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files>
subasp@upload.ncbi.nlm.nih.gov:uploads/xxxxx(遠(yuǎn)程服務(wù)器給的東西)
ascp -i /mainsd/bigbear/aspera.openssh -k1 -d /home/bigbear/tmp
subasp@upload.ncbi.nlm.nih.gov:uploads/xxxxx(遠(yuǎn)程服務(wù)器給的東西)
還可以?huà)煸诤笈_(tái),今天差不多就干了這么點(diǎn)事,菜狗的我
notice:
注意如果偷懶上傳當(dāng)前目錄,preload folder也識(shí)別不到,只能上傳目錄的樣子。
如果需要尋找SRA官方的幫助,需要提交submisson ID
文件格式只支持gz和bz2,如果用了其他例如gtz的格式會(huì)被NCBI打包退回(不要問(wèn)我是怎么知道的)