為發(fā)表論文故,測(cè)序數(shù)據(jù)一般需要上傳至公共數(shù)據(jù)庫,對(duì)我們而言,國外數(shù)據(jù)庫一般選NCBI,國內(nèi)的可上傳至GSA。其中,人遺數(shù)據(jù)需要上傳到GSA-human,其他物種數(shù)據(jù)上傳到GSA即可。
自從2019年國家出臺(tái)了人遺資源相關(guān)的條規(guī)后,所有上傳至公共數(shù)據(jù)庫的人遺資源都需要在科技部備案。上傳到國內(nèi)的GSA-human,必須要有備份號(hào)和備案號(hào)才能釋放數(shù)據(jù);上傳到NCBI,釋放數(shù)據(jù)雖然不需要這兩個(gè)編號(hào),但如果被人舉報(bào)沒有提前進(jìn)行備份和備案......可能就不只是一篇文章的事了。上傳到GSA的數(shù)據(jù)不需要備份或備案,可直接釋放。
本文僅針對(duì)人遺數(shù)據(jù)共享,穩(wěn)妥起見(節(jié)省時(shí)間),建議提前上傳數(shù)據(jù)至數(shù)據(jù)庫,生成臨時(shí)訪問鏈接后投稿;同時(shí)申請(qǐng)備份號(hào),拿到備份號(hào)之后才能申請(qǐng)備案號(hào)。 下面會(huì)具體介紹如何進(jìn)行備份、備案,以及如何上傳數(shù)據(jù)至GSA-human和NCBI。
申請(qǐng)備份號(hào):需提交數(shù)據(jù)
人類遺傳資源信息備份平臺(tái): https://202.108.211.75/ 有時(shí)候會(huì)提示為不安全鏈接,繼續(xù)訪問即可。個(gè)人感覺這一步并沒有“卡“一說,主要目的是將數(shù)據(jù)留存到國家平臺(tái)。
時(shí)間:大概20天獲得備份號(hào)。
聯(lián)系:電話咨詢,是一位說話溫柔的小姐姐接電話,很耐心;郵件溝通,一般第二天就能收到回復(fù),高效。
基本流程:
-
注冊(cè)個(gè)人賬戶,這里不需要用PI信息,個(gè)人注冊(cè)即可。
注冊(cè)賬戶 證件上傳:(2022.4)新出的要求,認(rèn)證需上傳組織機(jī)構(gòu)代碼證復(fù)印件、經(jīng)辦人本人身份證復(fù)印件、法人授權(quán)委托書(經(jīng)辦人非法人的情況)。
經(jīng)辦人本人身份證復(fù)印件:經(jīng)辦人指賬號(hào)所有人,不是項(xiàng)目負(fù)責(zé)人。人遺辦小姐姐說“不同項(xiàng)目可能對(duì)應(yīng)不同的PI,所以不能認(rèn)證PI”。
法人授權(quán)委托書(經(jīng)辦人非法人的情況):沒有模板,自行撰寫,蓋單位公章或者法人簽字都可。-
登錄后仔細(xì)看”操作指南“
操作指南
-
點(diǎn)擊“新建項(xiàng)目”:輸入相應(yīng)信息,項(xiàng)目負(fù)責(zé)人填課題組負(fù)責(zé)人。
創(chuàng)建項(xiàng)目
使用范圍說明:“對(duì)外提供”一般指提供給國外團(tuán)隊(duì)(國際合作);發(fā)表文章一般選“開放使用”,開放方式可多選,如果需要上傳至公共數(shù)據(jù)庫,同時(shí)選“論文發(fā)表”和“信息平臺(tái)共享”。

-
創(chuàng)建后,會(huì)自動(dòng)跳轉(zhuǎn)到“項(xiàng)目列表”,點(diǎn)擊“查看”可以看到項(xiàng)目具體信息,點(diǎn)擊”添加“新建備份名稱,點(diǎn)擊“添加文件”后,可以通過“添加待上傳文件”直接通過網(wǎng)頁上傳數(shù)據(jù),或通過“添加郵寄文件“上傳數(shù)據(jù)。
項(xiàng)目列表
添加待上傳文件:通過網(wǎng)頁直接上傳,非常非常慢。


添加郵寄文件:需輸入單號(hào)、文件名(硬盤里的文件夾名稱)。強(qiáng)烈建議超過50G的數(shù)據(jù)通過硬盤郵寄方式上傳。一般一周內(nèi)會(huì)上傳完畢(可以每天上來刷一刷,上傳完后會(huì)提示文件進(jìn)度100%)。硬盤一般不能立即取回,需保留在人遺辦一段時(shí)間,待獲得備案號(hào)之后可以寫郵件申請(qǐng)取回硬盤(順豐到付)。硬盤郵寄時(shí),需要在里面附上一個(gè)紙質(zhì)說明,包含以下信息:項(xiàng)目名稱、編號(hào)、聯(lián)系人及聯(lián)系方式、需上傳的數(shù)據(jù)。硬盤里僅保留需上傳的數(shù)據(jù)(命名方式為項(xiàng)目名稱-聯(lián)系人及電話,如 ABCD測(cè)序-fatlady18811111111),不要同時(shí)存儲(chǔ)其他數(shù)據(jù)。

- 一般20天左右可以查詢到備份號(hào)(BF開頭的一段字符)(拿出追劇的熱情,每天刷一刷),這時(shí)候可以寫郵件申請(qǐng)返還硬盤,雖然對(duì)方不一定給寄,但是保持聯(lián)系總是沒錯(cuò)噠!獲得備案號(hào)后,肯定就能返回硬盤啦。

申請(qǐng)備案號(hào)
科技部政務(wù)系統(tǒng)備案: https://fuwu.most.gov.cn/ 填寫材料,需填寫備份號(hào)。
時(shí)間:大概20天
注意:測(cè)序公司最好不要選有外資的企業(yè),否則提交是可能被認(rèn)為是國際合作,可能無法通過審核。
主要流程:
-
提前準(zhǔn)備的材料:論文原文、法人資格材料
需提前備好 聯(lián)系人寫自己;負(fù)責(zé)人寫PI
-
流程:提交材料——單位科技處審核——科技部安全審查——審核通過,獲得備案號(hào);或者被打回,根據(jù)意見修改(科技部每月開兩次會(huì)討論人遺申請(qǐng))。
下載蓋章后提交
獲得備案號(hào)
數(shù)據(jù)上傳至GSA(國家信息中心、中科院基因組所數(shù)據(jù)中心 )
人遺的數(shù)據(jù)提交到GSA-human https://bigd.big.ac.cn/gsa-human/;其他數(shù)據(jù)提交到GSA即可。
必須用PI郵箱注冊(cè),通過審核后用PI郵箱登錄操作(提交數(shù)據(jù)等),可以將聯(lián)系人設(shè)置為自己,這樣有任何問題工作人員會(huì)直接找聯(lián)系人。
聯(lián)系:加入QQ群,回復(fù)率較高,如未及時(shí)回復(fù),私聊工作人員即可。
上傳:從官網(wǎng)下載最新的手冊(cè),通過FTP上傳文件(最高可達(dá)8M/s),太大可通過郵寄上傳。
將數(shù)據(jù)設(shè)置為公開訪問(開放時(shí)間設(shè)置好,之后可修改延后)。
數(shù)據(jù)公開(共享)需要過審:要求有人遺辦的備份號(hào)、科技部的備案號(hào)。
僅支持部分雜志:https://bigd.big.ac.cn/gsa/statistics?active=articles
All sequencing reads have been deposited in the Genome Sequence Archive in National Genomics Data Center, China National Center for Bioinformation / Beijing Institute of Genomics, Chinese Academy of Sciences, under accession number HRA000684 (http://bigd.big.ac.cn/gsa-human/s/3kUd5023) .
數(shù)據(jù)上傳至NCBI
原始測(cè)序數(shù)據(jù)(fastq)一般提交到SRA https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/,具體根據(jù)流程來就行。不超過50G的數(shù)據(jù)可以通過FTP直接上傳,目前我所在單位有線網(wǎng)絡(luò)上傳速度為~800Kb/s,數(shù)據(jù)不多時(shí)尚可接受。勝在有可視化頁面、操作便捷。超過50G的數(shù)據(jù),建議通過服務(wù)器用aspera上傳,勝在穩(wěn)定(如果網(wǎng)絡(luò)不斷,基本不會(huì)中途中斷)。
Note:人遺數(shù)據(jù)如果想設(shè)置為controlled access,需要上傳至dbGAP。
FTP上傳
下載filezilla
輸入主機(jī)、用戶名、密碼(NCBI提供的三個(gè))。此時(shí)總是出現(xiàn)響應(yīng)
550 permission denied錯(cuò)誤。不用管它,直接輸入NCBI給的目錄點(diǎn)開自己的本地站點(diǎn)目錄。右鍵文件上傳,上傳后注意檢查文件大小,有時(shí)網(wǎng)絡(luò)中斷導(dǎo)致文件上傳不完整,需要重新上傳(親測(cè)無法續(xù)傳)。
上傳完后關(guān)閉filezilla即可。
aspera命令行上傳[網(wǎng)上搜得攻略,未實(shí)操]
下載aspera connect軟件安裝
開始菜單搜索cmd,打開
打開顯示C:\Windows\system32,光標(biāo)一直在后面,重啟下一行還是。所以之后加一個(gè) cd D:/,切換到存儲(chǔ)aspera的那個(gè)盤(此處要搜索aspera安裝在哪里,找到bin文件夾),切換到子文件夾目錄,直接接子文件夾目錄名
-
用cd命令切換到aspera connect\bin5. 完成后輸入NCBI讓輸入的命令行,
ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files>subasp@upload.ncbi.nlm.nih.gov:uploads/xxxx中間不用另起一行,直接接著文件夾名后輸入l100m中的l是小寫的L(這個(gè)嘗試了好久)輸入完成后回車,文件即自動(dòng)上傳。
廢棄選項(xiàng):國家人口健康科學(xué)數(shù)據(jù)中心
國家人口健康科學(xué)數(shù)據(jù)中心 (中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)大數(shù)據(jù)中心)https://www.ncmi.cn/phda/submit.html
2017年成立,到現(xiàn)在仍然是個(gè)鳥樣。英文版竟然還沒有上線。
“其他來源數(shù)據(jù)匯交”:提交數(shù)據(jù),可設(shè)置公開時(shí)間和共享方式(如協(xié)議共享)。










