人遺測(cè)序數(shù)據(jù)的備份備案及共享

為發(fā)表論文故,測(cè)序數(shù)據(jù)一般需要上傳至公共數(shù)據(jù)庫,對(duì)我們而言,國外數(shù)據(jù)庫一般選NCBI,國內(nèi)的可上傳至GSA。其中,人遺數(shù)據(jù)需要上傳到GSA-human,其他物種數(shù)據(jù)上傳到GSA即可。

自從2019年國家出臺(tái)了人遺資源相關(guān)的條規(guī)后,所有上傳至公共數(shù)據(jù)庫的人遺資源都需要在科技部備案。上傳到國內(nèi)的GSA-human,必須要有備份號(hào)和備案號(hào)才能釋放數(shù)據(jù);上傳到NCBI,釋放數(shù)據(jù)雖然不需要這兩個(gè)編號(hào),但如果被人舉報(bào)沒有提前進(jìn)行備份和備案......可能就不只是一篇文章的事了。上傳到GSA的數(shù)據(jù)不需要備份或備案,可直接釋放。

本文僅針對(duì)人遺數(shù)據(jù)共享,穩(wěn)妥起見(節(jié)省時(shí)間),建議提前上傳數(shù)據(jù)至數(shù)據(jù)庫,生成臨時(shí)訪問鏈接后投稿;同時(shí)申請(qǐng)備份號(hào),拿到備份號(hào)之后才能申請(qǐng)備案號(hào)。 下面會(huì)具體介紹如何進(jìn)行備份、備案,以及如何上傳數(shù)據(jù)至GSA-human和NCBI。

申請(qǐng)備份號(hào):需提交數(shù)據(jù)

人類遺傳資源信息備份平臺(tái): https://202.108.211.75/ 有時(shí)候會(huì)提示為不安全鏈接,繼續(xù)訪問即可。個(gè)人感覺這一步并沒有“卡“一說,主要目的是將數(shù)據(jù)留存到國家平臺(tái)。

時(shí)間:大概20天獲得備份號(hào)。

聯(lián)系:電話咨詢,是一位說話溫柔的小姐姐接電話,很耐心;郵件溝通,一般第二天就能收到回復(fù),高效。

基本流程:

  • 注冊(cè)個(gè)人賬戶,這里不需要用PI信息,個(gè)人注冊(cè)即可。


    注冊(cè)賬戶
  • 證件上傳:(2022.4)新出的要求,認(rèn)證需上傳組織機(jī)構(gòu)代碼證復(fù)印件、經(jīng)辦人本人身份證復(fù)印件、法人授權(quán)委托書(經(jīng)辦人非法人的情況)。
    經(jīng)辦人本人身份證復(fù)印件:經(jīng)辦人指賬號(hào)所有人,不是項(xiàng)目負(fù)責(zé)人。人遺辦小姐姐說“不同項(xiàng)目可能對(duì)應(yīng)不同的PI,所以不能認(rèn)證PI”。
    法人授權(quán)委托書(經(jīng)辦人非法人的情況):沒有模板,自行撰寫,蓋單位公章或者法人簽字都可。

  • 登錄后仔細(xì)看”操作指南“


    操作指南
  • 點(diǎn)擊“新建項(xiàng)目”:輸入相應(yīng)信息,項(xiàng)目負(fù)責(zé)人填課題組負(fù)責(zé)人。


    創(chuàng)建項(xiàng)目

使用范圍說明:“對(duì)外提供”一般指提供給國外團(tuán)隊(duì)(國際合作);發(fā)表文章一般選“開放使用”,開放方式可多選,如果需要上傳至公共數(shù)據(jù)庫,同時(shí)選“論文發(fā)表”和“信息平臺(tái)共享”。


開放方式
  • 創(chuàng)建后,會(huì)自動(dòng)跳轉(zhuǎn)到“項(xiàng)目列表”,點(diǎn)擊“查看”可以看到項(xiàng)目具體信息,點(diǎn)擊”添加“新建備份名稱,點(diǎn)擊“添加文件”后,可以通過“添加待上傳文件”直接通過網(wǎng)頁上傳數(shù)據(jù),或通過“添加郵寄文件“上傳數(shù)據(jù)。


    項(xiàng)目列表




添加待上傳文件:通過網(wǎng)頁直接上傳,非常非常慢。



添加郵寄文件:需輸入單號(hào)、文件名(硬盤里的文件夾名稱)。強(qiáng)烈建議超過50G的數(shù)據(jù)通過硬盤郵寄方式上傳。一般一周內(nèi)會(huì)上傳完畢(可以每天上來刷一刷,上傳完后會(huì)提示文件進(jìn)度100%)。硬盤一般不能立即取回,需保留在人遺辦一段時(shí)間,待獲得備案號(hào)之后可以寫郵件申請(qǐng)取回硬盤(順豐到付)。硬盤郵寄時(shí),需要在里面附上一個(gè)紙質(zhì)說明,包含以下信息:項(xiàng)目名稱、編號(hào)、聯(lián)系人及聯(lián)系方式、需上傳的數(shù)據(jù)。硬盤里僅保留需上傳的數(shù)據(jù)(命名方式為項(xiàng)目名稱-聯(lián)系人及電話,如 ABCD測(cè)序-fatlady18811111111),不要同時(shí)存儲(chǔ)其他數(shù)據(jù)。

  • 一般20天左右可以查詢到備份號(hào)(BF開頭的一段字符)(拿出追劇的熱情,每天刷一刷),這時(shí)候可以寫郵件申請(qǐng)返還硬盤,雖然對(duì)方不一定給寄,但是保持聯(lián)系總是沒錯(cuò)噠!獲得備案號(hào)后,肯定就能返回硬盤啦。

申請(qǐng)備案號(hào)

科技部政務(wù)系統(tǒng)備案: https://fuwu.most.gov.cn/ 填寫材料,需填寫備份號(hào)。
時(shí)間:大概20天
注意:測(cè)序公司最好不要選有外資的企業(yè),否則提交是可能被認(rèn)為是國際合作,可能無法通過審核。

主要流程:

  • 提前準(zhǔn)備的材料:論文原文、法人資格材料


    需提前備好
  • 聯(lián)系人寫自己;負(fù)責(zé)人寫PI

  • 流程:提交材料——單位科技處審核——科技部安全審查——審核通過,獲得備案號(hào);或者被打回,根據(jù)意見修改(科技部每月開兩次會(huì)討論人遺申請(qǐng))。


    下載蓋章后提交

    獲得備案號(hào)

數(shù)據(jù)上傳至GSA(國家信息中心、中科院基因組所數(shù)據(jù)中心 )

人遺的數(shù)據(jù)提交到GSA-human https://bigd.big.ac.cn/gsa-human/;其他數(shù)據(jù)提交到GSA即可。

  • 必須用PI郵箱注冊(cè),通過審核后用PI郵箱登錄操作(提交數(shù)據(jù)等),可以將聯(lián)系人設(shè)置為自己,這樣有任何問題工作人員會(huì)直接找聯(lián)系人。

  • 聯(lián)系:加入QQ群,回復(fù)率較高,如未及時(shí)回復(fù),私聊工作人員即可。

  • 上傳:從官網(wǎng)下載最新的手冊(cè),通過FTP上傳文件(最高可達(dá)8M/s),太大可通過郵寄上傳。

  • 將數(shù)據(jù)設(shè)置為公開訪問(開放時(shí)間設(shè)置好,之后可修改延后)。

  • 數(shù)據(jù)公開(共享)需要過審:要求有人遺辦的備份號(hào)、科技部的備案號(hào)。

  • 僅支持部分雜志:https://bigd.big.ac.cn/gsa/statistics?active=articles

  • All sequencing reads have been deposited in the Genome Sequence Archive in National Genomics Data Center, China National Center for Bioinformation / Beijing Institute of Genomics, Chinese Academy of Sciences, under accession number HRA000684 (http://bigd.big.ac.cn/gsa-human/s/3kUd5023) .

數(shù)據(jù)上傳至NCBI

原始測(cè)序數(shù)據(jù)(fastq)一般提交到SRA https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/,具體根據(jù)流程來就行。不超過50G的數(shù)據(jù)可以通過FTP直接上傳,目前我所在單位有線網(wǎng)絡(luò)上傳速度為~800Kb/s,數(shù)據(jù)不多時(shí)尚可接受。勝在有可視化頁面、操作便捷。超過50G的數(shù)據(jù),建議通過服務(wù)器用aspera上傳,勝在穩(wěn)定(如果網(wǎng)絡(luò)不斷,基本不會(huì)中途中斷)。

Note:人遺數(shù)據(jù)如果想設(shè)置為controlled access,需要上傳至dbGAP。

FTP上傳

  1. 下載filezilla

  2. 輸入主機(jī)、用戶名、密碼(NCBI提供的三個(gè))。此時(shí)總是出現(xiàn)響應(yīng) 550 permission denied 錯(cuò)誤。不用管它,直接輸入NCBI給的目錄點(diǎn)開自己的本地站點(diǎn)目錄。

  3. 右鍵文件上傳,上傳后注意檢查文件大小,有時(shí)網(wǎng)絡(luò)中斷導(dǎo)致文件上傳不完整,需要重新上傳(親測(cè)無法續(xù)傳)。

  4. 上傳完后關(guān)閉filezilla即可。

aspera命令行上傳[網(wǎng)上搜得攻略,未實(shí)操]

  1. 下載aspera connect軟件安裝

  2. 開始菜單搜索cmd,打開

  3. 打開顯示C:\Windows\system32,光標(biāo)一直在后面,重啟下一行還是。所以之后加一個(gè) cd D:/,切換到存儲(chǔ)aspera的那個(gè)盤(此處要搜索aspera安裝在哪里,找到bin文件夾),切換到子文件夾目錄,直接接子文件夾目錄名

  4. 用cd命令切換到aspera connect\bin5. 完成后輸入NCBI讓輸入的命令行,

    ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files>subasp@upload.ncbi.nlm.nih.gov:uploads/xxxx

    中間不用另起一行,直接接著文件夾名后輸入l100m中的l是小寫的L(這個(gè)嘗試了好久)輸入完成后回車,文件即自動(dòng)上傳。

廢棄選項(xiàng):國家人口健康科學(xué)數(shù)據(jù)中心

國家人口健康科學(xué)數(shù)據(jù)中心 (中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)大數(shù)據(jù)中心)https://www.ncmi.cn/phda/submit.html

2017年成立,到現(xiàn)在仍然是個(gè)鳥樣。英文版竟然還沒有上線。

“其他來源數(shù)據(jù)匯交”:提交數(shù)據(jù),可設(shè)置公開時(shí)間和共享方式(如協(xié)議共享)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容