中國核酸數(shù)據(jù)庫GSA數(shù)據(jù)提交指南

注冊并登錄生物數(shù)據(jù)遞交系統(tǒng)(BIG Sub, https://bigd.big.ac.cn/gsub/

GSA的數(shù)據(jù)模型

為確保與國際同類數(shù)據(jù)庫系統(tǒng)的兼容性,GSA遵循INSDC聯(lián)盟的數(shù)據(jù)標(biāo)準(zhǔn),GSA元數(shù)據(jù)類別主要包括項(xiàng)目信息(BioProject,歸檔于生物項(xiàng)目數(shù)據(jù)庫)、樣本信息(BioSample,歸檔于生物樣本數(shù)據(jù)庫)、實(shí)驗(yàn)信息(Experiment)、以及測序反應(yīng)(Run)信息。項(xiàng)目信息是用來描述所開展研究的目的、涉及物種、數(shù)據(jù)類型、研究思路等信息;樣本信息是指本研究涉及的生物樣本描述,如樣本類型、樣本屬性等;實(shí)驗(yàn)信息包括實(shí)驗(yàn)?zāi)康?、文庫?gòu)建方式、測序類型等信息;測序反應(yīng)信息包括測序文件和對應(yīng)的校驗(yàn)信息。各類數(shù)據(jù)之間采用線性、一對多的模式進(jìn)行關(guān)聯(lián),從而形成“金字塔”式的信息組織與管理模式(圖1)。


主要分為三個部分

1.創(chuàng)建項(xiàng)目(BioProject);
2.創(chuàng)建樣本(BioSample);
3.創(chuàng)建GSA數(shù)據(jù)集;

1. 創(chuàng)建項(xiàng)目(BioProject)

如果您之前沒有創(chuàng)建項(xiàng)目(BioProject)請進(jìn)入 BioProject 數(shù)據(jù)庫完成創(chuàng)建:
BioProject的構(gòu)建分為五個步驟。

  • 第一個是提交者信息,這里一般不需要修改,直接點(diǎn)擊保存即可。
  • 第二個是基本信息:我們需要指定發(fā)布的日期,這里選擇日期,不同于NCBI的是在我們公開的日期之前,數(shù)據(jù)可以隨時修改時間。
  • 第三個是項(xiàng)目類型:按自己數(shù)據(jù)類型填寫就好。
  • 第四個出版信息:空著就可以
  • 第五個就是概況信息:預(yù)覽,檢查前面幾個填寫的內(nèi)容,如果發(fā)現(xiàn)前面有內(nèi)容不對,直接點(diǎn)擊這五個模塊中的任何一個都可以轉(zhuǎn)到該模塊進(jìn)行更正。

2. 創(chuàng)建樣本(BioSample)

詳細(xì)說明文件:https://bigd.big.ac.cn/gsub/document/BioSample-BioSample_Submission_Guide_2.2.cn.pdf

如果您之前沒有創(chuàng)建樣本(BioSample)請進(jìn)入 BioSample 數(shù)據(jù)庫完成創(chuàng)建:

  • 第一步都一樣,是確認(rèn)提交者信息,一般不做修改:
  • 第二步 選擇時間和項(xiàng)目同一個試時間即可,輸入項(xiàng)目號,注意項(xiàng)目號就是上面我們填寫完成后生成的。
  • 第三步:填寫樣本類型
  • 第四步: 填寫樣本文件
  • 第五步: 查看我們填寫的信息。

3. 構(gòu)建GSA數(shù)據(jù)集

完成 GSA數(shù)據(jù)集中Experiment和Run的元數(shù)據(jù)信息錄入——實(shí)現(xiàn)與BioProject、BioSample和數(shù)據(jù)文件的相互關(guān)聯(lián)。通過FTP完成數(shù)據(jù)文件上傳。

  • 第一步: 點(diǎn)擊GSA按照圖中順序進(jìn)行點(diǎn)擊,第一個提交者信息和前面兩個都是一樣的,所以只需要保存就好。
  • 第二步:填寫一個xlsx,包含兩個sheets,包括一些數(shù)據(jù)的基本信息,填好上傳即可,注意數(shù)據(jù)只能提交壓縮格式。基本信息的填寫說明:https://bigd.big.ac.cn/gsub/document/batch/gsa/GSA_batch_submit_template_help_document.cn.pdf
  • 第三步:上傳數(shù)據(jù),這里我選擇用Aspera命令行上傳
ascp -P 33001 -i /your/path/key/aspsub_rsa -QT -l100m -k1 -d /your/data/path/fastqs aspsub@submit.big.ac.cn:uploads/z0000@gmail.com_f9ff019d
  • 第四步:查看是否正確

  • 第五步:上傳結(jié)果修改和追蹤
    可以參考:https://bigd.big.ac.cn/gsa/document/GSA-GSA_Submission_Guide_2.2.cn.pdf

    通常狀況下,數(shù)據(jù)信息與文件審核歸檔約需要 1-2 天,歸檔成功后會收到通知郵件,并可在 GSA 列表中查找的分配的 GSA 編號。

參考:
http://blog.sciencenet.cn/blog-3334560-1218399.html
https://bigd.big.ac.cn/gsa/documents

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容