代謝組數(shù)據(jù)上傳攻略:手把手教你從零搞定Metabolomics Workbench!

導(dǎo)讀:還在為代謝組數(shù)據(jù)存儲和共享發(fā)愁?本文為你帶來最全上傳指南——從注冊賬號、填寫元數(shù)據(jù),到數(shù)據(jù)上傳、審核反饋,一步步教你獲得專屬DOI號,讓數(shù)據(jù)可追溯、可引用!

一、代謝組簡介

代謝組(Metabolome)是指生物體內(nèi)所有小分子代謝物的集合,包括中間代謝產(chǎn)物(如氨基酸、有機(jī)酸)、激素、信號分子等,分子量通常小于1500 Da。作為系統(tǒng)生物學(xué)的重要組成,代謝組反映了生物體在特定生理或病理狀態(tài)下的生化活動(dòng)終點(diǎn),是基因、蛋白及環(huán)境因素共同作用的直接體現(xiàn)。

代謝組學(xué)(Metabolomics)通過質(zhì)譜(MS)、核磁共振(NMR)等技術(shù)分析代謝物動(dòng)態(tài)變化,廣泛應(yīng)用于疾病標(biāo)志物發(fā)現(xiàn)(如癌癥、糖尿病)、藥物研發(fā)、營養(yǎng)學(xué)及環(huán)境毒理學(xué)研究。其優(yōu)勢在于高靈敏度和動(dòng)態(tài)性,能揭示傳統(tǒng)組學(xué)難以捕捉的生理細(xì)節(jié),為精準(zhǔn)醫(yī)學(xué)和生物機(jī)制解析提供關(guān)鍵依據(jù)。

二、Metabolomics Workbench簡介

Metabolomics Workbench(MW)?是由美國國立衛(wèi)生研究院(NIH)資助的公共數(shù)據(jù)庫和數(shù)據(jù)分析平臺,旨在存儲、共享和分析代謝組學(xué)數(shù)據(jù)。它提供標(biāo)準(zhǔn)化數(shù)據(jù)格式、工具和資源,支持代謝組學(xué)研究。收錄了代謝組相關(guān)的實(shí)驗(yàn)數(shù)據(jù)(如質(zhì)譜、核磁共振數(shù)據(jù))及元數(shù)據(jù),覆蓋人類、動(dòng)物、植物等多個(gè)物種,適用于跨物種研究。

三、數(shù)據(jù)上傳步驟

這里以LC-MS非靶向代謝組學(xué)RAW格式的原始數(shù)據(jù)為例,詳細(xì)介紹如何上傳數(shù)據(jù)。

1) 注冊? ?打開官網(wǎng)

圖1. Metabolomics workbench主頁

點(diǎn)擊右上角的Register(若注冊過請?zhí)^這一步)

圖2. 注冊信息

按照實(shí)際信息填寫,然后點(diǎn)擊Submit按鈕提交注冊。注冊成功后會(huì)收到郵件信息。

圖3.?注冊成功郵件確認(rèn)

2) 登錄

注冊成功后,點(diǎn)擊主頁右上角的Log in,輸入用戶名和密碼,提交進(jìn)入系統(tǒng)。

圖4. 登錄界面


圖5. 登錄后頁面

3)新數(shù)據(jù)上傳

點(diǎn)擊頁面左上角的“Data Repository”(數(shù)據(jù)倉庫)下拉菜單中的“Upload / Manage Studies”,可以進(jìn)入到數(shù)據(jù)提交或者查看已提交list頁面。

圖6. 上傳和管理頁面

點(diǎn)擊“New Submission”按鈕,進(jìn)入新提交頁面

圖7.?新提交頁面

在該頁面上填寫相關(guān)信息,主要包括:

1.? 原始數(shù)據(jù)文件壓縮包名字,也就是將你要上傳的原始文件打包成zip壓縮包,填寫下壓縮包的名字即可。例如MyData.zip

2.? Protocol/method文件名:將Collection、Treatment、SamplePrep相關(guān)的protocol信息存到protocol.txt文件中,將Chromatography、MS相關(guān)的method信息存到method.txt文件中,在相應(yīng)步驟上傳對應(yīng)文件。也就是這里填寫個(gè)文件的名字(后邊步驟不傳這個(gè)文件似乎也能審核通過,但是建議填寫并上傳)。

3.? 待提交文件類型:例如非靶向MS,靶向MS等,請根據(jù)實(shí)際情況填寫

4.? 二進(jìn)制數(shù)據(jù)格式:也就是原始數(shù)據(jù)文件的后綴,例如RAW

5.? 數(shù)據(jù)公開日期:可以選擇不公開,或者填寫公開的日期

點(diǎn)擊提交按鈕,會(huì)分配一個(gè)DataTrack ID,例如這里是5996。然后點(diǎn)擊“New online study submission”按鈕進(jìn)入詳細(xì)內(nèi)容填寫頁面。

圖8. 獲得DataTrack

ID

如果你的數(shù)據(jù)不是用Metabolon分析的,那么選擇“Start a new online study submission”按鈕。

圖9.開始新的在線研究提交

點(diǎn)擊“Start a new online study submission”按鈕后,正式進(jìn)入填寫頁面,需要填寫約10個(gè)tab的信息,包括Project、Study、Subject、Study Design、Collection、Treatment、SamplePrep、MS/NMR、Data和Finalize。其中紅色區(qū)域內(nèi)容為必填項(xiàng),白色區(qū)域的為選填項(xiàng)。請應(yīng)填盡填,能詳細(xì)填寫的就不要簡寫,否則可能會(huì)審核不通過??梢詤⒖紕e人上傳的項(xiàng)目的相關(guān)內(nèi)容填寫。

注:所有內(nèi)容請均使用英文填寫(這里寫中文是為了幫助理解)。

3.1????Project

這部分填寫的是項(xiàng)目/課題(Project)相關(guān)的信息,主要包括項(xiàng)目的Title、Summary、研究所、姓名、地址、郵箱、電話等。填寫完后,點(diǎn)擊Add project metadata會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Study頁面。

圖10. Project元數(shù)據(jù)頁面

3.2????Study

這部分填寫的是研究(Study)相關(guān)的信息,主要包括物種、Title、Summary、研究所/大學(xué)、姓名、地址、郵箱、電話等信息。填寫完后,點(diǎn)擊“Add study metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Subject頁面。

圖11. Study元數(shù)據(jù)頁面

3.3????Subject

這部分填寫的是研究對象(Subject)相關(guān)的信息,主要包括物種(根據(jù)上一步驟選擇的物種自動(dòng)識別)、年齡、身高、體重、性別等研究對象(即取材對象)的相關(guān)信息。填寫完后,點(diǎn)擊“Add subject metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Study design頁面。

圖12. Subject元數(shù)據(jù)頁面

3.4????Study design

這部分填寫的是研究設(shè)計(jì)(Study design)相關(guān)的信息,也就是樣品名,表型,因子,原始數(shù)據(jù)等信息。可以在excel中填寫,填好后,復(fù)制粘貼到輸入框,然后點(diǎn)擊“View/check study design”按鈕,會(huì)讓你為每一列分配一個(gè)名字,例如Subject ID,Sample ID(例如NC1,NC2等),Sample source(例如細(xì)胞系,組織等),factor(例如敲除,加藥等),Raw file name(例如NC1.raw,NC2.raw等)。填寫完后,點(diǎn)擊“Return to start”按鈕,會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到最初頁面,點(diǎn)擊“Continue or edit ……”按鈕,選擇Collection 標(biāo)簽。

注:如果既有POS,又有NEG的,可以POS寫一列,NEG寫一列。

圖13. Study design數(shù)據(jù)頁面

3.5?????????Collection

這部分填寫的是樣品收集(Collection)相關(guān)的信息,包括:Summary、樣品來源、收集方法、收集部位等信息。填寫完后,點(diǎn)擊“Add collection metadata”按鈕會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Treatment頁面。

注意:這里請仔細(xì)填寫,審核比較嚴(yán)格。

圖14. Collection元數(shù)據(jù)頁面

3.6??????????Treatment

這部分填寫的是樣品處理(Treatment)相關(guān)的信息,包括:Summary、處理類型、處理的化合物、劑量等信息。填寫完后,點(diǎn)擊“Add treatment metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Sampleprep頁面。

注意:這里請仔細(xì)填寫,審核比較嚴(yán)格。

圖15. Treament元數(shù)據(jù)

3.7???????????Sample prep

這部分填寫的是樣品制備(Sample prep)相關(guān)的信息,包括:Summary、處理方法,處理存儲條件、提取方法等信息,并將樣品制備protocol文件上傳上去。填寫完后,點(diǎn)擊“Add sampleprep metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Chrom.頁面。

圖16. Sampleprep元數(shù)據(jù)頁面

3.8???????????Chromatography

這部分填寫的是色譜方法(Chromatography method)相關(guān)的信息,包括:色譜類型、儀器名、流動(dòng)相A(Solvent A)、流動(dòng)相B(Solvent B)、流動(dòng)相梯度(Flow Gradient)、流速(Flow Rate)、柱溫(Column Temperature)等信息。填寫完后,點(diǎn)擊“Add Chromatography metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到MS頁面。

注:這些信息一般可以從報(bào)告中獲得,若沒有,請聯(lián)系數(shù)據(jù)產(chǎn)出商。

圖17. Chromatography元數(shù)據(jù)頁面

?以下是一些常見的參數(shù)說明:

色譜類型(Chromatography Type):

1.? ? 反相色譜(Reversed Phase, RP)

固定相極性:非極性(Non-polar)

流動(dòng)相極性:極性(Polar)

典型應(yīng)用:大多數(shù)有機(jī)化合物(Most organic compounds)

2.? ? 正相色譜(Normal Phase, NP)

固定相極性:極性(Polar)

流動(dòng)相極性:非極性(Non-polar)

典型應(yīng)用:異構(gòu)體、極性化合物(Isomers, polar compounds)

3.? ? 離子交換色譜(Ion Exchange, IEX)

]固定相極性:帶電基團(tuán)(Charged groups)

流動(dòng)相極性:緩沖鹽(Buffer salts)

典型應(yīng)用:蛋白質(zhì)、核酸(Proteins, nucleic acids)

4.? ? ?體積排阻色譜(Size Exclusion, SEC)

固定相極性:多孔材料(Porous material)

流動(dòng)相極性:依需求(Depends on application)

典型應(yīng)用:高分子量物質(zhì)如蛋白質(zhì)(High-MW compounds, e.g., proteins)

5.? ? 親水相互作用色譜(HILIC)

固定相極性:極性(Polar)

流動(dòng)相極性:高有機(jī)相+少量水(High organic + low water)

典型應(yīng)用:強(qiáng)極性化合物如糖類、代謝物(Highly polar compounds, e.g., sugars, metabolites)

6.? ? 手性色譜(Chiral Chromatography)

固定相極性:手性選擇劑(Chiral selector)

流動(dòng)相極性:正相或反相條件(NP or RP conditions)

典型應(yīng)用:對映體分離(Enantiomer separation)

Column Name(色譜柱名稱)

定義:色譜柱是分離樣品的核心部件,其名稱通常包含以下信息:

固定相類型(如C18、C8、HILIC等)

柱規(guī)格(內(nèi)徑×長度,如2.1×50 mm)

粒徑(如1.7 μm、5 μm)

品牌/型號(如Waters ACQUITY UPLC BEH C18)

作用:不同色譜柱對化合物的保留能力和分離效果不同,需根據(jù)分析物性質(zhì)選擇。

Solvent A(流動(dòng)相A)

定義:LC-MS中通常使用兩種流動(dòng)相:

Solvent A:通常是?水相(含0.1%甲酸或緩沖鹽,如5 mM乙酸銨)。

Solvent B:通常是?有機(jī)相(如乙腈或甲醇)。

作用:通過調(diào)節(jié)A/B比例實(shí)現(xiàn)化合物在色譜柱上的梯度洗脫(見下文)。

LC-MS中的特殊要求:需使用?質(zhì)譜級溶劑(高純度,低背景干擾)。

Flow Gradient(流動(dòng)相梯度)

定義:隨時(shí)間改變流動(dòng)相A和B的比例的程序。例如:

0 min: 95% A → 5% A?

0-10 min: 線性降至5% A?

10-12 min: 保持5% A?

12.1 min: 回到95% A(柱平衡)?

作用:優(yōu)化不同極性化合物的分離效果和峰形。

關(guān)鍵參數(shù):梯度時(shí)間、斜率、初始和最終比例。

?Flow Rate(流速)

定義:流動(dòng)相通過色譜柱的速率(單位:mL/min或μL/min)。

常見值:

常規(guī)HPLC:1.0 mL/min

UPLC:0.2–0.6 mL/min

微升流速(Nano-LC):100–300 nL/min(用于蛋白質(zhì)組學(xué))

影響:流速影響分離效率、柱壓和分析時(shí)間。高流速可能降低分離度,但縮短運(yùn)行時(shí)間。

Column Temperature(柱溫)

定義:色譜柱的溫度(單位:°C),通常由柱溫箱控制。

常用范圍:30–60°C(部分方法可達(dá)80°C)。

作用:

升高溫度可降低流動(dòng)相粘度,減少柱壓。

影響化合物的保留時(shí)間和選擇性(尤其對離子化化合物)。

注意事項(xiàng):需避免超過色譜柱的最高耐受溫度(如硅膠柱通常≤60°C)。

?3.9????????MS/NMR

這部分填寫MS/NMR相關(guān)的信息,包括:儀器名、儀器類型、MS類型、離子模式(ion mode)、MS信號獲取、數(shù)據(jù)處理、軟件等信息。填寫完后,點(diǎn)擊“Add MS metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Data頁面。

注:若既有POS又有NEG,請選擇2,然后會(huì)出現(xiàn)左右兩個(gè)MS相關(guān)信息供填寫。這些信息一般可以從報(bào)告中獲得,若沒有,請聯(lián)系數(shù)據(jù)產(chǎn)出商。

圖18.陽(positive)離子模式


常見MS類型:

1. 軟電離技術(shù)(Soft Ionization)

ESI(電噴霧電離)

適用:極性化合物、蛋白質(zhì)、多肽、代謝物(LC-MS常用)。

特點(diǎn):生成多電荷離子(如[M+nH]??),適合大分子。

MALDI(基質(zhì)輔助激光解吸電離,Matrix-Assisted Laser Desorption/Ionization)

適用:蛋白質(zhì)、多糖、高分子聚合物(常與TOF聯(lián)用)。

特點(diǎn):樣品與基質(zhì)共結(jié)晶,激光激發(fā)產(chǎn)生單電荷離子(如[M+H]?)。

APCI(大氣壓化學(xué)電離,Atmospheric Pressure Chemical Ionization)

適用:中等極性、小分子(如藥物、脂類)。

特點(diǎn):通過電暈放電離子化,比ESI更耐鹽和緩沖液。

APPI(大氣壓光致電離,Atmospheric Pressure Photoionization)

適用:非極性化合物(如多環(huán)芳烴、固醇類)。

特點(diǎn):紫外燈激發(fā),適合ESI/APCI難以電離的分子。

2. 硬電離技術(shù)(Hard Ionization)

適用于小分子、結(jié)構(gòu)分析(產(chǎn)生碎片離子):

EI(電子轟擊電離,Electron Impact Ionization)

適用:揮發(fā)性小分子(GC-MS常用)。

特點(diǎn):高能電子轟擊,產(chǎn)生豐富碎片,有標(biāo)準(zhǔn)譜庫(如NIST)。

CI(化學(xué)電離,Chemical Ionization)

適用:熱不穩(wěn)定小分子(補(bǔ)充EI)。

特點(diǎn):反應(yīng)氣(如甲烷)緩沖,生成[M+H]?或[M-H]?,碎片較少。

3.10?Data

這部分填寫的Data相關(guān)的信息。也就是提交每個(gè)樣品中每個(gè)代謝物信號的定量表格。包括兩種模式:1)帶代謝物名字的表格;2)不帶代謝物名字的表格,例如m/z表格等??梢詤⒖际纠?,將自己的數(shù)據(jù)調(diào)整成示例的樣式。例如這里我們上傳的是m/z表格,需要將第一列處理成m/z_RT格式,例如645.5327_24.91,其中645.5327是m/z(質(zhì)荷比,離子的質(zhì)量(m)與其所帶電荷數(shù)(z)的比值,用于表征離子的特征),24.91是retention time(保留時(shí)間,樣品組分通過色譜柱所需的時(shí)間)。Units of measurement包括:peak area, peak

intensity, AUC等。填寫好unit等信息后,點(diǎn)擊“選擇文件”按鈕,選擇處理好的txt格式的m/z表格文件,然后點(diǎn)擊“Upload tab-delimited datafile”會(huì)保存本步驟的所填寫的信息,并上傳m/z表格文件。

圖20. 添加反向positive數(shù)據(jù)集

3.11? Finalize和ftp上傳賬號

上傳好定量表格后,點(diǎn)擊“Done”按鈕,然后獲得FTP上傳賬號。主要包括:地址(metabolomicsworkbench.org),用戶名(drccupload),密碼(隨機(jī)字符串)和上傳目錄(DataTrackID)

圖23. FTP上傳賬號


圖24. 輸入FTP賬號信息

打開FTP軟件,輸入主機(jī)名,用戶名和密碼,瀏覽到本地目錄(左側(cè))和服務(wù)器遠(yuǎn)程目錄(右側(cè)),然后將左側(cè)的MyData.zip上傳到右側(cè)5996文件夾即可,速度約1Mb/s。

圖25. 上傳頁面

3.12 郵件反饋

上傳zip文件后,工作人員會(huì)在約5-10個(gè)工作日(實(shí)際上2-3天)內(nèi)進(jìn)行郵件反饋,例如告訴你哪里有問題,如何修改等。

圖26. 郵件反饋信息

根據(jù)郵件內(nèi)容,重新登錄進(jìn)去,查看list of submission,修改郵件中提到的incomplete信息,然后進(jìn)行反饋(response)。

圖27. 根據(jù)反饋修改信息

3.13? ? ?獲得DOI號

經(jīng)過多輪反饋后,最終上傳成功,獲得DOI號,并可以在文章中以此DOI號引用該數(shù)據(jù)。

?圖28.?上傳成功,分配DOI號

微生信助力高分文章,谷歌學(xué)術(shù)9000+

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容