導(dǎo)讀:還在為代謝組數(shù)據(jù)存儲和共享發(fā)愁?本文為你帶來最全上傳指南——從注冊賬號、填寫元數(shù)據(jù),到數(shù)據(jù)上傳、審核反饋,一步步教你獲得專屬DOI號,讓數(shù)據(jù)可追溯、可引用!
一、代謝組簡介
代謝組(Metabolome)是指生物體內(nèi)所有小分子代謝物的集合,包括中間代謝產(chǎn)物(如氨基酸、有機(jī)酸)、激素、信號分子等,分子量通常小于1500 Da。作為系統(tǒng)生物學(xué)的重要組成,代謝組反映了生物體在特定生理或病理狀態(tài)下的生化活動(dòng)終點(diǎn),是基因、蛋白及環(huán)境因素共同作用的直接體現(xiàn)。
代謝組學(xué)(Metabolomics)通過質(zhì)譜(MS)、核磁共振(NMR)等技術(shù)分析代謝物動(dòng)態(tài)變化,廣泛應(yīng)用于疾病標(biāo)志物發(fā)現(xiàn)(如癌癥、糖尿病)、藥物研發(fā)、營養(yǎng)學(xué)及環(huán)境毒理學(xué)研究。其優(yōu)勢在于高靈敏度和動(dòng)態(tài)性,能揭示傳統(tǒng)組學(xué)難以捕捉的生理細(xì)節(jié),為精準(zhǔn)醫(yī)學(xué)和生物機(jī)制解析提供關(guān)鍵依據(jù)。
二、Metabolomics Workbench簡介
Metabolomics Workbench(MW)?是由美國國立衛(wèi)生研究院(NIH)資助的公共數(shù)據(jù)庫和數(shù)據(jù)分析平臺,旨在存儲、共享和分析代謝組學(xué)數(shù)據(jù)。它提供標(biāo)準(zhǔn)化數(shù)據(jù)格式、工具和資源,支持代謝組學(xué)研究。收錄了代謝組相關(guān)的實(shí)驗(yàn)數(shù)據(jù)(如質(zhì)譜、核磁共振數(shù)據(jù))及元數(shù)據(jù),覆蓋人類、動(dòng)物、植物等多個(gè)物種,適用于跨物種研究。
三、數(shù)據(jù)上傳步驟
這里以LC-MS非靶向代謝組學(xué)RAW格式的原始數(shù)據(jù)為例,詳細(xì)介紹如何上傳數(shù)據(jù)。
1) 注冊? ?打開官網(wǎng)

點(diǎn)擊右上角的Register(若注冊過請?zhí)^這一步)

按照實(shí)際信息填寫,然后點(diǎn)擊Submit按鈕提交注冊。注冊成功后會(huì)收到郵件信息。

2) 登錄
注冊成功后,點(diǎn)擊主頁右上角的Log in,輸入用戶名和密碼,提交進(jìn)入系統(tǒng)。


3)新數(shù)據(jù)上傳
點(diǎn)擊頁面左上角的“Data Repository”(數(shù)據(jù)倉庫)下拉菜單中的“Upload / Manage Studies”,可以進(jìn)入到數(shù)據(jù)提交或者查看已提交list頁面。

點(diǎn)擊“New Submission”按鈕,進(jìn)入新提交頁面

在該頁面上填寫相關(guān)信息,主要包括:
1.? 原始數(shù)據(jù)文件壓縮包名字,也就是將你要上傳的原始文件打包成zip壓縮包,填寫下壓縮包的名字即可。例如MyData.zip
2.? Protocol/method文件名:將Collection、Treatment、SamplePrep相關(guān)的protocol信息存到protocol.txt文件中,將Chromatography、MS相關(guān)的method信息存到method.txt文件中,在相應(yīng)步驟上傳對應(yīng)文件。也就是這里填寫個(gè)文件的名字(后邊步驟不傳這個(gè)文件似乎也能審核通過,但是建議填寫并上傳)。
3.? 待提交文件類型:例如非靶向MS,靶向MS等,請根據(jù)實(shí)際情況填寫
4.? 二進(jìn)制數(shù)據(jù)格式:也就是原始數(shù)據(jù)文件的后綴,例如RAW
5.? 數(shù)據(jù)公開日期:可以選擇不公開,或者填寫公開的日期
點(diǎn)擊提交按鈕,會(huì)分配一個(gè)DataTrack ID,例如這里是5996。然后點(diǎn)擊“New online study submission”按鈕進(jìn)入詳細(xì)內(nèi)容填寫頁面。

ID
如果你的數(shù)據(jù)不是用Metabolon分析的,那么選擇“Start a new online study submission”按鈕。

點(diǎn)擊“Start a new online study submission”按鈕后,正式進(jìn)入填寫頁面,需要填寫約10個(gè)tab的信息,包括Project、Study、Subject、Study Design、Collection、Treatment、SamplePrep、MS/NMR、Data和Finalize。其中紅色區(qū)域內(nèi)容為必填項(xiàng),白色區(qū)域的為選填項(xiàng)。請應(yīng)填盡填,能詳細(xì)填寫的就不要簡寫,否則可能會(huì)審核不通過??梢詤⒖紕e人上傳的項(xiàng)目的相關(guān)內(nèi)容填寫。
注:所有內(nèi)容請均使用英文填寫(這里寫中文是為了幫助理解)。
3.1????Project
這部分填寫的是項(xiàng)目/課題(Project)相關(guān)的信息,主要包括項(xiàng)目的Title、Summary、研究所、姓名、地址、郵箱、電話等。填寫完后,點(diǎn)擊Add project metadata會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Study頁面。

3.2????Study
這部分填寫的是研究(Study)相關(guān)的信息,主要包括物種、Title、Summary、研究所/大學(xué)、姓名、地址、郵箱、電話等信息。填寫完后,點(diǎn)擊“Add study metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Subject頁面。

3.3????Subject
這部分填寫的是研究對象(Subject)相關(guān)的信息,主要包括物種(根據(jù)上一步驟選擇的物種自動(dòng)識別)、年齡、身高、體重、性別等研究對象(即取材對象)的相關(guān)信息。填寫完后,點(diǎn)擊“Add subject metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到下一個(gè)Study design頁面。

3.4????Study design
這部分填寫的是研究設(shè)計(jì)(Study design)相關(guān)的信息,也就是樣品名,表型,因子,原始數(shù)據(jù)等信息。可以在excel中填寫,填好后,復(fù)制粘貼到輸入框,然后點(diǎn)擊“View/check study design”按鈕,會(huì)讓你為每一列分配一個(gè)名字,例如Subject ID,Sample ID(例如NC1,NC2等),Sample source(例如細(xì)胞系,組織等),factor(例如敲除,加藥等),Raw file name(例如NC1.raw,NC2.raw等)。填寫完后,點(diǎn)擊“Return to start”按鈕,會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到最初頁面,點(diǎn)擊“Continue or edit ……”按鈕,選擇Collection 標(biāo)簽。
注:如果既有POS,又有NEG的,可以POS寫一列,NEG寫一列。

3.5?????????Collection
這部分填寫的是樣品收集(Collection)相關(guān)的信息,包括:Summary、樣品來源、收集方法、收集部位等信息。填寫完后,點(diǎn)擊“Add collection metadata”按鈕會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Treatment頁面。
注意:這里請仔細(xì)填寫,審核比較嚴(yán)格。

3.6??????????Treatment
這部分填寫的是樣品處理(Treatment)相關(guān)的信息,包括:Summary、處理類型、處理的化合物、劑量等信息。填寫完后,點(diǎn)擊“Add treatment metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Sampleprep頁面。
注意:這里請仔細(xì)填寫,審核比較嚴(yán)格。

3.7???????????Sample prep
這部分填寫的是樣品制備(Sample prep)相關(guān)的信息,包括:Summary、處理方法,處理存儲條件、提取方法等信息,并將樣品制備protocol文件上傳上去。填寫完后,點(diǎn)擊“Add sampleprep metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Chrom.頁面。

3.8???????????Chromatography
這部分填寫的是色譜方法(Chromatography method)相關(guān)的信息,包括:色譜類型、儀器名、流動(dòng)相A(Solvent A)、流動(dòng)相B(Solvent B)、流動(dòng)相梯度(Flow Gradient)、流速(Flow Rate)、柱溫(Column Temperature)等信息。填寫完后,點(diǎn)擊“Add Chromatography metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到MS頁面。
注:這些信息一般可以從報(bào)告中獲得,若沒有,請聯(lián)系數(shù)據(jù)產(chǎn)出商。

?以下是一些常見的參數(shù)說明:
色譜類型(Chromatography Type):
1.? ? 反相色譜(Reversed Phase, RP)
固定相極性:非極性(Non-polar)
流動(dòng)相極性:極性(Polar)
典型應(yīng)用:大多數(shù)有機(jī)化合物(Most organic compounds)
2.? ? 正相色譜(Normal Phase, NP)
固定相極性:極性(Polar)
流動(dòng)相極性:非極性(Non-polar)
典型應(yīng)用:異構(gòu)體、極性化合物(Isomers, polar compounds)
3.? ? 離子交換色譜(Ion Exchange, IEX)
]固定相極性:帶電基團(tuán)(Charged groups)
流動(dòng)相極性:緩沖鹽(Buffer salts)
典型應(yīng)用:蛋白質(zhì)、核酸(Proteins, nucleic acids)
4.? ? ?體積排阻色譜(Size Exclusion, SEC)
固定相極性:多孔材料(Porous material)
流動(dòng)相極性:依需求(Depends on application)
典型應(yīng)用:高分子量物質(zhì)如蛋白質(zhì)(High-MW compounds, e.g., proteins)
5.? ? 親水相互作用色譜(HILIC)
固定相極性:極性(Polar)
流動(dòng)相極性:高有機(jī)相+少量水(High organic + low water)
典型應(yīng)用:強(qiáng)極性化合物如糖類、代謝物(Highly polar compounds, e.g., sugars, metabolites)
6.? ? 手性色譜(Chiral Chromatography)
固定相極性:手性選擇劑(Chiral selector)
流動(dòng)相極性:正相或反相條件(NP or RP conditions)
典型應(yīng)用:對映體分離(Enantiomer separation)
Column Name(色譜柱名稱)
定義:色譜柱是分離樣品的核心部件,其名稱通常包含以下信息:
固定相類型(如C18、C8、HILIC等)
柱規(guī)格(內(nèi)徑×長度,如2.1×50 mm)
粒徑(如1.7 μm、5 μm)
品牌/型號(如Waters ACQUITY UPLC BEH C18)
作用:不同色譜柱對化合物的保留能力和分離效果不同,需根據(jù)分析物性質(zhì)選擇。
Solvent A(流動(dòng)相A)
定義:LC-MS中通常使用兩種流動(dòng)相:
Solvent A:通常是?水相(含0.1%甲酸或緩沖鹽,如5 mM乙酸銨)。
Solvent B:通常是?有機(jī)相(如乙腈或甲醇)。
作用:通過調(diào)節(jié)A/B比例實(shí)現(xiàn)化合物在色譜柱上的梯度洗脫(見下文)。
LC-MS中的特殊要求:需使用?質(zhì)譜級溶劑(高純度,低背景干擾)。
Flow Gradient(流動(dòng)相梯度)
定義:隨時(shí)間改變流動(dòng)相A和B的比例的程序。例如:
0 min: 95% A → 5% A?
0-10 min: 線性降至5% A?
10-12 min: 保持5% A?
12.1 min: 回到95% A(柱平衡)?
作用:優(yōu)化不同極性化合物的分離效果和峰形。
關(guān)鍵參數(shù):梯度時(shí)間、斜率、初始和最終比例。
?Flow Rate(流速)
定義:流動(dòng)相通過色譜柱的速率(單位:mL/min或μL/min)。
常見值:
常規(guī)HPLC:1.0 mL/min
UPLC:0.2–0.6 mL/min
微升流速(Nano-LC):100–300 nL/min(用于蛋白質(zhì)組學(xué))
影響:流速影響分離效率、柱壓和分析時(shí)間。高流速可能降低分離度,但縮短運(yùn)行時(shí)間。
Column Temperature(柱溫)
定義:色譜柱的溫度(單位:°C),通常由柱溫箱控制。
常用范圍:30–60°C(部分方法可達(dá)80°C)。
作用:
升高溫度可降低流動(dòng)相粘度,減少柱壓。
影響化合物的保留時(shí)間和選擇性(尤其對離子化化合物)。
注意事項(xiàng):需避免超過色譜柱的最高耐受溫度(如硅膠柱通常≤60°C)。
?3.9????????MS/NMR
這部分填寫MS/NMR相關(guān)的信息,包括:儀器名、儀器類型、MS類型、離子模式(ion mode)、MS信號獲取、數(shù)據(jù)處理、軟件等信息。填寫完后,點(diǎn)擊“Add MS metadata”會(huì)保存本步驟所填寫的內(nèi)容,然后進(jìn)入到Data頁面。
注:若既有POS又有NEG,請選擇2,然后會(huì)出現(xiàn)左右兩個(gè)MS相關(guān)信息供填寫。這些信息一般可以從報(bào)告中獲得,若沒有,請聯(lián)系數(shù)據(jù)產(chǎn)出商。


常見MS類型:
1. 軟電離技術(shù)(Soft Ionization)
ESI(電噴霧電離)
適用:極性化合物、蛋白質(zhì)、多肽、代謝物(LC-MS常用)。
特點(diǎn):生成多電荷離子(如[M+nH]??),適合大分子。
MALDI(基質(zhì)輔助激光解吸電離,Matrix-Assisted Laser Desorption/Ionization)
適用:蛋白質(zhì)、多糖、高分子聚合物(常與TOF聯(lián)用)。
特點(diǎn):樣品與基質(zhì)共結(jié)晶,激光激發(fā)產(chǎn)生單電荷離子(如[M+H]?)。
APCI(大氣壓化學(xué)電離,Atmospheric Pressure Chemical Ionization)
適用:中等極性、小分子(如藥物、脂類)。
特點(diǎn):通過電暈放電離子化,比ESI更耐鹽和緩沖液。
APPI(大氣壓光致電離,Atmospheric Pressure Photoionization)
適用:非極性化合物(如多環(huán)芳烴、固醇類)。
特點(diǎn):紫外燈激發(fā),適合ESI/APCI難以電離的分子。
2. 硬電離技術(shù)(Hard Ionization)
適用于小分子、結(jié)構(gòu)分析(產(chǎn)生碎片離子):
EI(電子轟擊電離,Electron Impact Ionization)
適用:揮發(fā)性小分子(GC-MS常用)。
特點(diǎn):高能電子轟擊,產(chǎn)生豐富碎片,有標(biāo)準(zhǔn)譜庫(如NIST)。
CI(化學(xué)電離,Chemical Ionization)
適用:熱不穩(wěn)定小分子(補(bǔ)充EI)。
特點(diǎn):反應(yīng)氣(如甲烷)緩沖,生成[M+H]?或[M-H]?,碎片較少。
3.10?Data
這部分填寫的Data相關(guān)的信息。也就是提交每個(gè)樣品中每個(gè)代謝物信號的定量表格。包括兩種模式:1)帶代謝物名字的表格;2)不帶代謝物名字的表格,例如m/z表格等??梢詤⒖际纠?,將自己的數(shù)據(jù)調(diào)整成示例的樣式。例如這里我們上傳的是m/z表格,需要將第一列處理成m/z_RT格式,例如645.5327_24.91,其中645.5327是m/z(質(zhì)荷比,離子的質(zhì)量(m)與其所帶電荷數(shù)(z)的比值,用于表征離子的特征),24.91是retention time(保留時(shí)間,樣品組分通過色譜柱所需的時(shí)間)。Units of measurement包括:peak area, peak
intensity, AUC等。填寫好unit等信息后,點(diǎn)擊“選擇文件”按鈕,選擇處理好的txt格式的m/z表格文件,然后點(diǎn)擊“Upload tab-delimited datafile”會(huì)保存本步驟的所填寫的信息,并上傳m/z表格文件。



3.11? Finalize和ftp上傳賬號
上傳好定量表格后,點(diǎn)擊“Done”按鈕,然后獲得FTP上傳賬號。主要包括:地址(metabolomicsworkbench.org),用戶名(drccupload),密碼(隨機(jī)字符串)和上傳目錄(DataTrackID)


打開FTP軟件,輸入主機(jī)名,用戶名和密碼,瀏覽到本地目錄(左側(cè))和服務(wù)器遠(yuǎn)程目錄(右側(cè)),然后將左側(cè)的MyData.zip上傳到右側(cè)5996文件夾即可,速度約1Mb/s。

3.12 郵件反饋
上傳zip文件后,工作人員會(huì)在約5-10個(gè)工作日(實(shí)際上2-3天)內(nèi)進(jìn)行郵件反饋,例如告訴你哪里有問題,如何修改等。

根據(jù)郵件內(nèi)容,重新登錄進(jìn)去,查看list of submission,修改郵件中提到的incomplete信息,然后進(jìn)行反饋(response)。

3.13? ? ?獲得DOI號
經(jīng)過多輪反饋后,最終上傳成功,獲得DOI號,并可以在文章中以此DOI號引用該數(shù)據(jù)。

微生信助力高分文章,谷歌學(xué)術(shù)9000+