說明:此篇筆記系2016-2017年由克里克學(xué)院與康昱盛主辦的蛋白質(zhì)組學(xué)網(wǎng)絡(luò)大課堂整理而成,侵刪。該課程由上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院助理研究員庫(kù)鑫博士所授。
主要知識(shí)點(diǎn):
- 蛋白定性檢測(cè)(續(xù)):搜庫(kù)工具、搜庫(kù)流程、鑒定結(jié)果評(píng)估
- 蛋白定量檢測(cè):基于MS1的定量、基于MS2的定量
- 靶向蛋白質(zhì)組學(xué):SRM/MRM、DIA
蛋白鑒定
搜庫(kù)工具
說到搜庫(kù),對(duì)于我們使用者來說,其實(shí)并不復(fù)雜,只需要搞清楚以下五個(gè)要素,搜庫(kù)就妥妥的了!
1) 蛋白序列數(shù)據(jù)庫(kù):通常是FASTA格式,從公共數(shù)據(jù)庫(kù)下載,如果是未知的蛋白,可以從DNA測(cè)序的序列翻譯成蛋白;最常用的數(shù)據(jù)庫(kù)Uniprot。
2) 特異性酶解:在搜庫(kù)時(shí)要明確使用的蛋白酶是哪一種,比如最常用的胰蛋白酶(軟件會(huì)自動(dòng)識(shí)別它在K或R后面切斷肽段)。如果我們不對(duì)酶切位點(diǎn)進(jìn)行限制,計(jì)算機(jī)只好把所有的可能都窮盡一遍,產(chǎn)生非常多可能的肽段,不僅運(yùn)行時(shí)間會(huì)非常長(zhǎng),而且錯(cuò)誤匹配的可能性也會(huì)高很多。
3) 轉(zhuǎn)錄后修飾:分兩類,一種叫固定修飾,即在某種氨基酸殘基上一定出現(xiàn)的特定基團(tuán)修飾,比如加入乙?;噭┻M(jìn)行乙酰化修飾;另一種叫可變修飾(動(dòng)態(tài)修飾),就是說某一種氨基酸殘基可能會(huì)被某種基因修飾(被修飾的可能性比較大),例如甲硫氨酸的氧化等。
4) 碎片類型:上一篇專門講過,比如CID或HCD碎裂產(chǎn)生by離子,搜索引擎就只按by離子的規(guī)則切割;沒特別的原因,不建議大家再加入其它離子類型,不然會(huì)大大延長(zhǎng)搜庫(kù)時(shí)間,還會(huì)引入錯(cuò)誤;如果是ETD碎裂則會(huì)產(chǎn)生cz離子,而QTOF會(huì)產(chǎn)生ax離子。搜庫(kù)軟件通常會(huì)根據(jù)我們指定的儀器類型來自動(dòng)判斷碎片離子的類型。
5) 選擇合適的搜庫(kù)軟件:接下來詳聊。
小編明白,大伙兒通常都比較關(guān)心用哪款搜庫(kù)軟件,能最快最好地解決自己的問題。根據(jù)課堂上學(xué)到的內(nèi)容,小編給大伙兒逐一介紹目前最常用到的搜庫(kù)軟件,以及它們各自的特點(diǎn)。
首先出場(chǎng)的是世界上第一款搜庫(kù)軟件SEQUEST!雖然幾經(jīng)升級(jí)更新,它仍然保留了最初設(shè)計(jì)時(shí)的基本架構(gòu),并且仍然被廣泛使用。SEQUEST的思路主要分兩步走:先對(duì)匹配結(jié)果給出一個(gè)預(yù)打分,然后再通過全局的評(píng)估打出最后得分。目前整合了SEQUEST搜庫(kù)方法的軟件還有Proteome Discovery、X!Tandem、Comet等。
第二款軟件是被認(rèn)為是目前世界上使用最為廣泛的搜庫(kù)工具M(jìn)ascot,由英國(guó)Matrix Science公司研發(fā)(www.matrixscience.com,國(guó)內(nèi)的代理商為康昱盛公司)。它與SEQUEST的搜庫(kù)算法完全不同,是基于概率的打分。它之所以廣愛歡迎,主要有以下幾個(gè)特點(diǎn):
能給出清楚明了的搜庫(kù)結(jié)果報(bào)告;
對(duì)蛋白的鑒定率很高;
可以整合和分析幾乎所有主流的質(zhì)譜儀器原始數(shù)據(jù);
搜索速度很快。
還有一款開源軟件也值得介紹給大家:X!Tandem。它的打分算法其實(shí)與SEQUEST是一樣一樣的,但搜庫(kù)速度相當(dāng)快,近年來用戶數(shù)增長(zhǎng)很顯著,感興趣的小伙伴們可以訪問以下網(wǎng)站獲取更多的信息:www.thegpm.org
除了以上三種搜庫(kù)軟件,目前我們能看到的類似的工具還有很多很多,比如Comet, OMSSA, InsPecT, MyriMatch, Phenyx, SpectrumMill, ProteinPilot等等。其實(shí)這些軟件的處理步驟都是搜庫(kù)和打分,但它們所使用的算法思路又各不相同。推薦給大伙兒的做法是,選擇兩個(gè)基于不同算法的搜庫(kù)軟件,分別進(jìn)行打分,然后將結(jié)果合并,可以得到比單用一種搜庫(kù)算法高一些的鑒定結(jié)果。
搜庫(kù)流程
說到底,搜庫(kù)軟件在報(bào)告最終的匹配結(jié)果之前,到底都做了些什么操作呢?
首先,把質(zhì)譜儀得到的譜圖輸入搜庫(kù)軟件。對(duì)于搜庫(kù)軟件來說,碎片離子的信息越豐富越好。如果最后給出的搜庫(kù)結(jié)果不好,建議大伙兒點(diǎn)開二級(jí)譜圖檢查一下,是否因?yàn)樗槠畔⑻俣斐傻模蛘呤且驗(yàn)槎?jí)碎片的intensity太低。
大伙兒要記得,二級(jí)碎片的信息主要是用來做蛋白序列信息推導(dǎo)的,如果二級(jí)譜圖給我們的信息太少,就很難做出一個(gè)好的鑒定結(jié)果。二級(jí)譜圖質(zhì)量不高有各種可能的原因,比如樣品本身的原因,或者質(zhì)譜儀的原因,這個(gè)要根據(jù)實(shí)際情況來逐一排查。
(對(duì)于我們這些小白來說,如果你拿到搜庫(kù)軟件只會(huì)點(diǎn)點(diǎn)鼠標(biāo),那就是入門一級(jí)的水平,如果你還會(huì)打開二級(jí)譜圖查看一番,那就升到二級(jí)了_ 這也是為啥雖然并不需要自己寫搜庫(kù)軟件,咱們還是要學(xué)習(xí)一下搜庫(kù)原理。)
除了譜圖,還將讀入母離子及電荷狀態(tài)等信息,這些都存儲(chǔ)于RAW文件中,所以我們只需要輸入RAW文件,并指定之前談到的五個(gè)變量,就可以開始搜庫(kù)了。
搜庫(kù)軟件通過以下五步來實(shí)現(xiàn)譜圖的正確匹配:
1) 從數(shù)據(jù)庫(kù)中選擇分子量與輸入值相等的肽段;
2) 生成理論碎片,并生成理論譜圖;
3) 將實(shí)驗(yàn)譜圖與理論譜圖進(jìn)行匹配;
4) 對(duì)匹配進(jìn)行打分;
5) 將打分進(jìn)行排序,通過統(tǒng)計(jì)學(xué)分析,確定最佳的匹配結(jié)果并導(dǎo)出。
來,我們看一張形象點(diǎn)的圖,再來理解一下這五步到底是怎么實(shí)現(xiàn)的。
假設(shè)我們的譜圖檢測(cè)到的是一條1000分子量的肽段,則搜庫(kù)軟件首先會(huì)在蛋白序列數(shù)據(jù)庫(kù)里對(duì)所有可能的蛋白序列進(jìn)行特定位點(diǎn)的酶切(酶切位點(diǎn)由我們指定的特異性酶參數(shù)來決定),然后選出分子量1000左右的肽段,根據(jù)指定的儀器類型,模擬打碎成理論上的碎片離子,然后生成理論譜圖,再與輸入的實(shí)際譜圖進(jìn)行比對(duì),得到一個(gè)相似性打分,按得分高低進(jìn)行排序,最后挑選出匹配結(jié)果。
鑒定結(jié)果評(píng)估
聽上去整個(gè)過程并不復(fù)雜,對(duì)不對(duì)?事實(shí)上,由于各種因素對(duì)搜庫(kù)匹配的影響,這里面最重要的問題是,怎么判斷哪些鑒定結(jié)果是對(duì)的!也就是說,我們需要對(duì)匹配結(jié)果進(jìn)行評(píng)估。
在過去,評(píng)估的大部分工作需要手工完成。下面這個(gè)餅圖大伙兒感受一下:整個(gè)樣品制備+質(zhì)譜實(shí)驗(yàn)+數(shù)據(jù)庫(kù)搜索只占了25%的時(shí)間,而對(duì)結(jié)果的手工驗(yàn)證要花掉75%的時(shí)間!是不是很可怕!
還好,我們已經(jīng)不用再受這種折磨了,如今的各種搜庫(kù)軟件都自帶統(tǒng)計(jì)學(xué)算法來幫我們進(jìn)行評(píng)估,幸福感頓時(shí)提升了好幾個(gè)數(shù)量級(jí)!
目前主流的統(tǒng)計(jì)學(xué)評(píng)估算法有兩種思路:
target-decoy 也就是通常所說的正庫(kù)反庫(kù)策略
peptideprophet 基于概率的打分
蛋白定量
為什么要做定量,這個(gè)大概不用小編多啰嗦了吧?總之,定量檢測(cè)可以研究不同生理狀態(tài)及不同時(shí)間點(diǎn)上各種蛋白表達(dá)量的變化,研究意義是大大的有??!
在質(zhì)譜史前時(shí)代,是2D膠的天下。前面也提過,2D膠的通量、準(zhǔn)確性以及可重復(fù)性都沒法跟質(zhì)譜比。
說到利用質(zhì)譜對(duì)蛋白進(jìn)行定量檢測(cè),可以分為基于MS1(一級(jí)譜圖)的定量,以及基于MS2的定量。啥意思呢?基于MS1的定量是指根據(jù)一級(jí)譜圖的信息得到定量結(jié)果,同理,基于MS2的定量是指根據(jù)二級(jí)譜圖的信息得到定量結(jié)果。聽上去很高深吧?別怕,聽小編逐一給你解釋。
基于MS1的定量
基于MS1的定量方法最早是ICAT(ICAT是標(biāo)記試劑的名字,這種定量方法現(xiàn)在用得很少了),現(xiàn)在常用的SILAC,以及l(fā)abel free非標(biāo)記定量。我們來說說SILAC定量策略。
SILAC(Stable Isotope Labeling Strategies)翻譯過來就是穩(wěn)定同位素標(biāo)記技術(shù),說得簡(jiǎn)單一點(diǎn),就是想辦法把非天然同位素?fù)降诫亩卫锎嫣烊煌凰?,然后?jì)算譜圖里各個(gè)同位素的峰面積,其差值就對(duì)應(yīng)著蛋白相對(duì)量的變化。
通常呢,我們是利用C13或者N15這類穩(wěn)定的同位素(叫做重標(biāo)),用培養(yǎng)基或者飼料對(duì)細(xì)胞或者實(shí)驗(yàn)動(dòng)物進(jìn)行培養(yǎng)或喂食。大伙兒應(yīng)該知道吧,有一類氨基酸叫必需氨基酸,比如Lys和Arg,是生物體自身無(wú)法合成的,需要從外界攝入。于是,從外界攝入的過程中,Lys和Arg里包含的C12或N14,就被C13或N15取代了。
妙的是,Lys和Arg又正好是胰蛋白酶的酶切位點(diǎn),所以它又能保證每條切出來的肽段至少有一個(gè)Lys或Arg,也就是說,每條肽段上至少有一個(gè)殘基是有同位素標(biāo)記的,完美!
SILAC的標(biāo)記效率很高,比如細(xì)胞培養(yǎng),通常5、6代以后,同位素標(biāo)記就有95%左右的比例了。重標(biāo)標(biāo)記好后,將沒有同位素標(biāo)記的樣品(通常叫輕標(biāo))與重標(biāo)的樣品1:1混合,經(jīng)過分離、酶切等步驟,進(jìn)入質(zhì)譜檢測(cè)。得到的譜圖會(huì)有對(duì)應(yīng)的兩個(gè)峰,峰面積的差值就是不同樣品中相應(yīng)蛋白的相對(duì)量的變化了。
所以,SILAC定量是一種相對(duì)定量方法,我們只能得到兩組樣品之間每種蛋白含量的差異值,而無(wú)法知道它們的絕對(duì)量。
如果你有三組樣本想要進(jìn)行SILAC定量,我們可以把C13和N15標(biāo)記組合一下,比如輕標(biāo)(不標(biāo)記)、中標(biāo)(C13標(biāo)記)和重標(biāo)(C13和N15共同標(biāo)記),然后三組樣品1:1:1混合。
怎么把同位素標(biāo)記上去這件事情,方法有很多,可以分為代謝同位素標(biāo)記,化學(xué)方法標(biāo)記,酶反應(yīng)標(biāo)記。比如我們剛才舉例的細(xì)胞培養(yǎng),就屬于代謝同位素標(biāo)記,這也是其中最常用的方法;通過化學(xué)反應(yīng)在特別的肽段上加一個(gè)基團(tuán)這種方法叫做化學(xué)方法標(biāo)記;酶切的時(shí)候在斷裂位點(diǎn)標(biāo)記這種方法在酶反應(yīng)標(biāo)記(通常使用O18同位素)
剛才小編在講到SILAC定量時(shí),云淡風(fēng)輕地提到峰面積。有沒有童鞋對(duì)“峰面積”到底是什么心存疑惑呢?小編用一張圖告訴你:
上圖是在時(shí)間軸上從一級(jí)質(zhì)譜得到的多張譜圖,在荷質(zhì)比軸上的每一根小柱子代表的是肽段在不同時(shí)間點(diǎn)上被檢測(cè)到的值,我們用黃色小柱子表示其中一種肽段,將這四個(gè)黃色小柱子的頂點(diǎn)連起來,就可以畫出一個(gè)峰型,這個(gè)峰的面積就是肽段的量(通過若干肽段的量我們可以推出蛋白質(zhì)的量)。
對(duì)這個(gè)圖,小編的理解是,假設(shè)質(zhì)譜掃描的速度是無(wú)限地快,相當(dāng)于可以把一個(gè)時(shí)間段分為無(wú)數(shù)個(gè)時(shí)間點(diǎn),每個(gè)點(diǎn)上都能掃描得到一個(gè)值(小柱子),然后在時(shí)間軸上把這些值全部加起來(做積分)于是就得到了這個(gè)肽段的量。
基于MS2的定量
扯完了基于MS1的定量,我們繼續(xù)扯基于MS2的定量,也就是基于報(bào)告離子的定量。在Shotgun領(lǐng)域主流的方法是iTRAQ和TMT,不要被這些名字嚇到,其實(shí)就是兩種試劑的名字,而且原理和操作方法都差不多。以iTRAQ為例,先來一張清新的示意圖洗洗眼:
圖的左側(cè)就是iTRAQ試劑的分子式,如果你覺得太小了看得不爽,那小編再來貢獻(xiàn)一張更大更簡(jiǎn)明的:
大伙兒看懂了嗎?iTRAQ試劑分三個(gè)部分:報(bào)告離子(就是最終要進(jìn)入二級(jí)質(zhì)譜進(jìn)行檢測(cè)的)、平衡離子(連接報(bào)告離子與反應(yīng)離子),以及與肽段反應(yīng)的反應(yīng)基團(tuán)。
說起來,這個(gè)iTRAQ試劑也是很妙的,它這三個(gè)基團(tuán)里含有一堆同位素,每種同位素的總量是一個(gè)固定的值,但具體位置可以變化,主要體現(xiàn)在報(bào)告離子上的變化,于是我們可以得到幾種不同的報(bào)告離子。
說得詳細(xì)點(diǎn)兒,假設(shè)(只是假設(shè)哈),我們同時(shí)用了四個(gè)C13,四個(gè)N15來標(biāo)記整個(gè)iTRAQ分子,無(wú)論這四個(gè)C13和四個(gè)N15的位置有多么不同,大家總的分子量都是一樣的。但對(duì)于報(bào)告離子來說,可以有變化,比如第一個(gè)報(bào)告離子被標(biāo)記了一個(gè)C13,第二個(gè)報(bào)告離子被標(biāo)記了一個(gè)N15,第三個(gè)標(biāo)記了C13+N15,第四個(gè)標(biāo)注記C13+C13+N15.
由于可以做這樣的位置組合,我們常聽到的iTRAQ“四”標(biāo)或者“八”標(biāo),就是指標(biāo)記位置的不同組合的數(shù)量。以四標(biāo)為例,在MS1時(shí)就通過iTRAQ試劑中的反應(yīng)基團(tuán)將整個(gè)iTRAQ試劑標(biāo)記在肽段上,這里面包含了四種同位素標(biāo)記的組合,但由于它們總的分子量都相同,對(duì)樣品不會(huì)產(chǎn)生什么影響。
好,接下來我們將標(biāo)記好的樣品送入二級(jí)質(zhì)譜,經(jīng)過與惰性氣體的碰撞碎裂,iTRAQ試劑會(huì)按它固定的方式將報(bào)告離子碎裂出來,于是,四種標(biāo)記位置不同的iTRAQ試劑碎裂后,得到四種分子量不同的報(bào)告離子!將這四種報(bào)告離子混合以后得到譜圖,根據(jù)譜峰面積可以推導(dǎo)它們各自標(biāo)記的肽段的量。是不是很機(jī)智的一種方法?
我們還是以四標(biāo)為例,報(bào)告離子的荷質(zhì)比分別是114,115,116,117,于是,在二級(jí)譜圖的110-120的范圍里,我們會(huì)看到一個(gè)與by離子完全不同的非常高的峰,就像這樣:
這就是iTRAQ方法標(biāo)志性的峰!把這個(gè)峰放大,我們就能清楚地看到四個(gè)峰,就是對(duì)應(yīng)的四個(gè)通道。像下面這樣:
Tips:
用iTRAQ方法定量的時(shí)候,質(zhì)譜儀的參數(shù)需要根據(jù)試劑碎裂時(shí)的碰撞能量進(jìn)行優(yōu)化,就是說,要將報(bào)告離子充分地碎裂出來,才能保證它可以被穩(wěn)定可靠地檢測(cè)。
大伙兒如果能基本理解iTRAQ四標(biāo)的原理,對(duì)于iTRAQ八標(biāo),TMT六標(biāo)或者十標(biāo),都可以類推了。只需要注意的是,iTRAQ與TMT試劑來不同的質(zhì)譜儀公司,因此對(duì)質(zhì)譜儀也有選擇性的,大家在選擇到底用哪種標(biāo)記試劑的時(shí)候,除了要考慮標(biāo)記的樣本數(shù),也要考慮對(duì)應(yīng)的質(zhì)譜儀品牌和類型了。
靶向蛋白質(zhì)組學(xué)
前面我們聊過了蛋白質(zhì)組學(xué)的定性檢測(cè)與定量檢測(cè),接下來我們整點(diǎn)兒更前沿的,代表著未來一個(gè)重要發(fā)展方向的東西:靶向蛋白質(zhì)組學(xué)!
話說,在精準(zhǔn)醫(yī)學(xué)如火如荼的今天,最能代表有機(jī)體當(dāng)下生命狀態(tài)的蛋白質(zhì)組學(xué),如何大規(guī)模地應(yīng)用于生物醫(yī)學(xué)領(lǐng)域呢?與基因組學(xué)相比,蛋白質(zhì)組學(xué)目前的瓶頸到底在什么地方呢?
簡(jiǎn)單說來,蛋白質(zhì)組學(xué)的著力點(diǎn)一直是研發(fā)更高通量的技術(shù)平臺(tái),發(fā)現(xiàn)更多未知的蛋白。當(dāng)我們轉(zhuǎn)身關(guān)注生物醫(yī)學(xué)領(lǐng)域時(shí)才發(fā)現(xiàn),人家并不需要一次檢測(cè)上萬(wàn)個(gè)蛋白這么高的通量,但是卻需要在大量的樣本中,高度穩(wěn)定地重復(fù)地檢測(cè)幾十個(gè)幾百個(gè)蛋白。
比如說,當(dāng)我們?cè)噲D把蛋白質(zhì)組學(xué)研究手段用于臨床生物標(biāo)志物的研發(fā)時(shí),走到第二步就卡住了!要在上百個(gè)樣本中重復(fù)檢測(cè)一些候選標(biāo)志物蛋白質(zhì),真的很困難?。?/p>
這種困難是什么造成的呢?最重要的原因是,也就是 Shotgun方法的局限性,它只適合檢測(cè)高豐度蛋白,含量不夠高的蛋白很容易漏檢,而這些卻往往是真正可能的生物標(biāo)志物。此處請(qǐng)大家腦補(bǔ)一下小編介紹DDA(數(shù)據(jù)依賴性采集)時(shí)提到的,低豐度蛋白進(jìn)入二級(jí)質(zhì)譜的機(jī)會(huì)都很少!對(duì)于低豐度蛋白,可能出現(xiàn)的結(jié)果就是,一會(huì)兒檢測(cè)到了,一會(huì)兒又檢測(cè)不到…這叫人怎么忍?
以血液中包含的蛋白為例,大家感受一下,紅色的都是非候選標(biāo)志物,但含量都非常高。余下的低豐度蛋白我們又搞不定。這么看來,對(duì)于臨床應(yīng)用,蛋白質(zhì)組學(xué)還有希望嗎?
2012年,一種新的方法被nature method選為年度新方法,認(rèn)為是未來發(fā)展的大趨勢(shì),它的名字就叫靶向蛋白質(zhì)組學(xué)!于是,希望來了~
靶向蛋白質(zhì)組學(xué)技術(shù)到底是怎樣的不同?它大體上可以分為幾類:MRM/SRM、PRM、SWATH/DIA。大伙兒就跟著小編來了解一下其中兩種比較有代表性的吧~
SRM/MRM
先來名詞解釋一下:
SRM:Selective Reaction Monitor(選擇反應(yīng)監(jiān)測(cè)),就是先只選擇一個(gè)肽段離子,碰撞后,從形成的碎片離子中也只選一個(gè)離子,進(jìn)行檢測(cè)。因?yàn)閮刹蕉贾贿x單離子,針對(duì)性很強(qiáng),可以排除噪音和干擾的影響。
MRM:Multi Reaction Monitor(多反應(yīng)監(jiān)測(cè))就是多個(gè)化合物同時(shí)測(cè)定時(shí),多個(gè)SRM一起做。不需要特意區(qū)分SRM和MRM,只要一次實(shí)驗(yàn)是同時(shí)做幾個(gè)SRM,就是MRM方式了。
概括來說,由于MRM/SRM預(yù)先選定了需要分析的肽段及碎片離子,而不像之前的方法,眉毛胡子一把抓,這樣可以繞過一級(jí)質(zhì)譜中只能選擇高峰度Tops的標(biāo)準(zhǔn),從而保證低峰度蛋白可以不受影響。
第一篇MRM/SRM應(yīng)用的文獻(xiàn)于2009年發(fā)表在CELL上的,對(duì)酵母全蛋白組做了精確定量,覆蓋了從1E6 copies/cell 到100 copies/cell的蛋白,無(wú)一遺漏,是不是很贊?。–ell 138, 795-806, Auguest21, 2009)
另一個(gè)激動(dòng)人心的應(yīng)用發(fā)表于2013年,利用MRM/SRM技術(shù)成功研發(fā)出肺癌篩選的試劑盒,從371個(gè)候選蛋白中選出13個(gè)蛋白的panel作為檢測(cè)目標(biāo)。該試劑盒已得到美國(guó)FDA批準(zhǔn),在美國(guó)上市使用,進(jìn)入醫(yī)保支付范圍。感興趣的小伙伴們可以找文獻(xiàn)來研讀一下(Sci Transl Med 5, 207ra142, 2013).
還有一種與MRM/SRM很類似的方法,叫PRM。它唯一的不同是,MRM/SRM的母離子和子離子都需要預(yù)先選定,而PRM只需要選定母離子,而不需要預(yù)選子離子。這是因?yàn)镻RM是在高精度的Orbitrap質(zhì)譜儀上做(MRM/SRM是在三重四級(jí)桿質(zhì)譜儀上做),由于精度夠高,可以對(duì)多種子離子同時(shí)進(jìn)行準(zhǔn)確的測(cè)定。由于不需要選定子離子,PRM方法實(shí)施起來更容易,而MRM/SRM則需要針對(duì)子離子不斷優(yōu)化儀器參數(shù)。
DIA
MRM之類的技術(shù),需要預(yù)先選定多肽及肽段離子,那么問題就來了,如果我們想發(fā)現(xiàn)點(diǎn)新的東西呢?我沒法預(yù)先選定??!
這種情況下,你需要關(guān)注的就是第二種代表性的靶向蛋白質(zhì)組學(xué)技術(shù)DIA(data-independent acquisition)了,也就是“數(shù)據(jù)非依賴性采集”策略。
DIA的一個(gè)代表性方法叫SWATH技術(shù)(由蛋白質(zhì)組學(xué)泰山北斗Ruedi教授所在的蘇黎世聯(lián)邦理工學(xué)院與AB SCIENX公司合作將這個(gè)方法商業(yè)化)。它的基本思路是:選擇母離子的質(zhì)荷比m/z在500-900或400-1000左右的范圍內(nèi),每25Dal作為一個(gè)窗口,比如,先分離500-525這個(gè)范圍的肽段,然后碎片化,接下來采集525-550分子量范圍的肽段,依次類推。
DIA的一級(jí)質(zhì)譜可以很均勻地采集每個(gè)范圍窗口的肽段,不會(huì)有遺漏,不涉及到對(duì)母離子的限制性篩選,所以無(wú)論是準(zhǔn)確性還是可重復(fù)性,與DDA相比都得到了很好的提升,前途一片大好!
不過呢,細(xì)心一點(diǎn)的童鞋就會(huì)發(fā)現(xiàn),DIA一次采集的范圍有25Dal,顯然是很寬的了!這就意味著,每一次放進(jìn)來的肽段會(huì)很多,產(chǎn)生的碎片離子也非常復(fù)雜,于是我們會(huì)拿到非常復(fù)雜的譜圖。
如果用以往的搜庫(kù)方法,拿理論譜圖去匹配這么復(fù)雜的真實(shí)譜圖,很容易漏掉很多信息,準(zhǔn)確率沒法保證。怎么辦呢?DIA的策略是,先收集真實(shí)的譜圖庫(kù),然后拿實(shí)驗(yàn)譜圖與真實(shí)譜圖庫(kù)進(jìn)行比對(duì),來鑒定肽段。
當(dāng)然啦,即便如此,DIA復(fù)雜的譜圖仍然給后續(xù)的數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)檢驗(yàn)帶來很多挑戰(zhàn),也激起了各種大神的興趣!在這一兩年的各種蛋白質(zhì)組學(xué)會(huì)議上,如果大伙兒留意的話,會(huì)發(fā)現(xiàn)對(duì)DIA數(shù)據(jù)分析的技術(shù)討論是相當(dāng)?shù)幕馃?!我們也期待著DIA領(lǐng)域的突破和發(fā)展!