蛋白質(zhì)組學(xué)學(xué)習(xí)整理-研究方法概述-1

轉(zhuǎn)發(fā)自http://crickcollege.com/news/167.html

領(lǐng)域的大牛Prof. Bernhard Kuster

基于質(zhì)譜的蛋白質(zhì)組學(xué)

蛋白質(zhì)組學(xué)(proteomics),是研究一種細(xì)胞或者一種生物體所表達(dá)的全部蛋白質(zhì)

研究蛋白質(zhì)組學(xué)的重要性:

蛋白質(zhì)才是執(zhí)行生命體功能的基本單元,而且蛋白質(zhì)都是通過形成各種復(fù)合物,組成通路網(wǎng)絡(luò),去行使各種生物學(xué)功能的!所以,有很多生物學(xué)問題只能在蛋白質(zhì)層面上去研究去探索,而且需要站在系統(tǒng)的層面去考察,比如說:蛋白-蛋白相互作用、蛋白的細(xì)胞定位、翻譯后修飾、信號通路及代謝通路的調(diào)控和功能等。

技術(shù)發(fā)展:

最開始使用的技術(shù)就是傳說中的雙向凝膠電泳(2-DE),由于分辨率低、蛋白質(zhì)重疊等各種問題,無論是通量還是準(zhǔn)確度,都不盡如人意。當(dāng)質(zhì)譜技術(shù)興起以后,就迅速被替代了。


質(zhì)譜技術(shù)的誕生:田中耕一

發(fā)展:

十幾年的時(shí)間,蛋白質(zhì)組學(xué)的研究目標(biāo)從細(xì)胞模型、動(dòng)物模型,到人的體液、組織等人體樣本,應(yīng)用范圍的生物復(fù)雜度越來越高。研究目的,也從最初的肽段序列推導(dǎo),到多肽和蛋白質(zhì)的定性定量分析,翻譯后修飾,再到如今成為新熱點(diǎn)的靶向蛋白質(zhì)組學(xué)


基于質(zhì)譜的蛋白質(zhì)組學(xué)概覽:

說到靶向蛋白質(zhì)組學(xué),咱們都知道,一直以來蛋白質(zhì)組學(xué)的應(yīng)用領(lǐng)域主要是針對基礎(chǔ)生物學(xué),比如研究通路、蛋白復(fù)合物、互作網(wǎng)絡(luò),表征細(xì)胞和組織的類型,觀察細(xì)胞周期內(nèi)蛋白質(zhì)的表達(dá)等。近年來,由于技術(shù)的飛速發(fā)展,蛋白質(zhì)組學(xué)開始被用于醫(yī)學(xué)研究和藥物研究。比如說藥物研究,國內(nèi)可能用得還不多,但在歐美已經(jīng)開始越來越廣泛。以肝毒性為例,蛋白質(zhì)組學(xué)可以為藥物研發(fā)前期的肝毒性評估提供研究手段。


蛋白質(zhì)組學(xué)在藥物發(fā)現(xiàn)中的應(yīng)用實(shí)例:

那么,怎么將蛋白質(zhì)組學(xué)應(yīng)用到臨床及藥物研發(fā)中呢?就是需要靶向蛋白質(zhì)組學(xué)技術(shù)了!以前,蛋白質(zhì)組學(xué)技術(shù)主要用于發(fā)現(xiàn)新的未知物,比如肽段、蛋白復(fù)合物、蛋白的翻譯后修飾等。這部分的應(yīng)用很廣,技術(shù)門檻比較低,方法比較通用。但問題是,這種方法思路沒辦法應(yīng)對大量的臨床樣本,可重復(fù)性和準(zhǔn)確性達(dá)不到要求。

于是,靶向分析開始興起,就是說,分析之前我們就明確知道需要分析的物質(zhì)是什么,然后把它挑出來,進(jìn)行一個(gè)精確的定量和分析!我們不需要一次性驗(yàn)證成千上萬的蛋白,但我們需要在成百上千的樣本中驗(yàn)證十幾種或者幾十種我們關(guān)心的蛋白質(zhì),而且這些蛋白質(zhì)常常都是濃度很低的蛋白,用傳統(tǒng)的方法基本上只有被遺漏的命。有了靶向技術(shù),對于研究臨床診斷的生物標(biāo)志物,就有了更大的可能和更強(qiáng)的支撐了!


定性檢測

無論是定性還是定量檢測,樣品制備是跑不掉的準(zhǔn)備工作。用于質(zhì)譜的蛋白質(zhì)樣品,來源非常廣泛,只要你是包含了蛋白質(zhì)的東西,都可以作為來源。對于復(fù)雜的樣品,比如人體體液或組織樣本,蛋白質(zhì)的提取及去高峰度,常常需要復(fù)雜的精細(xì)的處理,而且處理流程根據(jù)樣本和研究目的的不同而不同。

蛋白質(zhì)的定性檢測有兩種思路:Bottom-upTop down。Top down是指從一個(gè)完整的蛋白出發(fā),在質(zhì)譜中進(jìn)行碎片化處理,通過對碎片分子的檢測,推導(dǎo)出蛋白的序列。而在使用中真正占絕大多數(shù)是Bottom-up方法,也就是我們常說的shotgun方法,它充分利用了蛋白質(zhì)自身的特點(diǎn):可以被特定的酶在特定的位點(diǎn)切斷?;舅悸肥?,先用蛋白酶把蛋白序列進(jìn)行酶切,再針對酶切后的肽段進(jìn)行鑒定,所以進(jìn)入質(zhì)譜的檢測對象永遠(yuǎn)是肽段,再根據(jù)肽段序列再推導(dǎo)出蛋白序列。


基于質(zhì)譜的蛋白質(zhì)研究常用方法

Bottom-up/shotgun方法:

1. 樣本處理:拿到蛋白來源的各種樣本,進(jìn)行前處理和優(yōu)化。

2. 蛋白分離:根據(jù)研究需要,用凝膠分離,提取所需的蛋白,或者不分離,全部拿來檢測,需要注意去雜質(zhì);

3. 酶切:用序列特異性的酶,對蛋白進(jìn)行酶切;

4. 肽段分離:酶切后的肽段進(jìn)入HPLC(高壓液相色譜),這也就是我們常說的LC-MS中的LC,肽段會因?yàn)樵谏V柱填料上的保留時(shí)間的不同,得到預(yù)分離;

5. 電離:分離后的肽段,加電壓使其離子化(ESI);或者用MALDI基質(zhì)輔助的激光解離,就不需要HPLC的過程;

6. 質(zhì)譜解析:將帶上電荷的肽段送入質(zhì)譜,肽段會在磁場中發(fā)生偏轉(zhuǎn)(質(zhì)譜儀的基本原理),在質(zhì)譜里收集信號,得到譜圖。

7. 搜庫:用搜索軟件對質(zhì)譜圖進(jìn)行自動(dòng)化的分析,得到肽段及蛋白序列信息。


shotgun一般流程

Tips: 質(zhì)譜種類很多,比如四級桿質(zhì)譜、飛行時(shí)間質(zhì)譜、四級桿離子阱、傅里葉變換質(zhì)譜等

對Shotgun方法的流程,我們可以這樣來總結(jié):

--數(shù)據(jù)產(chǎn)生:蛋白-肽段-譜圖

--數(shù)據(jù)分析:譜圖-肽段-蛋白

Peptide-Spectrum matching(PSM),就是指譜圖與肽段的匹配。匹配得越好,則反推出的蛋白就越準(zhǔn)確。這個(gè)匹配的過程,也就是我們常說的搜庫

1. 背景介紹

質(zhì)譜,聽上去很高大上,無論有多貴重,都是由三部分組成的:離子源+質(zhì)量分析器+檢測器。


,一臺質(zhì)譜可以不止一個(gè)離子源\分析器\檢測器,可以把幾種串聯(lián)起來,針對不同分析需要來使用。

1.離子源。蛋白質(zhì)譜所使用的ESI(Electrospray ionization)電噴霧離子化,對蛋白質(zhì)組學(xué)來說是一個(gè)標(biāo)志性的發(fā)明!因?yàn)槭侵苯訌囊合噙M(jìn)行離子化,使它與LC(液相色譜)的聯(lián)用變得更加容易了,我們可以先用LC將非常復(fù)雜的肽段混合物進(jìn)行預(yù)分離,減少每次分析物的復(fù)雜度,然后分離的肽段可以直接進(jìn)入ESI,形成電離噴霧。

那么,ESI噴霧是怎么形成的呢?簡單來說,分離柱前端有一個(gè)小開口,被分析物根據(jù)質(zhì)量及電荷的不同,依次通過前端的小開口。小開口處加了電壓,剛開始,靜電力與表面張力相同,當(dāng)加大靜電力使它大于表面張力的時(shí)候,液膜破裂,形成無數(shù)帶電的小液滴,就形成噴霧了。像現(xiàn)在比較新的nanoESI技術(shù),LC的流速就更加慢,離子化的效果也更好。

2.質(zhì)量分析器,這是質(zhì)譜儀里最重要的一部分。我們通常聽到的各種質(zhì)譜儀的名字,就是根據(jù)質(zhì)量分析器的類型來命名的。我們樣品中各組分在離子源中發(fā)生電離,并經(jīng)加速電場的作用后,形成離子束,進(jìn)入質(zhì)量分析器中。質(zhì)量分析器將帶電離子根據(jù)其質(zhì)荷比加以分離,記錄各種離子的質(zhì)量數(shù)和豐度,用于后續(xù)定性與定量的分析。

質(zhì)量分析器有兩個(gè)主要的技術(shù)參數(shù):質(zhì)量范圍和分辨率。質(zhì)量范圍是指是所能測定的質(zhì)荷比的范圍,它決定了咱們能檢測到的離子的范圍。比如,ESI離子源能產(chǎn)生許多m/z大于3000的離子,如果你選的質(zhì)量分析器的上限達(dá)不到3000,那么3000以上的離子你就檢測不出來了。

然而,另一個(gè)更為重要的指標(biāo),就是質(zhì)量分析器的分辨率!先上個(gè)公式描述:

分辨率=觀測的一個(gè)質(zhì)譜峰的質(zhì)荷比/半峰高處的峰寬(FWHM)

比如下圖中最左邊的那個(gè)峰,它的質(zhì)荷比是1,085.55,峰高一半的地方的峰寬值是0.217,于是:

分辨率=1,085.55/0.217=5,000


質(zhì)譜分辨率越高,我們將得到越尖越細(xì)的譜峰。

分辨率可以表征兩個(gè)相鄰的譜峰在質(zhì)譜中被區(qū)分開的能力。通過下圖感受一下不同分辨率的質(zhì)譜儀能給我們多么不同的譜峰圖。


圖中以Glucagon(胰高血糖素)為例,展示了不同分辨率的質(zhì)譜儀給出的譜峰。當(dāng)分辨率是1000時(shí),只能看一個(gè)很寬的峰(藍(lán)色);分辨率增加到3000時(shí),峰窄一些(紅色),但還感受不到明顯的差別;當(dāng)提高到10000時(shí),很明顯能看到,其實(shí)這里包含了8個(gè)峰(綠色);再提高到30000的時(shí)候,半峰寬更窄,兩個(gè)相鄰的峰可以徹底地被分開(黑色)。顯然,我們在分辨率為1000或3000,不能準(zhǔn)確的檢測被分析肽段的精確分子量, 從而導(dǎo)致譜圖無法匹配或者發(fā)生錯(cuò)配。

不同的質(zhì)量分析器有不同的分辨率,通常的順序是:傅里葉變換質(zhì)譜分辨率最高,但造價(jià)太貴;其次是Orbitrap(軌道阱系列),分辨率遠(yuǎn)遠(yuǎn)高于其它質(zhì)譜;再次是TOF(時(shí)間飛行質(zhì)譜);然后是離子阱(Ion Trap),最后是四級桿質(zhì)譜(Quadrupole)。

然而,要對肽段進(jìn)行鑒定,一級質(zhì)譜顯然是辦不到的,我們沒法根據(jù)肽段離子m/z的值就推斷出這個(gè)肽段由哪些氨基酸殘基組成(可能的組合非常多),以及序列順序是怎么樣的,對吧?所以,鑒定肽段還需要二級質(zhì)譜。

什么是二級質(zhì)譜呢?簡單來說,肽段混合物通過一級質(zhì)譜得到了一級譜圖,然后從中選擇一個(gè)肽段,通過一些方法,比如,與隨性氣體進(jìn)行碰撞,把肽段碰碎,得到碎片離子,再形成二級譜圖。我們通過觀察碎片離子的質(zhì)量分布來推斷肽斷的殘基組成,最后再反推出蛋白質(zhì)是什么。上個(gè)圖,幫助大家理解一下二級質(zhì)譜是怎么來的。


在上一段,小編提到是從一級質(zhì)譜中“選擇”一個(gè)肽段進(jìn)入二級質(zhì)譜。這里看似講得云淡風(fēng)輕,事實(shí)上怎么選卻是一個(gè)很關(guān)鍵的問題!通常選擇的方法我們可以叫做“TOP”法(這是小編自己起的名字),比如TOP15就是指從一級譜里選前15個(gè)高度的峰,每一次分離一個(gè)肽段,然后對這個(gè)肽段進(jìn)行掃描,得到二級譜圖。

大家發(fā)現(xiàn)了沒有?如果一個(gè)肽段在一級譜圖中沒有進(jìn)入TOP15,那它連打二級譜圖的資格都沒有!原來質(zhì)譜的世界競爭也是如何殘酷!二級質(zhì)譜能掃描哪些肽段是由一級質(zhì)譜決定的,所以我們將這種方法稱為“數(shù)據(jù)依賴性采集(DDA, data dependent acquisition)”!

咱們細(xì)想一下就不難發(fā)現(xiàn),如果一個(gè)蛋白的濃度不夠高,也就是說,它的肽段在一級譜圖中很難成為那些TOPs,那么它能進(jìn)入二級質(zhì)譜的可能性基本上沒有。這就是為什么低峰度蛋白很難被鑒定到!這也就是為什么我們在做比如血液這種樣品的時(shí)候,一定要去除血紅蛋白等高峰度蛋白(如果你想鑒定的蛋白不是血紅蛋白的話)!

很顯然,DDA方法的局限性就擺在那里!這叫想要研究低峰度蛋白的科學(xué)家們怎么忍?于是,一種叫做數(shù)據(jù)非依賴性采集(DIA)的新方法就應(yīng)運(yùn)而生了。

我們再通過以下這個(gè)圖來感受一下一級譜圖與二級譜圖之間的關(guān)系:


比如,第一個(gè)時(shí)間點(diǎn),我們先進(jìn)行MS1掃描,然后選一個(gè)峰高的肽段進(jìn)行MS2掃描,依次類推。在一些掃描速度比較快的質(zhì)譜儀里,一個(gè)MS1譜圖可以進(jìn)行80張MS2的掃描。

好,我們搞清楚了二級質(zhì)譜是怎么來的,那么我們怎么根據(jù)檢測到的離子信息來推測這是什么氨基酸呢?可能你會說,這還不簡單么?根據(jù)分子量呀!

沒錯(cuò),不同的氨基酸,它的分子量不就是一個(gè)簡單的值嗎?然而,這件事卻并沒有這么簡單,因?yàn)檫@個(gè)世界上還存在一個(gè)神奇的東西,它的名字叫同位素!

比如說碳元素,最常見的是原子量12的這種,我們叫C12,然而它還有一個(gè)同樣很穩(wěn)定的好基友,C13(多一個(gè)中子)。于是,我們得考慮到這兩種穩(wěn)定同位素的含量(百度百科說C13占 1.11%,C12占98.89%),對于一個(gè)氨基酸而言,我們就會得到兩個(gè)不同的分子量:

--單同位素分子量,也就是只包含比例最高的那一種同位素的分子量;

--平均分子量,也就是包含了多種同位素的平均分子量。

為啥說平均呢?因?yàn)楫?dāng)肽段分子量越大,含有各種同位素的可能性及不同組合就越多,我們?nèi)绻衙恳环N組合都算一遍分子量,這樣會得到一個(gè)長長的list,到時(shí)候做譜圖匹配時(shí)用哪一個(gè)值呢?也沒譜。所以干脆用一個(gè)平均值來表示。

我們通過下表來感受一下各種不同的氨基酸殘基的單同位素分子量與平均分子量有多大的區(qū)別:


可能你又會問,這兩個(gè)不同的分子量分別在什么情況下用呢?這里又要說到分辨率了,如果咱們用的是高分辨率質(zhì)譜儀,不同的同位素峰會被明顯地分開,也就是說,譜圖里我們能看幾個(gè)同位素峰,這時(shí)我們就可以使用單同位素分子量,可以與相應(yīng)的單同位素峰準(zhǔn)確對應(yīng)。但在低分辨率質(zhì)譜儀里,這些峰很可能混在一起,看上去只是一個(gè)峰,這種情況下,也沒辦法,只能用平均分子量去近似一下了。

下面這個(gè)圖可以很形象地展示出,單同位素分子量與平均分子量在質(zhì)譜圖上差別有多大。在高分辨質(zhì)譜看來,這完全就是兩種不同的離子了。上面我們也說了,根據(jù)平均分子量來計(jì)算,結(jié)果并不準(zhǔn)確,但用單同位素分子量來計(jì)算,就可以準(zhǔn)確對應(yīng)了。


除了同位素,還有一個(gè)因素我們也需要考慮,那就是肽段碎裂進(jìn)入二級質(zhì)譜時(shí),可能會形成三種不同的離子類型,這就是我們通常所說的by離子,ax離子和cz離子。


之所以會形成不同的離子對,是因?yàn)椴煌乃榱逊椒?,造成肽段斷裂的位置不同。大伙兒看看上面這個(gè)圖就明白了。當(dāng)我們使用CID(碰撞誘導(dǎo)解離)或HCD(High-energy C-trap Dissociation)碎裂時(shí),與惰性氣體碰撞的是C-N鍵這里,C端生成y離子,N端生成b離子,這是二級質(zhì)譜產(chǎn)生的最常見的離子對了。當(dāng)我們使用ETD(電子轉(zhuǎn)移解離)碎裂時(shí),因?yàn)橛幸粋€(gè)電子反應(yīng)的過程,在加上電子后才產(chǎn)生的碎裂,它的斷裂位置可能出現(xiàn)在N-C鍵這里,形成cz離子,而TOF類儀器可能會產(chǎn)生ax離子。

離子類型的信息需要傳遞給后續(xù)的搜庫步驟(通常我們在搜庫軟件中指定了儀器類型,軟件就會自動(dòng)匹配離子類型),計(jì)算機(jī)需要模擬最可能的碎裂位置,生成對應(yīng)的理論譜圖,然后拿來與實(shí)際譜圖比對。我們以by離子為例,來看看對一個(gè)肽段來說,它可能碎裂成哪些碎片離子:


那么它可能會生成如下這樣的譜圖:


從譜圖上看,這個(gè)肽段所有的by離子都檢測到了。通常來說,對于豐度不錯(cuò),長短合適的肽段,在高精度質(zhì)譜儀上被完整捕獲到的情況是很常見的。通常情況下50%-80%的by離子都能被捕獲到。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容