原文鏈接:https://mp.weixin.qq.com/s/RPIRfPUDadPGMNzV5tbAFQ
聽說顏寧女神來到生化所做演講,引發(fā)了圍觀熱潮,舉辦方不得已臨時(shí)更換了演講場(chǎng)所。小師弟我因?yàn)閿D不進(jìn)去,未能一睹女神風(fēng)采,不過有同學(xué)朋友圈發(fā)了現(xiàn)場(chǎng)照片,大家可以感受一下。
聽說上一次引發(fā)同樣現(xiàn)象的,還是施一公教授來此演講——果然是名師出高徒??!施一公教授和顏寧教授都是國(guó)際頂級(jí)的結(jié)構(gòu)生物學(xué)研究者,小師弟想借此機(jī)會(huì),和大家聊一聊結(jié)構(gòu)生物學(xué)相關(guān)的知識(shí)。
顏寧教授
結(jié)構(gòu)生物學(xué)主要是通過解析生物大分子的具體三維結(jié)構(gòu),從最底層詳細(xì)闡明各種分子的作用機(jī)制,如酶的催化機(jī)制、信號(hào)通路中互作分子的互作機(jī)制以及疾病發(fā)生過程中蛋白質(zhì)折疊變化(想起瘋牛病和阿爾茲海默癥沒有?)等。
獲得各種生物大分子的結(jié)構(gòu),尤其是蛋白質(zhì)分子的結(jié)構(gòu)在很多領(lǐng)域都具有重要作用。比如根據(jù)靶標(biāo)蛋白的結(jié)構(gòu)進(jìn)行理性藥物設(shè)計(jì)以及理性篩選。
用于獲得生物大分子結(jié)構(gòu)的實(shí)驗(yàn)手段主要有3大類:(1)X射線(現(xiàn)在基本上都是同步輻射光源用于解析結(jié)構(gòu)),(2)核磁共振(NMR)以及(3)冷凍電鏡(cryo-EM)。三種方法都及其依賴于大型設(shè)施/儀器的應(yīng)用。
上海光源(Shanghai Synchrotron Radiation Facility,SSRF)
雖然已經(jīng)解析出來的蛋白質(zhì)結(jié)構(gòu)日益增多(可以到蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB中查詢其結(jié)構(gòu)是否被解析),但是很多小伙伴們的研究目標(biāo)的結(jié)構(gòu)還沒有被解析(實(shí)際上是大部分蛋白結(jié)構(gòu)都沒有被解析)。
蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB:http://www.rcsb.org/
那么,在實(shí)驗(yàn)之外,有其他方法獲得生物大分子的結(jié)構(gòu)嗎?當(dāng)然有啊,那就是結(jié)構(gòu)預(yù)測(cè)啊。
PS:結(jié)構(gòu)預(yù)測(cè)獲得的結(jié)構(gòu)不一定準(zhǔn)確,不過近年來隨著數(shù)據(jù)庫的擴(kuò)大以及算法的改進(jìn),結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確性越來越高。
關(guān)于核酸RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè),之前我們公眾號(hào)介紹過RNAstructure的使用:《如何繪制高大上的RNA 二級(jí)結(jié)構(gòu)圖?》(關(guān)于RNA三級(jí)結(jié)構(gòu)的預(yù)測(cè),我們稍后會(huì)有推文。)我們先來介紹一下蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)。
一、背景介紹
蛋白質(zhì)的結(jié)構(gòu)從低維度到高維度劃分為四級(jí):
一級(jí)結(jié)構(gòu)——氨基酸序列;
二級(jí)結(jié)構(gòu)——主鏈原子形成的局部空間構(gòu)象,如α螺旋,β折疊;
三級(jí)結(jié)構(gòu)——二級(jí)結(jié)構(gòu)在三維空間排列形成三維結(jié)構(gòu);
四級(jí)結(jié)構(gòu)——不同亞基組成的蛋白質(zhì)復(fù)合物大分子。
在二級(jí)結(jié)構(gòu)和三節(jié)結(jié)構(gòu)之間,還存在超二級(jí)結(jié)構(gòu)(有些書籍稱作motif,模體/基序)以及結(jié)構(gòu)域。
二、工具使用
從一級(jí)序列我們能夠獲得哪些信息呢?小師弟在此給大家安利一個(gè)網(wǎng)站,https://web.expasy.org/protparam/。
它的主界面非常簡(jiǎn)單,我們可以輸入蛋白質(zhì)的AC號(hào)或者蛋白質(zhì)序列,然后點(diǎn)擊compute parameters, 然后就可以獲得這個(gè)蛋白質(zhì)的諸多信息了。
PS:ExPASy 是一個(gè)神器的網(wǎng)站,大家可以通過網(wǎng)址https://www.expasy.org/resources來訪問其提供的各種生物信息學(xué)工具,有很多妙用哦!之前我們?cè)?a target="_blank">研究Protein,這些技術(shù)不得不看中有提到其中的PROSITE的用法。
在跳轉(zhuǎn)出來的結(jié)果頁,我們可以獲得如下一些信息:
蛋白質(zhì)分子的氨基酸數(shù)量及其相對(duì)分子質(zhì)量,
理論等電點(diǎn),
氨基酸組成及其帶電氨基酸數(shù)量,
原子組成和分子式,
消光系數(shù)/吸收度,
半衰期,
不穩(wěn)定系數(shù),
脂肪性系數(shù)以及該蛋白質(zhì)的總平均親水性。
三、結(jié)果解讀和研究意義
分子質(zhì)量在SDS-PAGE電泳以及western blot中非常有用。但是,在SDS-PAGE或者western blot實(shí)驗(yàn)中,分子條帶大小并一定和此處給的完全相符,排除了未充分煮樣等實(shí)驗(yàn)操作失誤外,還可能是因?yàn)檫@些蛋白帶電荷過于特殊,有別于正常蛋白。對(duì)于蛋白分子質(zhì)量,我們還可以使用氨基酸殘基數(shù)目*110來快速估算。
等電點(diǎn)就是電解質(zhì)在此pH下,其所帶的正電荷和負(fù)電荷一樣多,導(dǎo)致其凈電荷為0。理論等電點(diǎn)在等電聚焦以及使用離子交換層析分離純化蛋白時(shí)非常有用。使用離子交換層析分離純化兩個(gè)蛋白,一般需要兩個(gè)蛋白等電點(diǎn)相差至少0.5。對(duì)于常見的蛋白純化親和標(biāo)簽,一般都已經(jīng)通過基因工程改造,將其等電點(diǎn)改造成明顯偏離普通蛋白的等電點(diǎn)。如His-sumo標(biāo)簽的等電點(diǎn)為5.4,GST標(biāo)簽的等電點(diǎn)為5.6,MBP標(biāo)簽的等電點(diǎn)為4.9。而大多數(shù)蛋白的等電點(diǎn)為偏酸性,略低于7,因此可以方便的使用離子交換層析方法分離親和標(biāo)簽和不含標(biāo)簽的目的蛋白。
在氨基酸組成方面,我們可以方便的看到20種氨基酸占比(有幾個(gè)氨基酸在大多數(shù)蛋白中的占比相對(duì)恒定,此是諸多蛋白質(zhì)濃度測(cè)定的統(tǒng)計(jì)學(xué)基礎(chǔ))。有細(xì)心的小伙伴可能發(fā)現(xiàn),在20種氨基酸下面,還有3個(gè)氨基酸符號(hào),那是什么東東?說實(shí)話,第一次打開這個(gè)結(jié)果頁,我也被這三個(gè)符號(hào)唬住了。本著科研狗+理工男的嚴(yán)謹(jǐn)精神(對(duì),我大生物就是理科,那些常常懟生物像文科的,別逼逼,我不接受反駁,小師弟要傲嬌一回),我立馬查詢一番,原來,B就是Asx,Aspartic acidor Asparagine(天冬氨酸或者天冬酰胺);Z就是Glx,Glutamine or Glutamic acid(谷氨酰胺或者谷氨酸);X就是Xaa,Any amino acid(任意氨基酸)。也就是說,這3個(gè)符號(hào)是用來表示暫時(shí)還有歧義的氨基酸殘基的,并不是什么稀有氨基酸。
下面還有荷電氨基酸統(tǒng)計(jì)。分別統(tǒng)計(jì)了帶負(fù)電氨基酸(天冬氨酸和谷氨酸)的數(shù)量,以及帶正電氨基酸(賴氨酸和精氨酸)的數(shù)量。有小伙伴可能會(huì)好奇,堿性氨基酸不是賴氨酸、精氨酸、組氨酸3個(gè)嗎?這里面為什么沒有組氨酸呢?因?yàn)榻M氨酸是一種弱堿性氨基酸,在生理狀態(tài)下基本上不帶電的。不信,我給你看個(gè)表格。
我們可以看到,組氨酸的等電點(diǎn)為7.59,而人體血液的pH在7.35-7.45,其他多種體液也都是偏弱堿性(當(dāng)然,胃液這種變態(tài)不算的,它的pH變態(tài)的為0.9-1.5),所以說組氨酸在生理狀態(tài)下基本上不帶電,所以就不參與統(tǒng)計(jì)嘍!
酸堿體質(zhì)理論
消光系數(shù)和吸收度:根據(jù)朗伯比爾定律A=lg(1/T)=Kbc (A為吸光度,T為透射比,是出射光強(qiáng)度(I)比入射光強(qiáng)度(I0),c為吸光物質(zhì)的濃度,單位為mol/L,b為吸收層厚度,單位為厘米),吸光度和溶液中的溶質(zhì)濃度以及光程長(zhǎng)度成正比,這個(gè)比例系數(shù)K就是我們的消光系數(shù)。那么消光系數(shù)有什么用呢?我們可以通過分光光度計(jì)測(cè)量出吸光度值A(chǔ)bs(測(cè)量入射光和出射光的比值,并取對(duì)數(shù)),然后除以(光程*消光系數(shù)),就可以知道蛋白質(zhì)的濃度了。
簡(jiǎn)單的來說,我們?nèi)? ul蛋白溶液,使用nanodrop測(cè)量出吸光度值A(chǔ),然后直接除以這里給的吸收度,就可以得到蛋白質(zhì)濃度了(nanodrop默認(rèn)的設(shè)置是1 Abs=1mg/ml)。
整個(gè)過程不超過2分鐘,比起B(yǎng)radford,Lowry之流測(cè)蛋白濃度,不知道要快多少倍。
實(shí)際上,這個(gè)消光系數(shù)和吸收度我們自己都可以計(jì)算出來的,計(jì)算方法也很簡(jiǎn)單:
消光系數(shù)=Numb(Trp)*5500 + Numb(Tyr)*1490+Numb(Cystine)*125
吸收度=消光系數(shù)/分子質(zhì)量
Numb表示個(gè)數(shù)
從上述公式,我們也可以知道,一個(gè)蛋白質(zhì)分子的消光系數(shù)主要取決于色氨酸(要不怎么叫做“色”氨酸呢?)、酪氨酸以及胱氨酸的含量。如果一個(gè)序列中含有多個(gè)半胱氨酸,考慮到兩個(gè)半胱氨酸可以被氧化生成一個(gè)胱氨酸,因此,有多個(gè)半胱氨酸的序列,ExPASy都給了兩個(gè)消光系數(shù),一個(gè)是所有半胱氨酸都用于生成胱氨酸,一個(gè)是所有半胱氨酸都是還原形式,沒有生成任何胱氨酸。小伙伴們可以用計(jì)算器根據(jù)前面氨基酸組成的圖,按照這里的公式計(jì)算一下消光系數(shù)和吸收度,看是否一致哦!
我為什么詳細(xì)介紹消光系數(shù)的計(jì)算呢?因?yàn)楹芏嘈』锇樵诘鞍讓?shí)驗(yàn)中會(huì)做突變分析,現(xiàn)在我們知道了,如果沒有消除或者新增色氨酸、酪氨酸以及半胱氨酸,一個(gè)蛋白的消光系數(shù)是不會(huì)發(fā)生變化的(吸收度會(huì)變化一點(diǎn)點(diǎn),因?yàn)榉肿淤|(zhì)量會(huì)有一點(diǎn)點(diǎn)變化,不過基本上不用考慮),那么我們就不用重新計(jì)算消光系數(shù)了。
?半衰期:半衰期用來衡量目的蛋白在體內(nèi)的穩(wěn)定性。蛋白質(zhì)在細(xì)胞中處于動(dòng)態(tài)平衡,在其合成之后,它的壽命基本上就已經(jīng)決定了。也就是說,細(xì)胞這個(gè)家伙為了保證自己的運(yùn)轉(zhuǎn)正常,給大多數(shù)蛋白都設(shè)定了一個(gè)使用期限,防止超期限執(zhí)行任務(wù)的蛋白因?yàn)槔匣鲥e(cuò),而衰老的蛋白會(huì)被回收利用或者消除(小師弟感受到了強(qiáng)烈的宿命論?。。。?。
而決定這個(gè)使用期限(用半衰期表示)的,就是蛋白質(zhì)自身N端的前幾個(gè)氨基酸序列。因此,這個(gè)ExPASy程序會(huì)把我們輸入序列的前幾個(gè)氨基酸當(dāng)做N端序列計(jì)算這個(gè)蛋白質(zhì)的半衰期,并且給出了在哺乳動(dòng)物網(wǎng)織紅細(xì)胞、酵母和大腸桿菌這3種模式細(xì)胞中的半衰期。
文章中經(jīng)常通過蛋白半衰期來研究泛素化-蛋白酶體途徑介導(dǎo)的蛋白降解
不穩(wěn)定系數(shù):不穩(wěn)定系數(shù)用來衡量目的蛋白在體外的穩(wěn)定性。不穩(wěn)定系數(shù)基于之前研究者的發(fā)現(xiàn),也即某些二肽在穩(wěn)定蛋白和不穩(wěn)定蛋白中的出現(xiàn)概論相差很大,因此,可以通過這些二肽的出現(xiàn)頻率來預(yù)測(cè)蛋白質(zhì)在體外的穩(wěn)定性。不穩(wěn)定系數(shù)越小,表明此蛋白越穩(wěn)定。在判別標(biāo)準(zhǔn)上,將不穩(wěn)定系數(shù)小于40的蛋白判定為能夠穩(wěn)定存在。結(jié)合小師弟多年純化蛋白的經(jīng)驗(yàn)(苦逼經(jīng)歷),這項(xiàng)預(yù)測(cè)還是相對(duì)比較準(zhǔn)確的。對(duì)于被預(yù)測(cè)為不穩(wěn)定的蛋白,尤其是那些數(shù)值遠(yuǎn)遠(yuǎn)大于40的目的蛋白,小伙伴如果對(duì)其進(jìn)行操作,一定要加快實(shí)驗(yàn)進(jìn)度哦,因?yàn)檫@些蛋白在4℃放個(gè)兩三天,就可能降解了哦!
脂肪系數(shù):脂肪系數(shù)也可以用來衡量目的蛋白的穩(wěn)定性。我們知道,蛋白質(zhì)折疊的一個(gè)主要驅(qū)動(dòng)力就是疏水相互作用。而脂肪系數(shù)用丙氨酸、纈氨酸、亮氨酸、異亮氨酸這4個(gè)疏水氨基酸的出現(xiàn)頻次*相關(guān)權(quán)重并加和,得到了一個(gè)脂肪系數(shù)。脂肪系數(shù)越高,蛋白相對(duì)越穩(wěn)定。
總平均親水性:用于衡量目的蛋白的總體平均親水性。通過將親水氨基酸賦正值,將疏水氨基酸賦負(fù)值,加和后除以氨基酸數(shù)目,得到總體的平均親疏水性。數(shù)值越大,親水性越強(qiáng)。實(shí)際上,對(duì)于多結(jié)構(gòu)域蛋白此數(shù)值意義不是很大,因?yàn)榈鞍追肿又屑扔惺杷Y(jié)構(gòu)域,也有親水結(jié)構(gòu)域,兩者數(shù)值會(huì)相互抵消。GRAVY主要是結(jié)合局部親疏水性打分,獲得如下圖所示親疏水性打分圖,可以用來預(yù)測(cè)跨膜區(qū)(跨膜區(qū)相對(duì)于總體序列高度疏水,峰圖中間橫線就是代表總平均親水性)。
好了,內(nèi)容就到這里。第一次寫推文,可能有點(diǎn)過于詳細(xì)和啰嗦,大家多提點(diǎn)意見,以后小師弟我多多改進(jìn)。