2022-12-01

Nat Methods | AlphaFill:配體和輔助因子加強(qiáng)AlphaFold模型

原創(chuàng)?風(fēng)不止步?圖靈基因?2022-12-01 09:19?發(fā)表于江蘇

收錄于合集#前沿生物大數(shù)據(jù)分析


撰文:風(fēng)不止步

IF=47.99

推薦度:?????

亮點(diǎn):

文章提出了AlphaFill,一種利用序列和結(jié)構(gòu)的相似性將“缺失”的小分子和離子從實(shí)驗(yàn)確定的結(jié)構(gòu)中“移植”到預(yù)測的蛋白質(zhì)模型中的算法。該算法針對實(shí)驗(yàn)結(jié)構(gòu)成功地進(jìn)行了驗(yàn)證。

2022年11月24日,荷蘭癌癥研究所的Robbie P. Joosten博士等人在《?Nature Methods》上發(fā)表了一篇“AlphaFill: enriching AlphaFold models with ligands and cofactors”的文章,文章通過“移植”在同源蛋白質(zhì)結(jié)構(gòu)中觀察到的小分子和離子來豐富AlphaFold數(shù)據(jù)庫中的模型。提出的AlphaFill程序已經(jīng)針對實(shí)驗(yàn)結(jié)構(gòu)進(jìn)行了驗(yàn)證,并應(yīng)用于所有AlphaFold模型,以創(chuàng)建一個(gè)新的資源,即AlphaFill數(shù)據(jù)庫,旨在幫助生命科學(xué)家輕松產(chǎn)生新的蛋白質(zhì)功能假設(shè),并制定相關(guān)的研究問題。

幾十年來,僅根據(jù)蛋白質(zhì)的氨基酸序列來預(yù)測其三維(3D)結(jié)構(gòu)一直是一個(gè)重大的科學(xué)挑戰(zhàn)。最近,人工智能方法,如AlphaFold和RoseTTAfold方法所實(shí)現(xiàn)的,已經(jīng)使蛋白質(zhì)結(jié)構(gòu)預(yù)測變得可靠。這兩種方法都能以令人印象深刻的準(zhǔn)確度預(yù)測結(jié)構(gòu)域,但蛋白質(zhì)的靈活部分(如環(huán)路或內(nèi)在無序區(qū))的預(yù)測準(zhǔn)確度和置信度較低。對48種不同生物體的蛋白質(zhì)組的預(yù)測,以及所有SWISS-PROT的預(yù)測,在AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中已經(jīng)公開。這些預(yù)測的模型已經(jīng)提供了關(guān)于蛋白質(zhì)功能的寶貴的新的生物學(xué)見解。

許多蛋白質(zhì)在自然界中沒有它們的輔助因子就不會(huì)出現(xiàn):肌紅蛋白或血紅蛋白需要血紅素才能折疊;鋅指結(jié)構(gòu)域沒有鋅離子就不穩(wěn)定,許多蛋白質(zhì)只能以同型或異型多聚體的形式存在。AlphaFoldMultimer和RoseTTAFold的開發(fā)解決了多聚體的問題,它們可以預(yù)測復(fù)雜的蛋白質(zhì)組合。然而,預(yù)測的結(jié)構(gòu)模型只考慮了20個(gè)典型的氨基酸殘基,并沒有預(yù)測通常與蛋白質(zhì)相關(guān)的小分子、配體和輔助因子的坐標(biāo)。

分析蛋白質(zhì)與輔助因子、配體和離子的接觸,有助于了解蛋白質(zhì)的功能和結(jié)構(gòu)完整性。它們也有助于設(shè)計(jì)下游的實(shí)驗(yàn),無論是在計(jì)算上還是在實(shí)驗(yàn)室。到目前為止,AlphaFold數(shù)據(jù)庫不包括這些化合物,但認(rèn)識到這一需求,因?yàn)槊總€(gè)預(yù)測模型都通過PDB-知識庫提供實(shí)驗(yàn)結(jié)構(gòu)的鏈接。文章提出了AlphaFill算法,以創(chuàng)建一個(gè)進(jìn)一步的資源:不限制“移植”到完全相同的蛋白質(zhì)上,而是將其擴(kuò)展到這個(gè)模型的同源物。

目前的AlphaFill數(shù)據(jù)庫包含了2,694個(gè)不同配體的移植,而PDB中的配體超過了30,000個(gè)。這些配體代表了最常見的配體以及CoFactor數(shù)據(jù)庫中的所有輔助因子,并涵蓋了PDB中配體累計(jì)出現(xiàn)次數(shù)的95%左右。注意到AlphaFill軟件是免費(fèi)提供的(在BSD許可下),它允許用戶“提交”任何結(jié)構(gòu)模型進(jìn)行評估,也有可能考慮PDB中所有>30,000個(gè)非聚合物配體。一個(gè)API允許用戶上傳和“填充”他們自己的模型或AlphaFold數(shù)據(jù)庫中的額外結(jié)構(gòu),也提供了訪問PDB中額外非聚合物化合物的機(jī)會(huì)。目前AlphaFill并不處理聚合物配體,如肽、核酸或糖類。它也不處理翻譯后修飾,特別是糖基化。其他的翻譯后修飾,如磷酸化,經(jīng)常會(huì)引起構(gòu)象變化,AlphaFill也同樣沒有處理。

圖1:AlphaFill算法的驗(yàn)證。

AlphaFill算法中的一個(gè)重要決策參數(shù)是最小序列同一性閾值,以允許將信息從實(shí)驗(yàn)結(jié)構(gòu)轉(zhuǎn)移到AlphaFold模型中。將所有顯示出25%以上序列同一性的實(shí)驗(yàn)結(jié)構(gòu)與AlphaFold模型進(jìn)行疊加,這些模型的排列長度至少為85個(gè)氨基酸。這個(gè)閾值接近于結(jié)構(gòu)同源性的最小序列一致性要求。根據(jù)在同源性約束和基于同源性的實(shí)驗(yàn)結(jié)構(gòu)注釋方面的經(jīng)驗(yàn),對于局部殘基相互作用等結(jié)構(gòu)細(xì)節(jié)來說,接近70%的閾值要可靠得多;這個(gè)閾值也反映在驗(yàn)證分析中(圖1c)。為了讓用戶探索各種可能性,在網(wǎng)絡(luò)界面中引入了一個(gè)選擇器,可以在每個(gè)結(jié)構(gòu)的基礎(chǔ)上將顯示內(nèi)容設(shè)置為所需的特征水平。

對AlphaFill模型與實(shí)驗(yàn)結(jié)構(gòu)100%的一致性進(jìn)行驗(yàn)證,表明局部r.m.s.d.和TCS是衡量移植可靠性的良好指標(biāo)。根據(jù)這兩個(gè)標(biāo)準(zhǔn)的統(tǒng)計(jì)分布,使用清晰的顏色編碼,以引起用戶對潛在錯(cuò)誤移植的注意,表明中等和低置信度的移植。為用戶提供了運(yùn)行即時(shí)的能量最小化,以優(yōu)化感興趣的特定復(fù)合體。用戶將檢查選擇,進(jìn)行選擇,然后優(yōu)化并下載與他們的研究最相關(guān)的優(yōu)化結(jié)構(gòu)。

圖2:AlphaFill有助于理解Abl激酶AlphaFold模型的激活狀態(tài)。

全局r.m.s.d.不是移植質(zhì)量的一個(gè)很好的指標(biāo),但對于感受供體和受體結(jié)構(gòu)之間的相似性是很有用的:一個(gè)全局r.m.s.d.較低但身份相同或相似的結(jié)構(gòu),表示有相似的構(gòu)象。這在激酶的例子中得到了反映(圖2)。對于多結(jié)構(gòu)域的蛋白質(zhì),序列比對可以跨越所有的結(jié)構(gòu)域,但是每個(gè)結(jié)構(gòu)域的相對位置可能在實(shí)驗(yàn)結(jié)構(gòu)和模型中是不同的。在這種情況下,由于結(jié)構(gòu)域的相對位置不同,結(jié)構(gòu)比對可能會(huì)夸大全局r.m.s.d.值。在鋅指蛋白的鋅轉(zhuǎn)移中觀察到了這一點(diǎn)(圖3c)。

圖3:移植的鋅離子(紫色球體)的例子。

AlphaFill結(jié)構(gòu)模型并不意味著是準(zhǔn)確的、精確的或完整的代表某種蛋白質(zhì)結(jié)構(gòu)的全部配體。它們是作為非專業(yè)人員的工具,幫助探索常見配體的復(fù)合體。結(jié)構(gòu)生物學(xué)或結(jié)構(gòu)生物信息學(xué)專家會(huì)發(fā)現(xiàn),選擇、疊加和“移植”一個(gè)功能或結(jié)構(gòu)輔助因子或離子,并將這些信息通過分子動(dòng)力學(xué)模擬和誘變研究加以驗(yàn)證,或者根據(jù)新的生物化學(xué)或生物物理學(xué)見解來討論一個(gè)模型的結(jié)構(gòu)。

除了使用幾個(gè)優(yōu)化的和穩(wěn)健的默認(rèn)值外,AlphaFill軟件的設(shè)計(jì)是靈活的,因此使用的設(shè)置和截止點(diǎn)可以很容易地根據(jù)任何用戶自己的目的進(jìn)行調(diào)整。根據(jù)定義,AlphaFill依賴于高質(zhì)量的結(jié)構(gòu)同源物作為轉(zhuǎn)移配體的第一和主要標(biāo)準(zhǔn)。然而,正如DALI3和PDBeFold所顯示的那樣,某些結(jié)構(gòu)域可以在廣泛的序列相似性的背景下出現(xiàn)。因此,AlphaFill可以通過基于深度學(xué)習(xí)概念的基于結(jié)構(gòu)的轉(zhuǎn)移算法來補(bǔ)充,類似于用于AlphaFold結(jié)構(gòu)預(yù)測革命的算法。

教授介紹

Robbie P. Joosten博士

研究重點(diǎn)是開發(fā)新的計(jì)算方法來驗(yàn)證和提高大分子結(jié)構(gòu)模型的質(zhì)量。在PDB-REDO項(xiàng)目(pdb-redo.eu)中,從晶體衍射實(shí)驗(yàn)中獲取實(shí)驗(yàn)數(shù)據(jù)和初始模型,并改善與數(shù)據(jù)的擬合,消除模型誤差。這種方法為下游研究提供高質(zhì)量的結(jié)構(gòu)模型,如藥物(鉛)的發(fā)現(xiàn)和蛋白質(zhì)的結(jié)構(gòu)功能分析。


參考文獻(xiàn)

Maarten L. Hekkelman, Ida de Vries et al.AlphaFill: enriching AlphaFold models with ligands and cofactors.(2022)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容