三維蛋白結(jié)構(gòu)預(yù)測(cè)之RoseTTAFold

雖然我是生信人員,但是我研究生階段做的內(nèi)容跟蛋白結(jié)晶有關(guān),蛋白的三維結(jié)構(gòu)非常重要,只可惜當(dāng)時(shí)的我能力有限,僅僅是用swissmodel模擬一下就算了,下面的圖是我當(dāng)年碩士畢業(yè)發(fā)表文章的分析結(jié)果, 但不得不承認(rèn),當(dāng)時(shí)的課題草草了之,現(xiàn)在看來,甚為遺憾,不過今日,是時(shí)候回歸了。

圖片.png

去年,DeepMind公司開發(fā)的AlphaFold2人工智能系統(tǒng),基于氨基酸序列,精確預(yù)測(cè)了蛋白質(zhì)的3D結(jié)構(gòu)。它的準(zhǔn)確性與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學(xué)等實(shí)驗(yàn)技術(shù)解析的3D結(jié)構(gòu)相媲美。這一突破被譽(yù)為“變革生命科學(xué)和生物醫(yī)學(xué)”的突破。

幾天前,DeepMind公司在《自然》雜志上發(fā)表論文,公開了進(jìn)一步優(yōu)化的AlphaFold2人工智能系統(tǒng)的源代碼并且詳細(xì)描述了它的設(shè)計(jì)框架和訓(xùn)練方法。同日,華盛頓大學(xué)(University of Washington)蛋白設(shè)計(jì)研究所David Baker教授課題組在《科學(xué)》雜志上發(fā)表論文,公布了其開源人工智能系統(tǒng)RoseTTAFold的研究結(jié)果。《自然》上發(fā)表的評(píng)論指出,這些論文和人工智能系統(tǒng)資源的發(fā)布,不但讓基于DeepMind開發(fā)的AI系統(tǒng)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的技術(shù)能夠?yàn)閺V大科學(xué)家和研究人員使用,而且有望進(jìn)一步激發(fā)這一領(lǐng)域的進(jìn)展。

蛋白質(zhì)對(duì)生命來說不可或缺,它們支持生物體的幾乎所有功能。這些復(fù)雜的大分子由氨基酸鏈構(gòu)成,而蛋白質(zhì)的功能很大程度上決定于它的3D結(jié)構(gòu)。生物醫(yī)學(xué)領(lǐng)域的眾多挑戰(zhàn),包括開發(fā)治療疾病的創(chuàng)新療法,依賴于對(duì)蛋白質(zhì)結(jié)構(gòu)和功能的理解。

在過去的五十年中,科學(xué)家們已經(jīng)能夠利用冷凍電子顯微鏡、核磁共振或 X 射線晶體學(xué)等實(shí)驗(yàn)手段在實(shí)驗(yàn)室中確定蛋白質(zhì)的形狀,但每種方法都依賴于大量的試錯(cuò),耗時(shí)耗力,可能需要花上好幾年時(shí)間。1972年,諾貝爾化學(xué)獎(jiǎng)得主Christian Anfinsen博士表示,理論上,蛋白質(zhì)的氨基酸序列應(yīng)該能夠完全決定它的3D結(jié)構(gòu)。這一假說激發(fā)了50年來基于氨基酸序列,通過計(jì)算方法預(yù)測(cè)蛋白質(zhì)3D結(jié)構(gòu)的探索。

在2018年,DeepMind開發(fā)的AlphaFold人工智能系統(tǒng)首次在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)上亮相。而在去年的CASP上,DeepMind的AlphaFold2系統(tǒng)表現(xiàn)驚艷,在接受檢驗(yàn)的近100個(gè)蛋白靶點(diǎn)中,AlphaFold2對(duì)三分之二的蛋白靶點(diǎn)給出的預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)手段獲得的結(jié)構(gòu)相差無幾。有些情況下,已經(jīng)無法區(qū)分兩者之間的區(qū)別是由于AlphaFold2的預(yù)測(cè)出現(xiàn)錯(cuò)誤,還是實(shí)驗(yàn)手段產(chǎn)生的假象。

image

AlphaFold2根據(jù)氨基酸序列預(yù)測(cè)的蛋白結(jié)構(gòu)與實(shí)驗(yàn)手段解析的結(jié)果幾乎完全重合(綠色,實(shí)驗(yàn)結(jié)果;藍(lán)色,計(jì)算預(yù)測(cè)結(jié)果)

DeepMind發(fā)布的更新版AlphaFold2在去年的系統(tǒng)基礎(chǔ)上進(jìn)行了優(yōu)化,在解析蛋白結(jié)構(gòu)的速度上有了進(jìn)一步的提高。主要開發(fā)人員John Jumper博士說,這一系統(tǒng)的處理速度快了大約16倍。根據(jù)蛋白的大小,它可以在幾分鐘到幾小時(shí)內(nèi)生成準(zhǔn)確的蛋白結(jié)構(gòu)。

image

AlphaFold2系統(tǒng)去年在CASP上的出色表現(xiàn)促進(jìn)了蛋白質(zhì)3D結(jié)構(gòu)預(yù)測(cè)領(lǐng)域其它團(tuán)隊(duì)的進(jìn)步。華盛頓大學(xué)蛋白設(shè)計(jì)研究所David Baker教授的團(tuán)隊(duì)從AlphaFold2的設(shè)計(jì)思路中獲得啟發(fā),構(gòu)建了名為RoseTTAFold的軟件系統(tǒng)。它的神經(jīng)網(wǎng)絡(luò)能夠同時(shí)考慮蛋白序列的模式,蛋白中不同氨基酸之間的相互作用,以及蛋白質(zhì)可能出現(xiàn)的3D結(jié)構(gòu)。在這個(gè)系統(tǒng)中,一維、二維和三維的信息能夠相互交流,讓神經(jīng)網(wǎng)絡(luò)綜合所有信息,決定蛋白質(zhì)的化學(xué)組成部分和它折疊產(chǎn)生的結(jié)構(gòu)之間的關(guān)系。

image

研究人員表示,RoseTTAFold系統(tǒng)在解析蛋白質(zhì)3D結(jié)構(gòu)方面的表現(xiàn),與AlphaFold2的水平幾乎相當(dāng),在有些蛋白上甚至優(yōu)于AlphaFold2。

圖片.png

在論文中,研究人員指出,這一工具還可以用于預(yù)測(cè)由兩個(gè)或者多個(gè)蛋白構(gòu)成的復(fù)合體的構(gòu)象。這讓研究人員可以直接從蛋白序列,推測(cè)出不同蛋白相互結(jié)合的結(jié)構(gòu)模型。在論文中,研究人員利用IL-12和IL-12受體(IL-12R)的序列預(yù)測(cè)的IL-12/IL-12R復(fù)合體結(jié)構(gòu)與此前用冷凍電子顯微鏡解析的結(jié)構(gòu)非常類似。

image

Baker教授的團(tuán)隊(duì)已經(jīng)將RoseTTAFold軟件工具上傳到GitHub網(wǎng)站上,7月份以來,它已經(jīng)被世界上超過140個(gè)不同研究團(tuán)隊(duì)下載。

圖片.png

同時(shí),該團(tuán)隊(duì)也搭建了服務(wù)器,讓研究人員可以輸入蛋白質(zhì)序列,然后獲得預(yù)測(cè)的蛋白結(jié)構(gòu)。服務(wù)器在上個(gè)月啟動(dòng)后,已經(jīng)幫助解析了大約500名用戶遞交的超過5000個(gè)蛋白結(jié)構(gòu)。“我很高興科學(xué)界已經(jīng)在利用RoseTTAFold服務(wù)器來解決重要的生物學(xué)問題?!?David Baker教授說。

我們希望這一新工具將繼續(xù)為整個(gè)研發(fā)團(tuán)體造福?!闭撐牡牡谝蛔髡?,Baker教授課題組的博士后Minkyung Baek說。

《自然》發(fā)表的新聞評(píng)論指出,隨著RoseTTAFold和AlphaFold2源代碼的公布,研究人員可以在兩者的基礎(chǔ)上繼續(xù)前進(jìn),有望對(duì)人工智能系統(tǒng)做出進(jìn)一步改進(jìn),攻克目前人工智能系統(tǒng)尚且無法確定構(gòu)象的蛋白,以及使用這些軟件設(shè)計(jì)全新的蛋白。

我們期待這一天的早日到來。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過簡(jiǎn)信或評(píng)論聯(lián)系作者。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容