RF Diffusion
是由華盛頓大學(xué)等機(jī)構(gòu)開發(fā)的蛋白質(zhì)結(jié)構(gòu)生成模型,結(jié)合了 RoseTTAFold 的結(jié)構(gòu)預(yù)測能力與擴(kuò)散模型的生成能力,能夠在多種設(shè)計(jì)任務(wù)中表現(xiàn)出色。其核心創(chuàng)新在于將蛋白質(zhì)結(jié)構(gòu)預(yù)測模型與擴(kuò)散模型相結(jié)合,通過對三維結(jié)構(gòu)坐標(biāo)進(jìn)行局部擾動和去噪,學(xué)習(xí)蛋白質(zhì)序列與結(jié)構(gòu)之間的復(fù)雜關(guān)系。該模型支持多種輸入條件,如部分序列、折疊信息或固定的功能基序,提供了靈活的設(shè)計(jì)控制能力。在多項(xiàng)實(shí)驗(yàn)驗(yàn)證中,RFdiffusion 展示了其強(qiáng)大的蛋白質(zhì)設(shè)計(jì)能力,包括生成多樣且準(zhǔn)確的蛋白質(zhì)結(jié)構(gòu)、設(shè)計(jì)高親和力的結(jié)合劑以及構(gòu)建對稱的低聚物結(jié)構(gòu)等。
例子:

這張圖是一個RFdiffusion 無條件單體結(jié)構(gòu)設(shè)計(jì)的示意圖,展示了通過擴(kuò)散模型生成的一個全新蛋白質(zhì)單體結(jié)構(gòu),配以結(jié)構(gòu)域、二級結(jié)構(gòu)和功能注釋的可視化效果。
1.三維蛋白結(jié)構(gòu)骨架
整體呈帶有彎曲和折疊的帶狀結(jié)構(gòu),是模型生成的蛋白主鏈(主干結(jié)構(gòu))。
藍(lán)色α-螺旋(alpha helix)
綠色β-折疊(beta sheet)
橙色無規(guī)卷曲(loop/random coil)
2.結(jié)構(gòu)域(Domains)
蛋白被劃分為不同結(jié)構(gòu)域(如N端與C端之間的兩個穩(wěn)定折疊單元),用淺色陰影區(qū)分結(jié)構(gòu)模塊。
每個結(jié)構(gòu)域通常代表特定的功能或折疊單元,生成時也可用于模仿天然蛋白模塊化。
3.Motif 注釋
在結(jié)構(gòu)中高亮顯示了特定的功能motif(短結(jié)構(gòu)段),可能是人工指定或模型自主生成的重要區(qū)域。
Motif 以紅色或紫色框出,代表如酶活性位點(diǎn)、受體結(jié)合片段、loop hotspot等。
4.結(jié)合位點(diǎn)標(biāo)注
圖中用星號或標(biāo)簽標(biāo)出可能的“配體結(jié)合口袋”或“蛋白-蛋白相互作用區(qū)域”。
通常由結(jié)構(gòu)模型打分(如Pocket finder工具)或模型的設(shè)計(jì)目標(biāo)指定。
以下是各個腳本的簡要介紹及其用途:
一、腳本用途概覽
1. install_rfdiffusion.sh
1)用途:自動配置 RFdiffusion 所需的軟件環(huán)境。
2)功能:
① 創(chuàng)建新的 Conda 環(huán)境(默認(rèn)名為 rfdiffusion)。
② 安裝所需的依賴包(如 PyTorch、Biopython、dm-haiku、scipy 等)。
③ 克隆并安裝 RFdiffusion 代碼倉庫。
④ 安裝 ProteinMPNN(如果需要)。
⑤ 下載或配置模型權(quán)重文件。
3)適用場景:首次部署 RFdiffusion 或在新的服務(wù)器或集群節(jié)點(diǎn)上重新安裝環(huán)境。

2. 依次運(yùn)行腳本
run_unconditional_monomer.sh
1)用途:從頭生成一個長度為 150 個氨基酸的蛋白質(zhì)單體結(jié)構(gòu),無需任何模板或輸入結(jié)構(gòu)。
2)適用場景:探索新型蛋白結(jié)構(gòu)或折疊多樣性。
run_binder_design.sh
1)用途:設(shè)計(jì)能與指定蛋白靶標(biāo)結(jié)合的新蛋白質(zhì)(結(jié)合劑)。支持設(shè)置熱點(diǎn)殘基。
2)適用場景:藥物設(shè)計(jì)或蛋白-蛋白相互作用界面的探索。
run_loop_remodeling.sh
1)用途:重塑已有蛋白結(jié)構(gòu)中某段 loop 區(qū)域(如界面 loop),以改善穩(wěn)定性或功能。
2)適用場景:對已有蛋白設(shè)計(jì)進(jìn)行局部優(yōu)化。
run_motif_scaffolding.sh
1)用途:將已知的關(guān)鍵結(jié)合位點(diǎn)(motif)嵌入到新蛋白結(jié)構(gòu)中,設(shè)計(jì)結(jié)構(gòu)支架(scaffold)。
2)適用場景:抗原表位設(shè)計(jì)、免疫設(shè)計(jì)等。
run_partial_diffusion.sh
1)用途:對已有結(jié)構(gòu)進(jìn)行部分去噪和擴(kuò)散處理,以生成具有多樣性的折疊結(jié)構(gòu)。
2)適用場景:蛋白變體探索、對結(jié)構(gòu)穩(wěn)定性進(jìn)行微調(diào)。
run_fold_conditioning.sh
1)用途:通過提供二級結(jié)構(gòu)和鄰接信息來進(jìn)行特定拓?fù)浣Y(jié)構(gòu)的蛋白設(shè)計(jì)。
2)適用場景:結(jié)構(gòu)引導(dǎo)的設(shè)計(jì)任務(wù),能結(jié)合用戶自定義的折疊模式。
run_symmetric_oligomer.sh
1)用途:設(shè)計(jì)具有對稱性的低聚物結(jié)構(gòu),如二聚體、四聚體等。
2)適用場景:材料科學(xué)、自組裝蛋白、病毒殼體設(shè)計(jì)等方向。

3. 或者一鍵運(yùn)行腳本:
run_all_rf_tasks.sh:依次執(zhí)行上述所有任務(wù)腳本。
1)功能:
自動依次運(yùn)行以下任務(wù):
① 無條件單體設(shè)計(jì)
② 結(jié)合劑設(shè)計(jì)
③ Loop 重建
④ Motif scaffold
⑤ Partial diffusion
⑥ Fold conditioning
⑦ Symmetric oligomer

二、運(yùn)行結(jié)果與后續(xù)分析

運(yùn)行完這些腳本,將獲得一系列蛋白質(zhì)結(jié)構(gòu)設(shè)計(jì)的結(jié)果文件,它們來自 RFdiffusion 不同任務(wù)模塊,形式一般是 PDB 文件(蛋白質(zhì)三維結(jié)構(gòu)),可用于后續(xù)的結(jié)構(gòu)評估、建模驗(yàn)證或功能分析。下面是每個任務(wù)對應(yīng)能得到的具體結(jié)果:

這些結(jié)果可用于:
1. 結(jié)構(gòu)可視化與篩選:
使用 PyMOL、Chimera、Mol* 等工具查看結(jié)構(gòu)是否合理、美觀、有創(chuàng)新。
2. 功能預(yù)測或模擬:
使用 AlphaFold 再預(yù)測結(jié)構(gòu)穩(wěn)定性。
使用 Rosetta 進(jìn)行能量打分。
使用 Docking 軟件模擬其結(jié)合位點(diǎn)。
3. 實(shí)驗(yàn)設(shè)計(jì)準(zhǔn)備:
如果具備實(shí)驗(yàn)平臺,可定向合成這些結(jié)構(gòu)進(jìn)行驗(yàn)證(如測序表達(dá)、CD 光譜、NMR、Cryo-EM 等)。
生物信息學(xué)領(lǐng)域非常廣泛,難以一次說盡。我們下次繼續(xù)更新,一起深入學(xué)習(xí)生物信息學(xué)的內(nèi)容!
喜歡的寶子們點(diǎn)個贊吧~碼字不易,且行且珍惜~