ALISE: Docking + MD + FEP 自動(dòng)化工作流程

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?


導(dǎo)讀

自動(dòng)化配體搜索器 ALISE 運(yùn)用三階段工作流程,高效地篩選出 HIV 蛋白酶的活性配體。

  • : 第二階段,進(jìn)一步評(píng)估配體穩(wěn)定性。
  • ? 自用能微擾: 第三階段,準(zhǔn)確計(jì)算配體與受體的結(jié)合自由能。

今天給大家介紹一篇 2023 年發(fā)表在 Journal of Chemical Information and Modeling 上的文章, 標(biāo)題為:《Introducing the Automated Ligand Searcher》。

ALISE 是一種自動(dòng)化的計(jì)算藥物發(fā)現(xiàn)工具,旨在模擬配體與受體的結(jié)合自由能。它的工作流程分為三個(gè)階段:首先進(jìn)行分子對(duì)接,快速篩選潛在配體;其次是分子動(dòng)力學(xué),用于評(píng)估配體的穩(wěn)定性;最后是自用能微擾方法,準(zhǔn)確計(jì)算配體與受體的結(jié)合自由能。每個(gè)階段都會(huì)淘汰表現(xiàn)不佳的配體,縮小潛在配體的范圍。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

方法

ALISE 在三個(gè)階段采用越來(lái)越復(fù)雜的建模方法:分子對(duì)接、分子動(dòng)力學(xué)(MD)和自能微擾(FEP)。這種系統(tǒng)方法通過(guò)逐步篩選掉不那么有前途的候選物,確保了計(jì)算資源的有效使用。

第一階段:分子對(duì)接

  • 目標(biāo):確定配體與受體的最佳結(jié)合構(gòu)象。
  • 過(guò)程:利用像 VinaMPI 這樣的軟件在服務(wù)器上執(zhí)行此任務(wù)。
  • 關(guān)鍵組成
    • 搜索算法:在構(gòu)象空間內(nèi)搜索配體。
    • 評(píng)分函數(shù):基于自由能估算對(duì)配置進(jìn)行排名。
  • 結(jié)果:識(shí)別最佳結(jié)合構(gòu)象及相應(yīng)的對(duì)接得分。

第二階段:分子動(dòng)力學(xué)

  • 目標(biāo):提供配體-受體結(jié)合的詳情和現(xiàn)實(shí)描述。
  • 方法論:涉及平衡全原子 MD 模擬。
  • 關(guān)鍵方面
    • 力場(chǎng):源自實(shí)驗(yàn)和量子力學(xué)(QM)研究。
    • 能量計(jì)算:使用分子力學(xué)-廣義 Born 和表面積連續(xù)溶劑化方法。
    • 熵計(jì)算:采用準(zhǔn)諧分析進(jìn)行詳細(xì)熵估算。

第三階段:自用能微擾

  • 目標(biāo):估算最有前途的配體的結(jié)合自由能。
  • 過(guò)程:模擬配體的結(jié)合與非結(jié)合形式之間的多個(gè)狀態(tài)。
  • 關(guān)鍵特征
    • Lambda 參數(shù):定義從結(jié)合狀態(tài)到非結(jié)合狀態(tài)的漸變轉(zhuǎn)換。
    • 能量計(jì)算:通過(guò)對(duì)每個(gè)狀態(tài)間所有能量差異求和來(lái)計(jì)算總自由能變化。

ALISE 的價(jià)值

  1. 高效資源利用:通過(guò)在每個(gè)階段篩選配體,ALISE 確保只有最有前途的候選物進(jìn)入下一階段,節(jié)省了計(jì)算時(shí)間和資源。
  2. 提高精確度:ALISE 的每個(gè)階段都提供了對(duì)配體-受體相互作用詳細(xì)情況。
  3. 全面分析:從分子對(duì)接到 FEP,ALISE 提供了潛在藥物和靶標(biāo)互動(dòng)的全面視角。

使用

VIKING16 開(kāi)發(fā)的 ALISE 軟件極大地簡(jiǎn)化了藥物虛擬篩選流程。

  • 目標(biāo)受體:用戶可以上傳受體的分子結(jié)構(gòu)文件,或者提供 Protein Data Bank ID 以自動(dòng)在數(shù)據(jù)庫(kù)中檢索。
  • li>
  • 搜索空間:用戶可以手動(dòng)設(shè)定,或利用 AutoLigand 軟件自動(dòng)確定。

使用 ALISE 軟件時(shí),用戶首先設(shè)定目標(biāo)受體。接下來(lái),選擇配體,用戶可以上傳配體的分子結(jié)構(gòu)文件,或利用 PubChem 數(shù)據(jù)庫(kù)進(jìn)行化學(xué)相似性搜索。系統(tǒng)通過(guò) Tanimoto 評(píng)分評(píng)估化學(xué)相似性,并可進(jìn)行潛在毒性篩選。最后,用戶設(shè)定搜索空間的尺寸和位置,可以手動(dòng)操作,或讓 ALISE 軟件通過(guò) AutoLigand 自動(dòng)完成。

用戶完成初步設(shè)置后,將進(jìn)入總結(jié)頁(yè)面,可檢查和調(diào)整包括三個(gè)虛擬篩選階段的所有設(shè)置。專家用戶可以調(diào)整對(duì)接窮盡性和模擬參數(shù)等設(shè)置。在 VIKING 平臺(tái)上,用戶從任務(wù)總結(jié)頁(yè)面啟動(dòng)藥物分子搜索。平臺(tái)自動(dòng)處理步驟間的過(guò)渡,用戶可以監(jiān)控實(shí)驗(yàn)進(jìn)度,并訪問(wèn)中間結(jié)果和文件。

對(duì)于從對(duì)接階段獲得的最佳配體,ALISE 自動(dòng)生成一組 MM 力場(chǎng)參數(shù),并基于確定的結(jié)合姿勢(shì)啟動(dòng) MD 模擬。MD 和 FEP 階段的模擬文件通過(guò) VMD 中的 psfgen 插件準(zhǔn)備,模擬使用 NAMD 執(zhí)行。MD 模擬完成后,將計(jì)算每個(gè)模擬系統(tǒng)的自由能貢獻(xiàn),并在結(jié)果頁(yè)面提供自由能貢獻(xiàn)的差異和總結(jié)。FEP 模擬從 MD 階段獲得的最佳配體的最后配置開(kāi)始,使用顯式溶劑模型進(jìn)行。在所有模擬中,蛋白質(zhì)、溶劑和離子均由 Chemistry at Harvard Macromolecular Mechanics 力場(chǎng)建模。

圖表二:FEP 循環(huán)示意圖

圖示展現(xiàn)計(jì)算受體(大形狀)與配體(小形狀)間結(jié)合自由能 ΔG0 的 FEP 循環(huán)。配體上虛線框標(biāo)示約束。配體實(shí)心黑色時(shí),與環(huán)境相互作用,條紋圖案則表配體不與環(huán)境互動(dòng)。FEP 計(jì)算沿箭頭方向執(zhí)行正向擾動(dòng)。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖表三:ALISE 用戶界面

  • (A, B) 可從在線數(shù)據(jù)庫(kù)上傳或獲取受體和配體分子結(jié)構(gòu)。
  • (C) 對(duì)接階段搜索空間可手動(dòng)或根據(jù) AutoLigand 軟件自動(dòng)定義。
  • (D) 摘要頁(yè)面顯示并允許修改虛擬篩選期間對(duì)接和模擬設(shè)置。
  • (E) 點(diǎn)擊“運(yùn)行任務(wù)”后,在概覽頁(yè)面監(jiān)控任務(wù)當(dāng)前狀態(tài)。
  • (F) 每階段結(jié)束后,結(jié)果頁(yè)面提供按結(jié)合自由能排名的配體列表和模擬結(jié)合模式圖示。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖表四:ALISE 執(zhí)行的自動(dòng)化工作流程

可選步驟和必需步驟分別用黃色和藍(lán)色框表示,綠色框顯示各階段后的結(jié)果。結(jié)果在結(jié)果頁(yè)面顯示,見(jiàn)圖表三步驟 F。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖表五:ALISE 在三個(gè)計(jì)算階段發(fā)現(xiàn)活性配體與隨機(jī)選擇的比較

橫軸表示全部配體(活性和誘餌)進(jìn)度百分比,縱軸顯示該部分中發(fā)現(xiàn)的活性配體百分比(第一行)。第二行縱軸顯示兩曲線差異。ALISE 排名(紅線)高于隨機(jī)選擇(藍(lán)線)意味各階段表現(xiàn)更佳。

  • (A) 對(duì)接階段 ALISE 排序(紅線)始終超過(guò)隨機(jī)選擇(藍(lán)線),成功對(duì)接 1395 個(gè)活性配體(最后一點(diǎn))?;疑珔^(qū)域代表進(jìn)入 MD 階段的 100 個(gè)配體。
  • (B) MD 階段,ALISE 在發(fā)現(xiàn)活性配體方面效率高于隨機(jī)選擇?;疑珔^(qū)域代表進(jìn)入 FEP 階段的 15 個(gè)配體。
  • (C) FEP 階段提升 MD 階段結(jié)果,ALISE 排名活性配體優(yōu)于隨機(jī)選擇。
  • (D-F) 展示 ALISE 性能與隨機(jī)選擇方法差異。積分 I(灰色區(qū)域)是 ALISE 優(yōu)于隨機(jī)選擇的指標(biāo)。正值表性能優(yōu)勢(shì)。對(duì)接階段值為 0.00235;MD 階段為 0.0931;FEP 階段為 0.15835。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖表六:最佳結(jié)合自由能估算配體

面板 A 和 B 展示 ALISE 框架獲得最佳結(jié)合自由能估算配體。A 顯示結(jié)合在蛋白質(zhì)結(jié)構(gòu)表面的配體,B 展現(xiàn)蛋白質(zhì)的二級(jí)結(jié)構(gòu)。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖表七:由 ALISE 發(fā)現(xiàn)的三個(gè)排名最高的抑制 HIV 蛋白酶的配體結(jié)構(gòu)

面板 A?C 展示 ALISE 發(fā)現(xiàn)的三個(gè)排名最高用于抑制 HIV 蛋白酶的配體結(jié)構(gòu)。這些結(jié)構(gòu)來(lái)源于 ChemSpider 網(wǎng)站。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

討論 ALISE 算法在 HIV 蛋白酶篩選中的效果

ALISE 算法在篩選 HIV 蛋白酶方面表現(xiàn)卓越,其性能優(yōu)于隨機(jī)選擇方法。

HIV 蛋白酶是近年來(lái)人類醫(yī)學(xué)的一個(gè)關(guān)注焦點(diǎn),由于 HIV 的藥物耐受性,研究者們面臨著挑戰(zhàn)。尋找能結(jié)合到蛋白酶并阻礙 HIV 復(fù)制的活性配體成為一項(xiàng)關(guān)鍵任務(wù)。在這個(gè)過(guò)程中,對(duì)接算法的運(yùn)用至關(guān)重要。

DUD-E 數(shù)據(jù)庫(kù)是評(píng)估對(duì)接算法性能的一個(gè)可靠基準(zhǔn)庫(kù),其中包含活性配體和作為對(duì)照組的非活性配體。通過(guò)使用 DUD-E 數(shù)據(jù)庫(kù)的數(shù)據(jù)集,研究者可以評(píng)估對(duì)接算法在識(shí)別活性配體方面的有效性。

研究者利用 DUD-E 數(shù)據(jù)庫(kù)中的 HIV1 蛋白酶數(shù)據(jù)集,對(duì) ALISE 程序的性能進(jìn)行了基準(zhǔn)測(cè)試,以確定該程序在識(shí)別蛋白酶的活性配體方面是否優(yōu)于隨機(jī)選擇。此外,還比較并討論了三個(gè)不同的步驟:對(duì)接、分子動(dòng)力學(xué)(MD)和自用能微擾(FEP)。

在每個(gè)步驟中,ALISE 均生成了基于評(píng)分的配體排序列表,得分最高的配體進(jìn)入下一步驟。無(wú)法對(duì)接或模擬的配體則排名最低。ALISE 在每個(gè)步驟的性能均經(jīng)過(guò)評(píng)估,并與數(shù)據(jù)集中隨機(jī)選擇的配體進(jìn)行了比較。

ALISE 在對(duì)接步驟中表現(xiàn)出顯著的優(yōu)勢(shì)。然而,在 MD 和 FEP 步驟中,這種優(yōu)勢(shì)較為微妙。整個(gè) ALISE 工作流程在每個(gè)步驟都顯示出與隨機(jī)選擇配體相比的量化優(yōu)勢(shì)。研究者詳細(xì)討論了每個(gè)步驟:在對(duì)接步驟中,成功對(duì)接了 16,329 個(gè)配體,包括所有 1395 個(gè)活性配體。MD 步驟中有 39 個(gè)模擬失敗,包括三個(gè)活性配體。在 FEP 步驟中,與隨機(jī)選擇相比,更迅速地發(fā)現(xiàn)了活性配體。

總的來(lái)說(shuō),ALISE 在整個(gè)工作流程的最后階段生成了有序列表,并在 VIKING 可視化框架中呈現(xiàn)了相應(yīng)的受體-配體復(fù)合物。在這一階段,測(cè)試的 3.90%配體為活性配體,而最終階段測(cè)試的 40.00%配體為活性配體。所有計(jì)算均在單節(jié)點(diǎn)上進(jìn)行,該節(jié)點(diǎn)配備 48 個(gè) CPU,頻率為 2.9 GHz。選擇 100 個(gè)配體進(jìn)入 MD 步驟,15 個(gè)配體進(jìn)入 FEP 步驟,確保所有工作在兩周內(nèi)在可用資源上完成。對(duì)接步驟平均每個(gè)對(duì)接位置耗時(shí) 0.5 秒。MD 和 FEP 步驟的性能分別為 2.08 和 4.01 小時(shí)/納秒。

通過(guò) ALISE 實(shí)現(xiàn)的工作流程將結(jié)合到 HIV 蛋白酶的假定配體數(shù)量從 35,750 減少到僅 15 個(gè)。下一環(huán)節(jié)節(jié)將對(duì) FEP 步驟中排名最高的三個(gè)

配體進(jìn)行更詳細(xì)的檢查。

缺點(diǎn):

  • 方法限制
    • 研究可能未充分討論每個(gè)計(jì)算階段的限制,特別是關(guān)于分子對(duì)接和自由能計(jì)算的準(zhǔn)確性。
    • 基準(zhǔn)測(cè)試案例研究雖相關(guān),但可能不足以展示該工具在廣泛應(yīng)用范圍內(nèi)的有效性。
  • 數(shù)據(jù)和結(jié)果解釋
    • 研究可能未能清楚地說(shuō)明數(shù)據(jù)的處理和分析方法,導(dǎo)致結(jié)果可能被誤解或誤讀。
    • 在配體選擇過(guò)程中對(duì)假陽(yáng)性或假陰性的批判性討論可能不足。

改進(jìn)建議

  • 增強(qiáng)方法論描述
    • 提供更詳細(xì)的計(jì)算方法說(shuō)明,特別是針對(duì)每個(gè)階段的限制和潛在錯(cuò)誤源。
    • 包括使用不同目標(biāo)蛋白或配體集的額外案例研究,以展示該工具的普適性。
  • 擴(kuò)展數(shù)據(jù)分析
    • 包括更全面的數(shù)據(jù)分析,特別是關(guān)注假陽(yáng)性和假陰性的處理。
    • 實(shí)施對(duì)基準(zhǔn)測(cè)試過(guò)程及其對(duì)工具有效性影響的更詳細(xì)討論。

參考資料:
  • Jacobsen, L., Hungerland, J., Ba?i?, V., Gerhards, L., Schuhmann, F., & Solov’yov, I. A. (2023). Introducing the Automated Ligand Searcher. Journal of Chemical Information and Modeling. https://doi.org/10.1021/acs.jcim.3c01317

  • PDF Download: https://is.gd/CB9k56


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容