分子模擬大揭秘
分子模擬作為一門跨學(xué)科的技術(shù),已經(jīng)成為化學(xué)、生物學(xué)、物理學(xué)、材料科學(xué)以及藥物設(shè)計等領(lǐng)域不可或缺的工具。它通過計算機(jī)模擬提供了對分子行為的深入理解,從而揭示了分子結(jié)構(gòu)與功能之間的關(guān)系。
本文旨在介紹分子模擬的基本概念、方法和應(yīng)用,特別是針對藥物設(shè)計和生物大分子研究的重要性。
01 分子模擬的介紹
1.1 分子模擬的定義
分子模擬,顧名思義,是針對分子而進(jìn)行的一種模型操作,即根據(jù)分子圖形學(xué)原理,采用理論計算方法如量子力學(xué)、分子力學(xué)、分子動力學(xué)等在計算機(jī)上模擬或模仿分子行為的一門技術(shù)。
分子模擬技術(shù)賦予了我們洞察微觀世界的能力,它使我們能夠觀察和操作那些在傳統(tǒng)意義上無法直接觀察的化學(xué)小分子和生物大分子。
通過這項技術(shù),我們可以將分子結(jié)構(gòu)以三維形式可視化??,不僅能夠清晰地看到分子的形態(tài),還能通過交互式操作來移動分子、調(diào)整其尺寸、甚至進(jìn)行多角度旋轉(zhuǎn)。這種直觀的交互方式使得測量分子內(nèi)部的距離、鍵角和二面角變得輕而易舉。
1.2 分子模擬的形式
分子模擬主要有兩種形式,即靜態(tài)模擬(Molecular Modeling)和動態(tài)模擬(Molecular Simulation)。
靜態(tài)模擬只考慮分子中各原子的xyz三維坐標(biāo),即分子在某一時間點上的構(gòu)象,主要采用量子力學(xué)和分子力學(xué)進(jìn)行構(gòu)象優(yōu)化。
而動態(tài)模擬除xyz三維坐標(biāo)外,還加入了時間t作為第四維,因而可以考察分子在某一時間段內(nèi)的構(gòu)象變化情況,主要采用分子動力學(xué)來模擬生物分子體系的動態(tài)變化過程。
就像拍照和錄像一樣,靜態(tài)模擬就好比拍了一張照片,而動態(tài)模擬則好比拍了一段錄像。
目前,分子模擬已成為藥物分子設(shè)計中的基本工具。借助于分子模擬技術(shù),人們能方便地闡釋分子的真實結(jié)構(gòu)和構(gòu)象,對分子進(jìn)行構(gòu)象分析、量子化學(xué)、分子力學(xué)和分子動力學(xué)計算。
模擬生物大分子體系,模擬小分子-大分子之間、大分子-大分子之間的相互作用,進(jìn)行構(gòu)象搜尋、結(jié)構(gòu)搜尋、分子設(shè)計等。
02 分子表面的復(fù)雜性
2.1 分子表面的定義
分子表面是指分子的外部邊界,它定義了分子的三維形狀。Lee和Richards是最早給出這一概念的科學(xué)家。
分子表面可分為范德華表面(van der Waals Surface)、溶劑可及表面(Solvent-accessible Surface)及其它分析表面如Connolly表面。

2.2 范德華表面
這是基于分子中原子的范德華半徑定義的表面。
范德華半徑是原子在分子間相互作用中所占據(jù)的空間的度量。
將所有原子的范德華半徑想象成球體,這些球體疊加在一起就形成了分子的范德華表面和體積。
2.3 溶劑可及表面
這是分子表面中可以被溶劑分子接近的部分。通常使用半徑為1.4 ?的水分子作為探針球來模擬溶劑分子。
當(dāng)探針球接觸到原子球時,記錄下接觸點,這些點構(gòu)成了Connolly表面,而探針球心的軌跡則構(gòu)成了溶劑可及表面。
2.4 Connolly表面
這是一種分析表面,由探針球與原子球接觸的點和凹陷表面組成,用于描述溶劑可及表面。

2.5 小分子與大分子的表面差異
在小分子中,范德華表面和溶劑可及表面通常沒有區(qū)別,因為小分子較小,溶劑分子可以輕易接近其表面;在蛋白質(zhì)等大分子中,分子內(nèi)部的區(qū)域可能無法被溶劑探針球接近,因此這些區(qū)域不屬于溶劑可及表面。
在兩個或三個原子結(jié)合的地方,范德華表面和溶劑可及表面可能會有所不同。原子間的縫隙可能無法被溶劑探針球進(jìn)入,這些區(qū)域在溶劑可及表面中不被包括。
03 分子模擬常用名稱
3.1 常用長度單位
常用長度單位為埃(1?=10-10m)、納米(1nm=10-9m)?;瘜W(xué)鍵鍵長一般在埃的級
別,而分子大小一般在納米級別。
3.2 常用時間單位
常用時間單位為微秒(1μs=10-6s)、納秒(1ns=10-9s)、皮秒(1ps=10-12s)、飛秒(1fs=10-15s)。
蛋白質(zhì)折疊運動一般在微秒級別,而分子動力學(xué)模擬的步長一般在飛秒級別。
3.3 常用數(shù)據(jù)量級
基本單位是比特(bit),1B(byte)=8 bit;1KB=1024 B;1MB=1024 KB;1GB=
1024 MB;1TB=1024 GB。
3.4 常用坐標(biāo)系統(tǒng)
笛卡爾坐標(biāo)(Cartesian Coordinates),即我們通常所說的直角坐標(biāo),以原點為參照中分子中每一個原子都具有x、y、z三個坐標(biāo)值。

原點選擇不一樣,每個原子的坐標(biāo)就不一樣,分子相對原點做平移或旋轉(zhuǎn)操作后,原子坐標(biāo)也將不一樣。
常用分子文件格式如Sdf、Mol2和Pdb都采用笛卡爾坐標(biāo)。
內(nèi)坐標(biāo)(Internal Coordinates),只考慮分子中原子之間的相對位置,即指定一個原子為計算起點,用兩個原子之間的距離(即鍵長)、三個原子形成的角度(即鍵角)和四個原子構(gòu)成的二面角來表征分子的構(gòu)型。內(nèi)坐標(biāo)通常表示為乙矩陣的形式,在量子化學(xué)計算等方面有廣泛的應(yīng)用。
04 分子文件格式
4.1 Mol文件格式
Mol文件格式最早是由美國MDL公司(現(xiàn)為法國達(dá)索公司下屬的BIOVIA公司)開發(fā)的,含有組成分子的原子、鍵、連接性及坐標(biāo)信息,幾乎所有的化學(xué)信息學(xué)軟件都可以讀取Mol文件。
Mol文件既可以存儲二維結(jié)構(gòu),也可以存儲三維結(jié)構(gòu)。Mol是應(yīng)用最為廣泛的小分子結(jié)構(gòu)存儲文件格式,很多其它的格式都是由Mol格式衍生出來的。下面以乙醛為例,解釋下Mol格式內(nèi)容。
MDL Mol File
5 4 0 0 0 0 0 0 0 0999 V2000
1.7857 0.0000 0.0000 C 0 0 0 0 0 0 0 0 0 0 0
0.4214 0.0000 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
2.3214 0.0000 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
1.7857 0.0000 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
2.3214 0.0000 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
1 2 1 0
2 3 2 0
2 4 1 0
3 5 1 0
M END
標(biāo)題:MDL Mol File 表明這是一個由MDL軟件創(chuàng)建的MOL文件。
計數(shù):5 4 0 0 0 0 0 0 0 0999 V2000 表示這個分子有5個原子、4個鍵,后面跟著的是一些附加信息,如0表示沒有立體化學(xué)信息,999表示這是一個V2000格式的文件。
原子塊:接下來的5行描述了每個原子的坐標(biāo)和類型。每行代表一個原子,包含以下信息:x坐標(biāo);y坐標(biāo);z坐標(biāo);原子類型(C表示碳,O表示氧,H表示氫);其他占位符,通常用于存儲額外的屬性或用于軟件特定的信息。
鍵塊:1 2 1 0 和 2 3 2 0 以及 2 4 1 0 和 3 5 1 0 描述了原子之間的鍵。每個鍵用四個數(shù)字表示:第一個原子的索引;第二個原子的索引;鍵的類型(1表示單鍵,2表示雙鍵);鍵的立體化學(xué)(0表示沒有立體化學(xué)信息)
結(jié)束:M END 表示文件的結(jié)束。
一個Mol文件一般只包含一個小分子。當(dāng)多個分子甚至成千上萬個分子需要存儲時,則可采用Sdf (Structure Data File)文件。
事實上Sdf文件是多個MoI文件累加在一起,各分子之間用四個“$”符號隔開,即在“M END”之后加上一行“$$$$”。
Sdf文件還有一個好處是可以添加分子的相關(guān)數(shù)據(jù)或信息,比如分子的供應(yīng)商名稱、分子的識別號碼、分子的clogP值、分子量等,這些信息以如下形式輸入,放在成鍵信息之后,“M END”行之前。
4.2 PDB格式
PDB文件格式最初由美國布魯克海文國家實驗室(Brookhaven National Laboratory)制定。該實驗室在蛋白質(zhì)數(shù)據(jù)庫(Protein Data Bank,簡稱PDB)的構(gòu)建中扮演了關(guān)鍵角色,因此開發(fā)了這種文本文件格式來詳細(xì)描述數(shù)據(jù)庫中生物大分子的三維結(jié)構(gòu)。
這種格式的文件以“PDB”作為擴(kuò)展名,它不僅記錄了蛋白質(zhì)和其他生物大分子的空間結(jié)構(gòu),還包含了相關(guān)的生物學(xué)信息,成為了生物信息學(xué)和結(jié)構(gòu)生物學(xué)研究中不可或缺的數(shù)據(jù)資源。
值得一提的是,殷賦云在線平臺提供了便捷的PDB結(jié)構(gòu)處理服務(wù)??,用戶可以免費且高效地利用這一資源,進(jìn)一步推動科研工作的進(jìn)展。

05 分子文件格式轉(zhuǎn)換
由于分子信息處理時,通常需要多個程序依次完成,這就涉及不同文件格式之間的轉(zhuǎn)換問題。殷賦云平臺提供免費的在線服務(wù)可以完成這種轉(zhuǎn)換。
隨著計算能力的提高和算法的改進(jìn),分子模擬技術(shù)將在未來發(fā)揮更加重要的作用。它將不僅幫助我們更好地理解復(fù)雜的生物化學(xué)過程,還將在新藥發(fā)現(xiàn)和材料設(shè)計中發(fā)揮關(guān)鍵作用。
此外,分子模擬的可視化工具將使得非專業(yè)人士也能夠直觀地理解分子層面的復(fù)雜現(xiàn)象。