世界的發(fā)展總是伴隨著底層技術(shù)的應(yīng)用與普及,與之相伴的是工作方式的迭代,甚至一些工種的消逝。如果我們順著時代的脈絡(luò)向未來看去,人工智能一定是未來那個改變世界的核心技術(shù)。
不久前,一個消息在化工圈引起了不小的波瀾:北卡羅萊納州立大學(xué)和布法羅大學(xué)的研究人員開發(fā)了一種稱為“人工化學(xué)家”(Artificial chemist)的技術(shù),該技術(shù)結(jié)合了人工智能(AI)和用于進行化學(xué)反應(yīng)的自動化系統(tǒng),一天能夠摸索500個技術(shù)條件。而這一技術(shù)的底層邏輯,就是計算化學(xué)。作為一個前沿技術(shù)的分享平臺,流動化學(xué)技術(shù)體系的整理了該學(xué)科相關(guān)知識,供您參考

正文
1
對不同的子領(lǐng)域 常見且經(jīng)典的計算化學(xué)研究方式
由于計算化學(xué)主要是依靠計算機作為硬件載體和實施手段的一門學(xué)科,因此,計算機技術(shù)的發(fā)展將對其起到一定的促進作用。由于計算機科技進步的速度非???因此不易預(yù)測長遠的未來計算化學(xué)的發(fā)展。十五年來PC在功能上有超過1000倍的提升,而未來十五年的發(fā)展又是如何呢?依照專家的估計,由于物理定律的限制,類似現(xiàn)有的處理器結(jié)構(gòu)在功能上大概只有十倍的成長空間。

短期來看,平行處理的技術(shù)可大幅提升運算的效率:長遠而言,或許光學(xué)計算機甚至于量子計算機將會提供現(xiàn)今無法想象的計算速率。然而,計算化學(xué)要有真正突破性的發(fā)展,除了硬件的進步外,理論上的研究似乎更為重要。目前對于大分子的計算限于理論的復(fù)雜性只能使用分子力學(xué)或半經(jīng)驗法;而且就算計算機功能上能有1000倍的提升,距離準(zhǔn)確的量子仿真仍有一段距離。目前的理論方法,僅能對大約小于十個原子的系統(tǒng)達到化學(xué)誤差(1-2kcal/mol1)內(nèi)的準(zhǔn)確度;而且這些準(zhǔn)確的計算方法的計算量大約是跟系統(tǒng)大小的七次方
成正比。因此,計算機計算功能的提升通常并無法將可準(zhǔn)確仿真的系統(tǒng)加大多少。
一般認為要能以計算化學(xué)準(zhǔn)確仿真各種生物及材料系統(tǒng),理論化學(xué)家需要研發(fā)出計算量僅與系統(tǒng)大小的平方甚至一次方成正比的準(zhǔn)確量子化學(xué)方法。因此,我們可以預(yù)見,隨著計算機技術(shù)和化學(xué)計算方法的進一步發(fā)展,計算化學(xué)必將對真正意義上的現(xiàn)代化學(xué)產(chǎn)生巨大的推動作用。
量子化學(xué)計算方法的演進主要分為
(1)分子軌道法(簡稱MO法)和(2)價鍵法。以MO法為例分子軌道法的核心是哈特里一??艘涣_特漢方法,簡稱HFR方程,它是以三個在分子軌道法發(fā)展過程中做出卓越貢獻的人命名的方程。

1928年DR?哈特里( Hartree)提出了一個將N個電子體系中的每一個電子都看成是由其余的N-1個電子所提供的平均勢場運動的假設(shè)。這樣對于體系中的每個電子都得到了一個單電子方程(表示這個電子運動狀態(tài)的量子力學(xué)方程),稱為哈特里方程使用自治場迭代方式求解這個方程(自治場分子軌道法),就可以得到體系的電子結(jié)構(gòu)和性質(zhì)。哈特里方程未考慮由于電子的自旋而需要遵守泡利原理。
1930年,B?A?福克(Fock)和J?C斯萊特( Slater)分別提出了考慮泡利原理的自治場迭代方程,稱為哈特里-??朔匠?。它的單電子軌函數(shù)(即分子軌道)取為自旋軌函數(shù)(即電子的空間函數(shù)與自旋函數(shù)的乘積)。泡利原理要求,體系的總電子波函數(shù)要滿足反對稱化要求,即對于體系的任何兩個粒子的坐標(biāo)交換都使總電子波函數(shù)改變正負號,而斯萊特行列式波函數(shù)正是滿足反對稱化要求的波函數(shù)將哈特里一??朔匠逃糜谟嬎愣嘣臃肿?會遇到計算上的困難。C?C?J?羅特漢( Roothaan)提出將分子軌道向組成分子的原子軌道(AO)展開這樣的分子軌道稱為原子軌道的線性組合(簡稱ICAO):使用LCAO-MO,原來積分微分形式的哈特里一??朔匠叹妥?yōu)橐子谇蠼獾拇鷶?shù)方程,稱為哈特里一??艘涣_特漢方程,簡稱HFR方程。
RHF方程一閉殼層體系是指體系中所有的電子均按自旋相反的方式配對充満某些殼層(殼層指一個分子能級或能量相同的即簡并的兩個分子能級)這種體系的特點,是可用單斯菜特行列式表示多電子波函數(shù)(分于的狀態(tài)),描述這種體系的HFR方程稱為限制性的HFR方程,所謂限制性,是要求每一對自旋相反的電子具有相同的空間函數(shù)限制性的HFR方程簡稱RHF方程UHF方程一一開売層體系是指體系中有未成對的電子(即有的殼層未充滿)。
描述開殼層體系的波函數(shù)一般應(yīng)取斯萊特行列式的線性組合,這樣計算方案就將很復(fù)雜,然而對于開殼層體系的對應(yīng)極大多重度(所謂多重度,指一個分子因總自旋角動量的不同而具有幾個能量相重的狀態(tài))的狀態(tài)即自旋角動量最大的狀態(tài))來說,可以保持波函數(shù)的單斯萊特行列式形式(近似方法)以描述這些體從頭計算法一一原則上講,有了HFR方程(不論是RIF方程或是LHF方程),就可以計算任何多子體系的電子結(jié)構(gòu)和性質(zhì)、真正嚴(yán)格的計算稱之為從頭計算法。
在從頭計算法里,分子軌道由組成體系的原子的全部原子軌道線性組合而成。對于原子軌道有不同的選法。斯萊持型軌道適于描寫電子云的分布在計算一些積分時包含對無窮級數(shù)的積分,十分麻煩,所以在從頭計算法里,常取高斯型函數(shù)做為基函數(shù),取一個高斯型函數(shù)或數(shù)個高斯型函數(shù)的線性組合模擬一個原子軌道。已經(jīng)有了不少進行多原子體系的從頭計算法的標(biāo)準(zhǔn)的計算機程序,如J?A波普爾研究集體推出計算機程序系列:高斯系列該系列第一個公開的版本為高斯70(指1970年)以后差不多每年更新一次,功能逐次增多,算法也日趨完善勢價軌道從頭計算法一一從直觀的化學(xué)觀出發(fā),可以想見,在原子形成分子時,僅僅原子的價層電子發(fā)生了較大的變形,而內(nèi)層電子分布則改變較小。
為了節(jié)省計算時間,而又不失去計算精度,從20世紀(jì)70年代以來,開始只考慮原子的價電子,而把內(nèi)層電子和原子核看成一個凝固的原子實,用一個核模型勢來代替內(nèi)層電子與價電子的從頭計算法,稱為贗勢價軌道從頭計算法:不同的方案對于贗勢的取法不盡相同,且大都能得到與全電子從頭計算法相近的結(jié)果,因而大大節(jié)省了計算時間,特別對于含有重原子的體系,恰好是全電子從頭計算難以處理的。勢價軌通從頭計算法將會在過渡金屬絡(luò)合催化的量子化學(xué)研究方面發(fā)揮重要作用。
組態(tài)相互作用法一比從頭計算法精確度更高的組態(tài)相互作用法有兩個優(yōu)點:一是不依賴于試探波函數(shù)的形式,就能原則上提非相對論薛丁諤方程的精確解;二是原則上可用于原子或分子體系的任何穩(wěn)定態(tài)近似計算法一一在半經(jīng)驗計算法中,目前最常用的近似是零微分重疊(簡稱ZDO):近似程度最高的是全略微分重疊(簡稱CNDO)近似,是J?A?波普爾在1965年提出的。此外,在近似計算法中,還有休克爾分子軌道法和推廣的分子軌道法。
2
新的計算化學(xué)技術(shù)和程序?qū)λ芴幚淼捏w系尺度和精度的影響
量子尺寸效應(yīng):當(dāng)粒子尺寸下降到某一值時,金屬費米能級附近的電子能級由準(zhǔn)連續(xù)變?yōu)殡x散能級,以及能隙變寬,物理和化學(xué)隨粒子數(shù)的增加出現(xiàn)不連續(xù)的變化。小尺寸效應(yīng):微粒尺寸與光波波長,徳布羅意波長等物理特征尺寸相當(dāng)或更小時,晶體周期性的邊界條件將被破壞,非晶態(tài)納米微粒的顆粒表面層附近原子密度減小,導(dǎo)致聲、光、電、磁、熱、力學(xué)等特性呈現(xiàn)新的小尺寸效應(yīng)納米催化劑中的尺寸效應(yīng):納米粒子與周期性大塊固體物質(zhì)物理和化學(xué)性質(zhì)的顯著差異,是造成其催化性能與傳統(tǒng)催化劑非常不同的根本原因,相應(yīng)地,納米健化劑的催化活性、選擇性也與大塊固體催化劑的有顯著不同,出現(xiàn)顯著的:小尺寸效應(yīng)n量子尺效應(yīng)
一個原子一個原子的調(diào)節(jié)催化劑的活性和選擇性理論計算的幾個研究方面:納米催化劑本身的性質(zhì)及其中的尺寸效應(yīng):幾.何構(gòu)型.電荷分布,表面成鍵,能級,吸收諧等等.納米催化劑與參加反應(yīng)的物種的相互作用以及其中的尺寸效應(yīng):吸附形態(tài),吸附能,成鍵,光譜信(紅外,拉曼)等性質(zhì)催化反應(yīng)中的尺す效應(yīng):反機理,中間體,過渡態(tài),反應(yīng)速率,反應(yīng)選擇性等催化體系的理論模擬和催化劑的分子設(shè)在生物體系中的應(yīng)用。
QM/MM(量子力學(xué)/分子力學(xué)方法)
1.計算化學(xué)和生物化學(xué)反應(yīng)活性:酶催化反應(yīng)機理
2.溶劑化作用:QM溶質(zhì)和緊鄰溶劑分子、MM溶劑體系
分子動力學(xué)應(yīng)用:大分子模擬
1.碳水化合物的溶劑化效應(yīng);
2.生物膜的滲透:分子動力學(xué)模擬;
3.膜蛋白的環(huán)境:
4.分子動力學(xué)研究雙脂層;
5.界面過程:界面聚集,界面反應(yīng)和界面的傳質(zhì)過程:
6.蛋白質(zhì)模型:折疊-去折疊動力學(xué);
7.NA中的分子動力學(xué);
8.核酸構(gòu)象和柔性;
9蛋白質(zhì)一核酸相互作用
精修實驗結(jié)構(gòu)
1.模擬退火法進行大分子結(jié)構(gòu)計算和精修
2用NMR數(shù)據(jù)確定大分子結(jié)構(gòu)及結(jié)枃精修
3.用X-射線晶體衍射確定大分子結(jié)構(gòu)及結(jié)構(gòu)精
構(gòu)象分析
1.系統(tǒng)搜索、隨機搜索、動力學(xué)模擬、遺傳算法
2.構(gòu)象平衡:溶劑對分子構(gòu)象的影響
20 世紀(jì)80 年代以來,隨著計算機性能的提高以及各種計算化學(xué)方法的改進, 分子模擬技術(shù)日漸成熟,并逐步發(fā)展成為人們進行科學(xué)研究的一項新的有效的工 具,在化學(xué)、制藥、材料等相關(guān)的工業(yè)上發(fā)揮著越來越重要的作用。分子模擬之所以受到這樣的重視,與它自身的特點和相關(guān)學(xué)科的發(fā)展是密不 可分的。
以前,采取的都是實驗室人工合成一種新型化合物,但是有一些化合物 的合成繁瑣而復(fù)雜,例如具有多種旋光性的藥物,每一種新的藥物合成都是一個 工作量巨大的實驗過程,以往只能采用實驗手段研究時,新藥的實驗過程經(jīng)常持 續(xù)數(shù)十年,其間經(jīng)歷了許多失敗的實驗,耗費大量的人力物力。但是,在采用分 子模擬的方法后,可以通過計算機模擬的手段對實驗進行大量的預(yù)先篩選,大大 加快了這一研究的進程。又如在對超臨界流體的研究中,分子模擬和傳統(tǒng)的實驗 相比有著巨大的經(jīng)濟優(yōu)勢。
分子模擬的定義
分子模擬是一個廣泛的概念,其包括基于量子力學(xué)的模擬和基于統(tǒng)計力學(xué)的模擬。前者為計算量子化學(xué)(computational quantum chemistry,簡稱CQC),后者 主要分為兩個方法,分別是分子動力學(xué)模擬(molecular dynamics,MD)和蒙特卡 洛模擬(Monte Carlo,MC) 。三者中以計算量子化學(xué)的結(jié)果最為可靠,但是其計算量也是最大的,通常處理的體系也是比較小的.MC MD都是基于位能函數(shù) 的模擬,不同之處在于 MD 模擬過程與時間相關(guān),除了和 MC 一樣可以處理平 衡性質(zhì)以外,在處理傳遞性質(zhì)等與時間相關(guān)的問題時有天然的優(yōu)勢,當(dāng)然 MD 和MC 相比程序的復(fù)雜程度要高,計算的難度要大一些。
分子模擬的方法
分子模擬的方法主要有四種:分子力學(xué)方法,分子動力學(xué)方法、蒙特卡洛方法、量子力學(xué)方法。
分子力學(xué)方法 分子力學(xué)法又稱Force Field 方法,是在分子水平上解決問題的非量子力學(xué)技 術(shù)。其原理是,分子內(nèi)部應(yīng)力在一定程度上反映被計算分子結(jié)構(gòu)的相對位能大小。分子力學(xué)法是依據(jù)經(jīng)典力學(xué)的計算方法,即依據(jù) Born-Oppenheimer 原理,計算 中將電子的運動忽略,而將系統(tǒng)的能量視為原子核種類和位置的函數(shù),這些勢能 函數(shù)被稱為力場。分子的力場含有許多參數(shù),這些參數(shù)可由量子力學(xué)計算或?qū)嶒?方法得到。該法可用來確定分子結(jié)構(gòu)的相對穩(wěn)定性,廣泛地用于計算各類化合物 的分子構(gòu)象、熱力學(xué)參數(shù)和譜學(xué)參數(shù)。
分子動力學(xué)方法 分子動力學(xué)模擬是一種用來計算一個經(jīng)典多體系的平衡和傳遞性質(zhì)的方法。它對于許多材料來說是一個很好的近似,在許多方面,分子動力學(xué)模擬與真實實 驗相似。它以特定粒子(如原子、分子或者離子等)為基本研究對象,將系統(tǒng)看作 具有一定特征的粒子集合,運用經(jīng)典力學(xué)方法研究微觀分子的運動規(guī)律,得到體 系的宏觀特性和基本規(guī)律。
由于分子力學(xué)所描述的是靜態(tài)分子的勢能,而真實分 子的構(gòu)象除了受勢能影響外,還受到外部因素如溫度、壓力等條件的影響,在這 種情況下,分子動力學(xué)方法應(yīng)當(dāng)是更合實際、更符合真實狀態(tài)的計算方法。分子 動力學(xué)模擬已應(yīng)用于模擬原子的擴散、相變、薄膜生長、表面缺陷等過程,可得 到原子結(jié)構(gòu)因子、狀態(tài)方程、彈性模量、熱膨脹系數(shù)、熱容、焓等物理量。
蒙特卡洛方法 蒙特卡洛法與一般計算方法的主要區(qū)別在于它能比較簡單地解決多維或因 素復(fù)雜的問題,它利用統(tǒng)計學(xué)中的許多方法,又稱統(tǒng)計實驗方法。該方法不像常 規(guī)數(shù)理統(tǒng)計方法那樣通過真實的實驗來解決問題,而是抓住問題的某些特征,利 用數(shù)學(xué)方法建立概率模型,然后按照這個模型所描述的過程通過計算機進行數(shù)值 模擬實驗以所得的結(jié)果作為問題的近似解。
因此,蒙特卡洛法是數(shù)理統(tǒng)計與計算 機相結(jié)合的產(chǎn)物。由于高分子鏈由大量的重復(fù)單元構(gòu)成,聚合反應(yīng)存在著隨機性。分子量的大小分布、共聚物中的序列分布、高分子的構(gòu)象、降解,都存在著隨機 性問題,蒙特卡洛法無疑成為研究的最佳對象,幾乎從其建立之日起,就在高分 子領(lǐng)域得到了應(yīng)用。量子力學(xué)方法 量子力學(xué)方法借助計算分子結(jié)構(gòu)中各微觀參數(shù),如電荷密度、鍵序、軌道、 能級等與性質(zhì)的關(guān)系,設(shè)計出具有特定動能的新分子。
該法所描述的是簡單的非 真實體系,計算的是絕對溫度零度下真空中的單個小分子。其中從頭算量子力學(xué) 計算廣泛用于計算平衡幾何形狀、扭轉(zhuǎn)勢以及小分子的電子激發(fā)能。隨著計算機 硬件和算法的發(fā)展,已將此技術(shù)用到大分子,包括聚合物的低聚物在內(nèi)的模型, 并有較好的效果。
分子模擬在化學(xué)領(lǐng)域的應(yīng)用
分子模擬在石油化工領(lǐng)域的應(yīng)用 分子模擬技術(shù)與傳統(tǒng)的實驗手段相結(jié)合,正在開拓分子模擬技術(shù)在石油化工 領(lǐng)域如高分子材料設(shè)計、反應(yīng)過程研究、催化劑和油品添加劑作用機理及分子設(shè) 計開發(fā)等方面的應(yīng)用新局面,幫助研究人員更深入地理解所研究體系的反應(yīng)機 理,選擇更合理的研發(fā)途徑,更快地進行新分子篩催化劑的改性和開發(fā)、高分子 復(fù)合材料的設(shè)計以及油品添加劑復(fù)合配方的研制,減少實驗工作量,進一步推動 在石油化工領(lǐng)域的技術(shù)創(chuàng)新。
分子模擬在分子篩領(lǐng)域的應(yīng)用
分子力學(xué)法在分子篩的吸附擴散研究中的應(yīng)用實例 分子力學(xué)的計算中不考慮電子運動狀態(tài),系統(tǒng)的勢能僅與體系中原子核的空 間坐標(biāo)相關(guān),把原子看作是球,化學(xué)鍵看作是彈簧,則分子可以看作是通過具有 不同彈性(力常數(shù))的彈簧將各個球(原子)連接起來的體系。其優(yōu)點是概念簡單、 計算速度快,可以處理較大的體系,對處理分子構(gòu)象、分子熱力學(xué)性質(zhì)等的計算 已取得了成功。
不足之處是分子力學(xué)不能提供和電子分布相關(guān)的性質(zhì),意味著它 不能處理電子效應(yīng)起主導(dǎo)作用的化學(xué)體系。王巍采用基于 Monte Carlo 取樣方法的分子力學(xué)模擬方法,研究了丙烯和4 C4單烯烴異構(gòu)體在絲光沸石內(nèi)的物理吸附,得到了單組分烯烴在絲光沸石上 的等壓吸附性能曲線,以及等比例多組分體系和不等比例多組分體系的等壓吸附 曲線。
分子動力學(xué)模擬在分子篩的吸附擴散研究中的應(yīng)用實例 采用 MD可研究氣相小分子在微孔中的擴散性質(zhì)。June 等采用分子動力學(xué) 模擬的方法研究了甲烷、丁烷、己烷、氙氣在 ZSM- 分子篩上的動力學(xué)性質(zhì),預(yù)測得到了自擴散系數(shù),發(fā)現(xiàn) 300K 400K下組分自擴散系數(shù)均隨著吸附量 的增大緩慢減小。Gergidis 等采用分子動力學(xué)模擬的方法對正丁烷 -甲烷混合物 體系在 ZSM- 分子篩上的傳質(zhì)性質(zhì)進行了研究,發(fā)現(xiàn)混合物中一個組分的自擴散系數(shù)均隨著另一個組分吸附量的增加而減小。
Sanborn 等運用分子動力學(xué)模 擬的方法研究了 CF4 和任意一種 C1- 10 直鏈烷烴(括甲烷,乙烷,丁烷,己烷 辛烷和葵烷)的二元混合物體系在八面沸石中的傳質(zhì)性質(zhì)和分子篩的結(jié)構(gòu)。表明 吸附量不同,不同種類擴散系數(shù)的大小不同。侯廷軍等采用分子動力學(xué)模擬的方 法研究了純硅 MCM- 22 型分子篩 (ITQ- 1)中苯分子的吸附行為。表明在較低吸附值的情況下,分子篩骨架的柔性對苯分子吸附和擴散并沒有產(chǎn)生大的影響。
蒙特卡羅法在分子篩的吸附擴散研究中的應(yīng)用實例 利用蒙特卡羅法可得到氣體小分子在催化劑中的吸附性質(zhì),包括吸附位信 息、吸附量和吸附能。GCMC 方法最早被用于主體流體的模擬,后來推廣到限 定空間。巨正則系綜 Monte Carlo 方法廣泛用于研究吸附質(zhì)的吸附相平衡的研 究,它不僅可以模擬分子的靜態(tài)結(jié)構(gòu)和動態(tài)行為 (如氫鍵的締合與解締、吸附、 擴散等),也可以模擬微孔中吸附質(zhì)的化學(xué)勢、溫度保持恒定時的平衡及預(yù)測分 子在微孔固體(如分子篩) 中的吸附性質(zhì),并且可以計算吸附等溫線、結(jié)合位、 吸附熱、擴散途徑及分子選擇性等。
Monte Carlo 模擬 [11] 已廣泛應(yīng)用于研究分子篩的吸附性能及分子篩內(nèi)吸附 質(zhì)的動態(tài)分布。Sebastian 等采用實驗和 GCMC 相結(jié)合的方法研究了 Mn交換的 型分子篩中的吸附。實驗得到的吸附等溫線和模擬得到的吸附等溫線基本吻合。在 A型分子篩中 ,Ar的吸附量隨著 Mn 交換量的增加而增加;在粒狀的 在低壓下的吸附量隨著Mn 交換量的增加而增加,在高壓下稍微低于未經(jīng) Mn 交換的 型分子篩中,N2的吸附量隨著 Mn 交換量的增加而增加。侯廷軍等用 巨正則蒙特卡羅模擬方法研究了 NaY 分子篩中苯的擴散性質(zhì)和純硅 MCM- 22 型分子篩 (ITQ- 1)中苯分子的吸附行為
結(jié)果表明,在苯分子的擴散過程中,鈉 分子篩中存在兩個不同的吸附位點,而苯分子在ITQ- 基丁烷和二甲苯異構(gòu)體在AlPO4-5 中的吸附,得了有關(guān)吸附平衡常數(shù)、吸附熱、 吸附等溫線及吸附位等信息。曾勇平等采用 GCMC 方法模擬了噻吩 苯二元組分和噻吩 正己烷三元組分在MFI MOR沸石中的吸附分離性能。
多種分子模擬方法結(jié)合研究分子篩的擴散系數(shù) 在分子篩的吸附擴散研究中,分子模擬技術(shù)已成為必不可少的研究手段。其 中,Monte Carlo 方法和分子動力學(xué)模擬的組合方法更是得到了廣泛的應(yīng)用,并 取得良好的效果。比如,巨正則 Monte Carlo 模擬用于研究吸附質(zhì)的吸附相平衡 問題,分子動力學(xué)模擬可以廣泛地用來研究吸附質(zhì)在分子篩中的擴散性質(zhì)。結(jié)合 分子動力學(xué)和巨正則 Monte Carlo 模擬可以得到吸附質(zhì)在分子篩中的靜態(tài)和動 態(tài)性質(zhì)。
Song 等通過頻率響應(yīng)法、MonteCarlo 和分子動力學(xué)相結(jié)合的方法對苯、 對二甲苯等客體分子在 Silicalite- 中不同溫度下平衡時的吸附能、吸附位及客體分子在擴散過程中的相互作用能進行了研究,并合理地解析了苯在 Silicalite- 中的擴散系數(shù)小于甲苯,而飽和環(huán)烷烴的擴散系數(shù)小于其相應(yīng)的芳烴的原因。
單一的分子模擬方法已經(jīng)不能滿足現(xiàn)代工業(yè)對催化劑的研究和開發(fā)(包括分 子篩的吸附擴散研究中的應(yīng)用)所提出的更高的要求,這就要求人們把組合方法 更好地應(yīng)用到這個領(lǐng)域,即對某些關(guān)鍵部位使用精確的量子力學(xué)能量函數(shù),而其 他部位使用分子力學(xué)的位能函數(shù),實現(xiàn)優(yōu)勢互補,使得新方法既能模擬原子數(shù)目 很大的體系,又能考慮電子的結(jié)構(gòu)及運動,充分發(fā)揮分子模擬方法的優(yōu)勢。
分子模擬高分子領(lǐng)域的應(yīng)用
計算機模擬已經(jīng)應(yīng)用在高分子科學(xué)的各個方面,包括模擬高分子溶液、表面 和薄膜、非晶態(tài)、晶態(tài)、液晶態(tài)、共混體、嵌段共聚體、界面、生物聚合物、高 分子中的局部運動、液晶高分子的流變學(xué)、力學(xué)性質(zhì)和電活性等 [12 13] 通過建立高分子的溶解和界面作用的模型,可以模擬固體內(nèi)表面的幾何優(yōu)化,動力學(xué)、震動分析。從而準(zhǔn)確地確定高分子混合物的熱力學(xué)性質(zhì),如水合能、 蒸汽壓、分配系數(shù)等。分子模擬同時可以獲得小分子氣體在高分子材料中擴散的 力學(xué)性能信息,對合成合適的高分子膜起到很大幫助。它還可以預(yù)測各種涂料的 界面信息,可以有效指導(dǎo)實驗,尋找到最佳涂料。
另外,它還可以對高分子的共混相容性和力學(xué)性能進行模擬和研究 發(fā)展新的方法和算法是未來 發(fā)展的重要方向。分子模擬會進一步繼續(xù)被應(yīng)用在化學(xué)中各個領(lǐng)域中,此外,還會與化學(xué)與生 命科學(xué)等交叉學(xué)科中發(fā)揮重要作用,特別是藥物設(shè)計,蛋白質(zhì)-蛋白質(zhì)作用,蛋 白質(zhì)-配體作用等領(lǐng)域有重要應(yīng)用前景。最后,發(fā)展新型的分子模擬軟件,開發(fā)出新型的可用于計算機輔助分子裁剪、 分子設(shè)計、分子合成以及物性分析等用途的軟件,從而使分子模擬具有廣闊的應(yīng) 用前景。?
3
高通量篩選、機器學(xué)習(xí)等在功能分子開發(fā),表面催化劑篩選等的應(yīng)用
Nature Catalysis:下一個研發(fā)范式“機器學(xué)習(xí)+DFT ” — 預(yù)測和篩選新型電催化劑在電催化CO2還原的反應(yīng)中(CO2RR),析氫反應(yīng)(HER)是其主要的競爭反應(yīng),可能導(dǎo)致CO2的產(chǎn)物轉(zhuǎn)化率比較低、產(chǎn)物的選擇性較差,例如Cu催化劑;然而對于Au,Ag等催化劑,其主要產(chǎn)物是CO,CO2的轉(zhuǎn)化率也比較高,但催化劑成本高。
在基于密度泛函理論(DFT)的計算中,對于CO2RR和HER催化劑的活性普遍分別使用CO和H在催化劑表面的吸附強弱來描述,這就是通常所說的基于描述因子的研究方法,已經(jīng)廣泛使用。需要指出的是,單個描述因子不能完全描述金屬間化合物的催化性能,還需要分析該表面的穩(wěn)定性、高覆蓋下的熱力學(xué)和動力學(xué)性能。采用DFT方法對催化劑的所有關(guān)鍵性質(zhì)進行計算,實際上并不能加速實驗中對電催化劑的研究,但是理論研究對催化劑的預(yù)篩選卻具有較大的價值。這種做法可以縮小候選催化劑的空間,加速材料的篩選。
卡內(nèi)基梅隆大學(xué)的Zachary W. Ulissi課題組,Kevin為第一作者發(fā)表在Nature Catalysis上的工作。介紹機器學(xué)習(xí)(ML)和優(yōu)化的組合方法,全自動地指導(dǎo)DFT方法對ML預(yù)測得到的候選電催化劑進行高通量篩選,候選結(jié)構(gòu)可在原文的SI中找到。
本文設(shè)計的全自動化篩選框架,使可考慮的搜索空間更大。
Mendeleev database:元素性質(zhì)數(shù)據(jù)庫,可以提取元素的多種性質(zhì),用以構(gòu)成機器學(xué)習(xí)所需要的特征;在本文中則提取了吸附位點處不同元素的物理/化學(xué)性質(zhì)作為其化學(xué)環(huán)境的表示,例如,原子序數(shù)、泡利電負性。
TPOP:一個自動化的機器學(xué)習(xí)工具,用來選擇機器學(xué)習(xí)的回歸方法,在本文中預(yù)測吸附能。
Fireworks:一個作業(yè)管理流程解決方案,用來自動創(chuàng)建任務(wù),執(zhí)行任務(wù)。本文中,可用來執(zhí)行提取或創(chuàng)建晶體結(jié)構(gòu)、創(chuàng)建不同指數(shù)的晶面(hkl)、提交DFT任務(wù)、提取能量、創(chuàng)建吸附構(gòu)型、再提交任務(wù)、執(zhí)行ML回歸預(yù)測等一系列子任務(wù)。此外,Luigi與Fireworks具有類似的作業(yè)管理功能,這兩種方法均在本文中搭配使用。
Material Project:一個材料晶體結(jié)構(gòu)數(shù)據(jù)庫。
Pymatgen 和Atomic simulation environment (ASE):用來創(chuàng)建晶體結(jié)構(gòu)、表面結(jié)構(gòu)和表面吸附結(jié)構(gòu)。
本文提出對特殊性能材料的高通量篩選的流程(圖1),利用機器學(xué)習(xí)方法預(yù)測大量候選物的性質(zhì),與理想值進行比較,從中選出最接近理想值的候選物,對這些候選(結(jié)構(gòu))針對性的進行DFT計算,再將這些新數(shù)據(jù)添加到訓(xùn)練集中,再進行模型訓(xùn)練,重復(fù)該篩選過程,直到無候選物可選。對于候選物的選擇,采用高斯概率模型通過測量預(yù)測值與最優(yōu)值之間的距離來確定DFT計算的候選結(jié)構(gòu),其標(biāo)準(zhǔn)差為0.2 eV。

圖1:自動化材料發(fā)現(xiàn)的工作流示意圖
在機器學(xué)習(xí)中,特征的選取至關(guān)重要。該特征越能真實表示結(jié)構(gòu)的信息(化學(xué)環(huán)境),預(yù)測結(jié)果則能越準(zhǔn)確。但是,特征的提取是最難的一步。文中使用吸附位點處,用每個原子的四個屬性表示該原子的化學(xué)環(huán)境[原子序數(shù),電負性,原子配位數(shù),本征吸附能]。考慮了吸附位點周圍8個原子的屬性,構(gòu)成了32位的特征矢量,用以表示吸附位點的化學(xué)環(huán)境(圖2)。

圖2:吸附位點處化學(xué)環(huán)境的數(shù)字化表示;TPOP是全自動的ML程序。
對CO2RR和HER,文中指出最優(yōu)的CO和H的吸附能(無修正)分別是-0.67 eV 和-0.27 eV。從篩選的結(jié)果來看,對于CO2RR大部分接近最優(yōu)吸附能的結(jié)構(gòu)是含Cu的金屬間化合物(圖3),而大部分的合金表面不利于CO2RR。
從圖3a可知,每月能夠篩選出的候選物結(jié)構(gòu)的數(shù)目很少,且不穩(wěn)定,也能反映出ML模型的不穩(wěn)定。新的DFT數(shù)據(jù)被添加到原始訓(xùn)練集中,并沒有提高模型預(yù)測的準(zhǔn)確度,可能的原因是特征不足以描述對應(yīng)結(jié)構(gòu)的化學(xué)環(huán)境。

圖3:鑒別CO2RR最優(yōu)吸附表面
a. 每個月篩選所得最優(yōu)表面的數(shù)目及絕對誤差的分布;
b. 所有DFT計算所得CO吸附能在低覆蓋度下的歸一下分布、含Cu表面的吸附能分布;
c,d. 展示DFT、ML計算所得的CO吸附能分布。
對于HER的結(jié)果分析,文中用t-SNE分布可視化結(jié)構(gòu)與H吸附能的關(guān)系(圖4),除了Pt以外,還有一些金屬間化合物表面具有接近最優(yōu)值的H吸附能:As,Al,Si,Sb,Rh和Pd。DFT計算發(fā)現(xiàn)258個不同表面的H吸附能與最優(yōu)值-0.27 eV相比,誤差在0.1 eV之內(nèi)。

圖4:HER性能的結(jié)果分析。
a. t-SNE可視化所有DFT計算的活性位點。
b. 所有DFT計算所得H吸附能在低覆蓋度下的歸一下分布。
本文設(shè)計了一個可自動化計算的框架(GASpy),結(jié)合任務(wù)管理、機器學(xué)習(xí)和DFT計算的一系列的操作。這種設(shè)計思路主要用來針對特定性質(zhì)進行高通量材料篩選。本文應(yīng)用于CO2RR和HER電催化劑的篩選,元素涉及到化學(xué)元素周期表中的大部分金屬及部分非金屬,最終篩選出上百種候選表面結(jié)構(gòu),極大的縮小了實驗研究的范圍。
計算篩選的研究方法也存在一些局限性,1)篩選出的候選材料未必穩(wěn)定;2)未選出的材料未必不具有高的催化活性,因為本文只考慮低覆蓋度的情況;3)ML模型的準(zhǔn)確性比較差,一定程度上跟特征選取有關(guān)。
對于類似的模型,對于機器學(xué)習(xí)的模型,通過限定篩選材料的晶面指數(shù),使得特征的選擇盡可能的一致,有可能使模型的預(yù)測精度進一步提高,進一步極大的降低計算成本。
4
計算化學(xué)帶來的新思想在化學(xué)反應(yīng)動態(tài)學(xué)等全新領(lǐng)域注入的
新活力
計算機輔助分子設(shè)計包含著計算機藥物(包括農(nóng)藥等)分子設(shè)計和計算機輔助材料設(shè)計。
計算化學(xué)任務(wù)之一:計算機輔助藥物分子設(shè)計
計算機輔助藥物分子設(shè)計的目標(biāo)是先導(dǎo)化合物的發(fā)現(xiàn)及其優(yōu)化方法。其研究方法主要有間接法、直接法兩類。
間接法,即基于配體的設(shè)計方法。當(dāng)缺少靶標(biāo)(受體、酶等生物大分子)結(jié)構(gòu)信息時,主要采用這種方法:從一組小分子化合物(一般需要十至幾十個化合物)的結(jié)構(gòu)和生物活性數(shù)據(jù)出發(fā),研究其結(jié)構(gòu)與活性的關(guān)系規(guī)律,在此基礎(chǔ)上預(yù)測新化合物的生物活性,從而進行高活性分子的結(jié)構(gòu)設(shè)計。主要是定量構(gòu)效關(guān)系研究(QSAR),包括2D-QSAR (如:Hansch、Free Wilson法)和3DQSAR (如:CoMFA法、CoMSIA法)。
這些方法的主要問題在于需要合成一定數(shù)量并經(jīng)過嚴(yán)格的藥理學(xué)評價獲得活性數(shù)據(jù)的化合物,我們將其稱為“訓(xùn)練集”,然后通過機器學(xué)習(xí),和統(tǒng)計學(xué)計算,獲得相關(guān)性很好的QSAR方程。然而,我們在研究中經(jīng)常會碰到一些十分尷尬和困惑的現(xiàn)象,即構(gòu)建的非常好相關(guān)指數(shù)的QASR方程,但在預(yù)測外部數(shù)據(jù)集我們稱之為“測試集”的活性時,卻與實驗數(shù)據(jù)大相徑庭??赡艽嬖凇盎钚詰已隆钡默F(xiàn)象,即微小的結(jié)構(gòu)變動帶來活性極大變化,常常因此造成了設(shè)計上的失敗。這也許是當(dāng)今計算機輔助藥物分子設(shè)計的瓶頸。究其原因仍然迫切需要人們探究和解析。
直接法,即基于受體的設(shè)計方法。已經(jīng)獲得靶標(biāo)(生物大分子,如蛋白質(zhì)、核酸、酶、離子通道等)的結(jié)構(gòu)信息,來研究藥物分子與受體的相互作用,從而獲得藥物分子的結(jié)構(gòu)特征,設(shè)計出從空間形狀和化學(xué)性質(zhì)兩方面都能很好地與靶標(biāo)分子相結(jié)合的藥物分子。隨著分子生物學(xué)、細胞生物學(xué)和結(jié)構(gòu)生物學(xué)的發(fā)展,越來越多的藥物作用靶標(biāo)分子(蛋白質(zhì)、核酸、酶、離子通道) 被分離、鑒定,其三維結(jié)構(gòu)被闡明,為直接藥物設(shè)計方法的應(yīng)用提供了有利的條件。直接藥物設(shè)計包括全新藥物設(shè)計(de novo drug design)和數(shù)據(jù)庫搜尋(或稱分子對接,Docking)兩類。
全新藥物設(shè)計,是根據(jù)靶標(biāo)分子與藥物分子相結(jié)合的活性部位的幾何形狀和化學(xué)特征,設(shè)計出與其相匹配的具有新穎結(jié)構(gòu)的藥物分子。數(shù)據(jù)庫搜尋,首先應(yīng)具備大量化合物(例如幾十至100萬個化合物) 的三維結(jié)構(gòu)數(shù)據(jù)庫基礎(chǔ)上,將庫中的分子逐一與靶標(biāo)分子進行“對接”(Docking),通過不斷優(yōu)化小分子化合物的位置(空間取向)以及分子內(nèi)部柔性鍵的二面角,尋找小分子化合物與靶標(biāo)大分子作用的最佳構(gòu)象,計算其相互作用及結(jié)合能。在庫中所有分子均完成了對接計算之后,即可從中找出與靶標(biāo)分子結(jié)合的最佳分子。
目前的藥物設(shè)計主要是一種基于藥物和靶標(biāo)生物大分子三維結(jié)構(gòu)的設(shè)計方法。即人們想知道的是藥物分子是怎樣與生物大分子結(jié)合的,它們的結(jié)合對人體會產(chǎn)生怎樣的生理效應(yīng)。然而,藥物在人體的作用過程是非常復(fù)雜的系統(tǒng)。一個優(yōu)良的藥物除了與靶標(biāo)分子產(chǎn)生所預(yù)期的相互作用之外,還應(yīng)該具有良好的體內(nèi)輸運和分布性質(zhì)以及良好的代謝性質(zhì),而這些要求在基于結(jié)構(gòu)的藥物設(shè)計方法中未能予以考慮,而且,也未考慮藥物分子與受體活性中心結(jié)合是否對受體其它部位的結(jié)構(gòu)變化而產(chǎn)生活性變化。
隨著新世紀(jì)生命科學(xué)、計算機科學(xué)的發(fā)展,考慮藥物作用不同機理和全部過程的藥物設(shè)計—基于作用機理的藥物設(shè)計方法(Mechanism—Based Drug Design)將逐步建立和完善。未來的藥物設(shè)計,可能將從基于結(jié)構(gòu)的藥物設(shè)計向基于作用機理的藥物設(shè)計方向發(fā)展?;谧饔脵C理的藥物設(shè)計,離不開計算化學(xué),特別是量子力學(xué),同時還需要化學(xué)、物理、生物等學(xué)科之間的緊密結(jié)合。雖然目前基于機理的藥物設(shè)計還處于起步階段,尚未形成系統(tǒng)的理論體系。
不管是間接法還是直接法,都要進行配體與受體的相互作用計算。它包含了上述所及的量子化學(xué)計算和分子模擬計算的各種方法。目前,被認為最為重要的方法是量子力學(xué)和分子力學(xué)(QM/MM)相結(jié)合的方法:藥物分子與底物分子(酶、蛋白質(zhì)分子)的結(jié)合中心位點,采用精確計算的量子化學(xué)QM法,而外圍部分采用經(jīng)典的分子力學(xué)MM的高效方法。這種結(jié)合的方法,目前正在發(fā)展中,而且已經(jīng)取得一定的成果。
我們相信,隨著新技術(shù)的不斷涌現(xiàn),藥物在體內(nèi)的作用形式、作用機理和性能的理論研究不斷進步,新的統(tǒng)計學(xué)方法的引入,如支持向量機(SVM)新的機器學(xué)習(xí)方法的應(yīng)用(小樣本、非線性及高維模式識別),不久將來,計算機輔助藥物分子設(shè)計的“瓶頸”將會突破,那時,計算機藥物設(shè)計的輝煌時代將到來。
計算機輔助材料設(shè)計
目前計算化學(xué)發(fā)展最快、最為活躍、應(yīng)用面最廣的可以說是計算機輔助材料設(shè)計,而且已經(jīng)取得了許多豐碩的成果。其主要包括特殊材料功能的設(shè)計、材料內(nèi)部結(jié)構(gòu)和特征的模擬與優(yōu)化、材料內(nèi)部損傷和晶體缺陷等對材料性能的影響計算和模擬仿真,等等。
目前材料研究主要集中在凝聚態(tài),并且尤以固體材料研究為重點。固體材料從結(jié)構(gòu)上大致分為兩類:致密固體材料和多孔固體材料。致密固體材料,主要是磁,電,多鐵性等性能的材料,包括熱電材料,超導(dǎo)材料,鐵電材料(多鐵性材料),儲氫材料(能源材料)、復(fù)合材料(納米隱身復(fù)合材料)等。多孔固體材料,主要是能量轉(zhuǎn)換與儲存性能的材料,如:催化劑、蓄電池材料、儲氫材料、燃料電池、光電池、發(fā)光材料、透明導(dǎo)體、隱身材料等。
材料的特性與原子或分子的結(jié)構(gòu)、排列及其運動狀態(tài)密切相關(guān)。因此,要研究材料的特性,必須掌握材料組成、內(nèi)部微觀粒子(原子)的空間架構(gòu)和運動規(guī)律,理解它們對材料的變形與破壞的機理。但由于原子尺度在埃量級,直接觀察非常困難。在這種背景下,對材料的原子尺度進行數(shù)值模擬就顯得越來越重要。
利用計算機技術(shù)進行材料設(shè)計是發(fā)展新型材料的重要手段。材料設(shè)計通常分為3個層次。第一個是微觀層次,即運用量子力學(xué)與量子統(tǒng)計力學(xué)來研究原子或分子的集體行為。第二個是介微層次,其大小在微米以上,研究的是許多原子或分子在一定范圍內(nèi)的平均性質(zhì),如形變、磁性等,一般用連續(xù)統(tǒng)計方程來描述。第三個層次是宏觀層次,如宏觀性能、生產(chǎn)流程與使用性能間的關(guān)系,材料的斷裂以及微觀結(jié)構(gòu)的形成等一般采用分子動力學(xué)模擬。
計算機技術(shù)可以把3個層次的因素都考慮在內(nèi),通過建立模型(獲取不同層數(shù)的數(shù)值參數(shù),需要分別建立與之相適應(yīng)的計算模型),然后進行計算和分子模擬。在此基礎(chǔ)上,通過進行原子(或分子)替換和結(jié)構(gòu)優(yōu)化,得出符合預(yù)期性能的新材料的最佳成分、最佳結(jié)構(gòu)以及最合理的工藝流程。計算機的高速計算能力、巨大的存儲能力和邏輯判斷能力與人的創(chuàng)造能力相結(jié)合,可對材料設(shè)計提出創(chuàng)造性的構(gòu)思方案。
在材料研究方面,越來越多地采用QM/MM法。QM方法可以應(yīng)用于研究化學(xué)反應(yīng),配位數(shù)的變化,而MM的方法可應(yīng)用于經(jīng)典粒子間的相互作用。在使用QM/MM方法時,重要的是,需要仔細考慮QM方法結(jié)合在MM的環(huán)境。
研究晶體(包括導(dǎo)體、絕緣體和半導(dǎo)體的晶體)電子的狀態(tài)及其運動性質(zhì),離不開能帶理論。能帶理論認為晶體中的電子是在整個晶體內(nèi)運動的共有化電子,并且共有化電子是在晶體周期性的勢場中運動;結(jié)果得到:共有化電子的本征態(tài)波函數(shù)是Bloch函數(shù)形式,能量是由準(zhǔn)連續(xù)能級構(gòu)成的許多能帶。能帶理論在闡明電子在晶格中的運動規(guī)律、固體的導(dǎo)電機構(gòu)、合金的某些性質(zhì)和金屬的結(jié)合能等方面取得了重大成就。為了更準(zhǔn)確的能帶結(jié)構(gòu)的方法的需要,必須開發(fā)更有效的算法。
構(gòu)效關(guān)系研究
世界萬物的性質(zhì)在一定條件下是由其結(jié)構(gòu)決定的,這就是構(gòu)效關(guān)系研究的基礎(chǔ)。無論是藥物還是材料,有什么樣的結(jié)構(gòu),就可能具有什么樣的性質(zhì)和效果。藥物的構(gòu)效關(guān)系分析始于20世紀(jì)60年代Hansch所建立的方程

后來發(fā)展了分子力學(xué)和量子化學(xué)方法計算的參數(shù)與藥物的藥效進行相關(guān)分析,建立了含有量子參數(shù)的構(gòu)效關(guān)系方程,使這方的研究又前進了一大步。20世紀(jì)80年代末90年代初,又推出了比較分子場分析等三維定量構(gòu)效關(guān)系方法,是構(gòu)效關(guān)系研究又上一個新臺階。
目前藥物分子設(shè)計與構(gòu)效關(guān)系研究,正在結(jié)合組合化學(xué)、高通量與高容量篩選及機器人篩選等新技術(shù),推動有機化學(xué)及藥物化學(xué)日新月異的發(fā)展。
計算化學(xué)任務(wù)之二:計算機輔助智能化化學(xué)結(jié)構(gòu)解析
化學(xué)結(jié)構(gòu)解析,即未知化合物結(jié)構(gòu)的測定。它包含兩個方面的內(nèi)容。其一是合成化合物的結(jié)構(gòu)測定。由于合成化合物是人們按照可能存在某種符合自己設(shè)想性能的化合物結(jié)構(gòu)進行設(shè)計,所設(shè)計的化合物一般都是根據(jù)已有的化學(xué)反應(yīng)知識和合成規(guī)則進行合成。由于有前體化合物的結(jié)構(gòu)已知,最終化合物的結(jié)構(gòu)分析可以通過幾種常規(guī)的波譜分析表征,這是比較簡單的結(jié)構(gòu)解析。其二是已知其性能的某種化學(xué)物質(zhì),如某些天然產(chǎn)物、蛋白質(zhì)、核酸等,只知其性能而不知其化學(xué)結(jié)構(gòu)和組成。
他們通常是通過提取分離、或生物制備獲得的產(chǎn)物,往往結(jié)構(gòu)十分復(fù)雜,解析其化學(xué)結(jié)構(gòu)十分困難,需要多種現(xiàn)代分析儀器進行結(jié)構(gòu)測定?,F(xiàn)代分析儀器發(fā)展已經(jīng)十分成熟的今天,即使是經(jīng)驗十分豐富的化學(xué)家,有時對復(fù)雜的未知化合物的結(jié)構(gòu)圖譜解析也束手無策。
計算機輔助解析化學(xué)結(jié)構(gòu),已經(jīng)引起了人們的高度重視。它包括兩個方面的內(nèi)容。其一是在某一或聯(lián)合使用的分析儀器,加入計算機輔助分析軟件,來幫助人們識別譜圖,獲得化學(xué)結(jié)構(gòu)式。其二是獨立的計算機結(jié)構(gòu)分析系統(tǒng),它是將各種分析儀器獲得的光譜數(shù)據(jù)進行智能化譜圖解析,自動獲得化合物結(jié)構(gòu)。
計算化學(xué)任務(wù)之三:計算機輔助合成路線設(shè)計
傳統(tǒng)的化合物合成設(shè)計通常是化學(xué)工作者根據(jù)豐富的經(jīng)驗和靈感來完成工作。但是今天,以邏輯的方法而不是單憑經(jīng)驗和直覺來設(shè)計合成路線已經(jīng)成為化學(xué)家設(shè)計合成路線的一個重要手段。雖然目前計算機合成路線設(shè)計還是初步的、輔助的,但已經(jīng)邁出了這一步,經(jīng)過幾十年的發(fā)展和完善,可以預(yù)見,計算機輔助合成路線設(shè)計將變成最重要的手段,到時可以將“輔助”兩個字去掉,成為化學(xué)合成路線設(shè)計的主要手段。
計算機輔助合成設(shè)計,包含了兩個基本方式:其一是檢索型的合成設(shè)計。即在現(xiàn)有的化學(xué)反應(yīng)數(shù)據(jù)庫中進行檢索。盡管已有大量數(shù)據(jù)可供參考,化學(xué)反應(yīng)體系的高度復(fù)雜性決定了難于用純理論方法來解決合成路線設(shè)計問題,還只能從已知知識中找出共同規(guī)律,或從類比推測中來近似地解決這些問題。其二是推理型的合成設(shè)計。包含反應(yīng)數(shù)據(jù)挖掘和反應(yīng)知識發(fā)現(xiàn)、反應(yīng)知識模型的表述和反應(yīng)知識庫的建立、化合物反應(yīng)性能的預(yù)測、化學(xué)知識的類比推理等。
檢索型合成設(shè)計,是基于現(xiàn)有的化學(xué)反應(yīng)數(shù)據(jù)庫。隨著計算機科學(xué)和技術(shù)的發(fā)展,計算機在化學(xué)領(lǐng)域中得到越來越廣泛的應(yīng)用。從最初的簡單數(shù)據(jù)處理,逐步發(fā)展到對化學(xué)結(jié)構(gòu)的處理,以及目前的對化學(xué)信息的綜合分析、知識獲取和應(yīng)用。其中化學(xué)數(shù)據(jù)庫對化學(xué)工作者有著非常重要的作用和意義?;瘜W(xué)反應(yīng)數(shù)據(jù)庫是從事化學(xué)合成的科技人員獲取化合物合成信息的有效途徑。數(shù)據(jù)庫中存儲著大量的已合成或發(fā)表的化合物的合成信息,根據(jù)這些信息,計算機通過來選擇設(shè)計新的合成路線。同時人們憑經(jīng)驗和知覺,或者通過計算機分析來優(yōu)化合成路線,達到合成步驟少、合成總產(chǎn)率高、原料簡單便宜易得的目的。
推理型的合成設(shè)計,是基于計算機輔助合成設(shè)計系統(tǒng),它是由反應(yīng)知識庫和反應(yīng)合成分析兩部分組成。首先計算機對用戶提供的化合物結(jié)構(gòu)進行分析,以確定該化合物的合成反應(yīng)策略;再利用反應(yīng)知識庫中的反應(yīng)知識和反應(yīng)規(guī)則分析,以確定該化合物的前體。循環(huán)進行這二步操作,以最終獲得起始反應(yīng)原料為止。通過對這個循環(huán)過程路線的記錄,便可得到一組可參考的該化合物合成路線的信息,這些信息輔助化學(xué)工作者的合成設(shè)計工作,以提高他們工作效率,并降低各個方面的消耗。
反應(yīng)知識庫,是一個開放式的數(shù)據(jù)庫,在擁有目前已知的化學(xué)反應(yīng)知識,包括的化學(xué)反應(yīng)類型、反應(yīng)機理、合成方法等,同時對于新發(fā)現(xiàn)的反應(yīng)知識不斷擴充到庫中。而反應(yīng)合成分析,是計算機對人們輸入計算機的化合物結(jié)構(gòu),經(jīng)過合成反應(yīng)策略分析和確定后,通過反應(yīng)知識庫分析和所建立的數(shù)學(xué)模型的求解演算進行智能化的取舍,經(jīng)過記錄、分析、推斷、歸納、判斷這一整體的分析系統(tǒng),即是邏輯推理過程,最后獲得若干個反應(yīng)路線。人們可以根據(jù)自己的合成實踐經(jīng)驗、方法的熟練程度、實驗室或工業(yè)生產(chǎn)的合成條件、原料性質(zhì)和原料的價格,通過人機對話,優(yōu)選一條合成路線。
未來的計算機合成路線的發(fā)展,除了進一步對推理型的合成設(shè)計充實和完善外,還應(yīng)當(dāng)對包含化學(xué)反應(yīng)動力學(xué)的分析,即對所設(shè)計的合成路線的每一步反應(yīng),提出最佳的反應(yīng)條件,如:反應(yīng)物的摩爾比、催化劑選擇和用量、溶劑選擇和用量、反應(yīng)溫度、反應(yīng)壓力、反應(yīng)時間、隔氧隔濕建議、可能的副產(chǎn)物、產(chǎn)物提取方案和純化方案等等,甚至還要提出注意事項特別是反應(yīng)過程容易發(fā)生易燃易爆有毒等危險的注意事項。
計算化學(xué)應(yīng)用前景
通過對具體的分子系統(tǒng)進行理論分析和計算,能比較準(zhǔn)確地回答有關(guān)穩(wěn)定性、反應(yīng)機理等化學(xué)問題。目前計算化學(xué)已被廣泛用于化學(xué)合成、材料、催化和生物化學(xué)等研究領(lǐng)域。
計算化學(xué)在生物化學(xué)方面的應(yīng)用,有金海曉等 [38] 采用計算化學(xué)方法探明蛋白激酶在水溶液中的動態(tài)行為,包括磷酸化對蛋白激酶構(gòu)象的影響、磷?;D(zhuǎn)移機理以及蛋白激酶與抑制劑的作用模式等,這些工作為合理設(shè)計藥物提供了參考。
此外,曹冉等 [39] 對計算化學(xué)方法在基于受體結(jié)構(gòu)的藥物分子設(shè)計中的多種應(yīng)用,包括小分子結(jié)合位點的成藥性評估、化合物數(shù)據(jù)庫的虛擬篩選、先導(dǎo)化合物的結(jié)構(gòu)優(yōu)化等進行了探討。
計算化學(xué)在化學(xué)合成上多用于化合物的理論計算結(jié)果與其實驗結(jié)果的對比。如邢波等 [40] 用GaussView軟件模擬苯的分子結(jié)構(gòu),用量子化學(xué)計算軟件Gaussian 03W的密度泛函法,在B3LYP/6-31G基組水平上,優(yōu)化苯分子結(jié)構(gòu)、計算能量和頻率,及其紅外光譜,并與實驗結(jié)果對比。
根據(jù)成鍵軌道(natural bond orbital, BO)和電子密度計算結(jié)果,探討苯的穩(wěn)定性,分子軌道能量,原子靜電荷分布規(guī)律和前沿分子軌道組成的特征,計算得出HOMO和LUMO的能量差是0.25191 eV,HOMO是比較大的負值(?0.24819 eV),說明苯有較好的穩(wěn)定性,看來采用納米TiO2光催化方法降解苯是可行的。邢波等還 [41] 通過應(yīng)用計算化學(xué)軟件Gaussian 03WHF方法中的3—21G基組優(yōu)化苯和甲苯分子結(jié)構(gòu),預(yù)測苯和甲苯分子的紅外光譜。找到苯環(huán)振動吸收峰分別是苯紅外圖中的1658 cm。
與甲苯紅外圖中的1667 cm~。與苯和甲苯文獻檢索紅外譜圖相對應(yīng)(特征吸收峰分別是1478和1485 cm?1),符合較好。還找到苯環(huán)C-H拉伸振動吸收峰3080 cm?1 (苯)和3040 cm?1 (甲苯)。此外,還有對多種類似化合物進行化學(xué)計算進行對比,如盛旭玲 [42] 采用Materials Studio軟件中的DMol^3模塊,對18種苯的二取代在藥物研發(fā)過程中手性化合物絕對構(gòu)型的確定是一個極其重要的問題,藥物分子的立體構(gòu)型與藥物的療效、毒性密切相關(guān),因此,藥物分子立體結(jié)構(gòu)的研究具有重要意義。
目前,手性化合物立體結(jié)構(gòu)的研究方法也倍受關(guān)注,運用計算化學(xué)方法確定手性化合物的立體構(gòu)型是一種簡便而有效的方法,已經(jīng)被越來越多的研究者接受并采用。王重娟等 [43] 利用計算化學(xué)方法,對旋光計算、電子圓二色譜(ECD)計算、振動圓二色譜(VCD)計算,以及13C-核磁共振(13C-NMR)計算等方法進行綜述。為了在化學(xué)領(lǐng)域中更好地應(yīng)用微波能,需要深入研究微波與化學(xué)反應(yīng)相互作用的機理,由于等效介電系數(shù)常常被用來描述在化學(xué)反應(yīng)中微波的吸收和傳輸情況,因而,化學(xué)反應(yīng)中反應(yīng)物的等效介電系數(shù)就成為微波化學(xué)研究的關(guān)鍵問題之一。
華偉等 [44] 基于反應(yīng)溶液中單位體積內(nèi)的分子個數(shù)隨溫度變化的情況對黃卡瑪提出的經(jīng)驗公式進行了改進。以碘化鉀和高錳酸鉀兩個氧化還原反應(yīng)為例,對實驗結(jié)果和計算結(jié)果進行了分析比較,結(jié)果表明其具有很好的一致性,而且計算精度較改進前的公式得到了改善。
計算化學(xué)在對天然產(chǎn)物絕對構(gòu)型的確定上也有重要應(yīng)用。由于傳統(tǒng)方法在天然產(chǎn)物絕對構(gòu)型確定方面存在一定局限性和不足,而大部分工作交由計算機完成的計算化學(xué)方法,在保持同樣高精確度的基礎(chǔ)上,可以節(jié)約大量時間。李楨等 [45] 文章中有多個應(yīng)用兩種或多種計算光譜法相結(jié)合在天然產(chǎn)物絕對構(gòu)型確證的實例,表明計算化學(xué)方法在天然產(chǎn)物研究中已經(jīng)逐漸被認可。
目前計算化學(xué)的研究已經(jīng)取得了很大的成果,其對化學(xué)學(xué)科的發(fā)展影響是巨大的。隨著化學(xué)理論的不斷發(fā)展,以及計算機性能的迅猛發(fā)展,計算化學(xué)通過對涵蓋若干公理的一個系統(tǒng)方程的求解,解決化學(xué)的問題。它不依賴傳統(tǒng)化學(xué)實驗儀器設(shè)備、試劑和藥品,是建立在理論的演繹思維的基礎(chǔ)上的電腦模擬。計算化學(xué)的第一原理是具有公理結(jié)構(gòu)的,經(jīng)過數(shù)學(xué)和邏輯演繹而得到關(guān)于物質(zhì)的形式理論體系,再從形式理論出發(fā)利用物理假設(shè)出發(fā),利用物理模型近似,二次形式化和計算,得到理論預(yù)計值,最后在再去與實驗結(jié)果核對。因此,以量子力學(xué),統(tǒng)計力學(xué)為核心的計算化學(xué)在理論化學(xué)與實驗化學(xué)之間起到了很大作用。
虛擬現(xiàn)實
計算化學(xué)是理論化學(xué)的執(zhí)行者,而根據(jù)現(xiàn)實的化學(xué)實驗環(huán)境編制的仿真性軟件在計算機中營造一個接近真實環(huán)境的虛擬場景來完成各種預(yù)定的實驗任務(wù),可以驗證理論模型,同時可以幫助科研人員理解、預(yù)測和發(fā)現(xiàn)新的化學(xué)現(xiàn)象和物理本質(zhì)。這就是計算機虛擬化學(xué)實驗室。這里包含著量子化學(xué)計算和分子模擬技術(shù),對化學(xué)和生命科學(xué)領(lǐng)域的某些未知或未定問題進行科學(xué)模擬,它是在在特定數(shù)值模型的基礎(chǔ)之上,對現(xiàn)實中的化學(xué)反應(yīng)過程、物理化學(xué)過程、生命過程、化學(xué)工程的生產(chǎn)流程等實現(xiàn)仿真模擬。
各種材料都有其特性在,掌握原子結(jié)構(gòu)、排列及其運動規(guī)律,對理解材料的變形與破壞的機理是至關(guān)重要。但由于原子尺度原因,人們目前尚無法直接進行觀察。因此,對材料的多尺度進行數(shù)值模擬和仿真模擬都十分必要。
一種叫做“觸覺量子化學(xué)”,它是通過一個量子力學(xué)的計算模型程序結(jié)合到計算機感應(yīng)裝置來反饋用戶的觸覺動作的虛擬仿真。例如,你手中握著一個筆式的觸覺設(shè)備。
當(dāng)你把一個分子移向另一個分子的時候,該設(shè)備將會把你的移動反饋給計算機,此時計算機立即計算出分子之間的吸引力或排斥力。這有點類似于人們在網(wǎng)絡(luò)上打臺球時用鼠標(biāo)給臺球施加力(長按給力健)臺球的運動速度就加快感覺。于是,人們具有能夠操縱系統(tǒng)原子核坐標(biāo)的勢能面的曲率的觸覺感,讓你以一個非常直觀的方式覺察到分子的復(fù)雜信息:分子結(jié)構(gòu)、原子能量梯度、原子軌道、電子密度等等其它性質(zhì)。這種力的計算也將會讓你感覺到一個優(yōu)先的反應(yīng)路徑應(yīng)該是什么,那么你就會考慮應(yīng)該怎樣做。這顯然是一個令人興奮的設(shè)想。因為,觸覺量子化學(xué)方法能夠把人們引進了更深層次科學(xué)問題的理解。目前已經(jīng)有一些這樣可用的方法,但他們只用經(jīng)典力場來計算由設(shè)備表現(xiàn)的力,無法實現(xiàn)化學(xué)反應(yīng)過程的模擬。
由于化學(xué)反應(yīng)存在原子鍵的形成和斷裂問題,只有采用精確的量子力學(xué)計算才能實現(xiàn)這一過程。然而量子力學(xué)計算量大,十分耗時,以目前的技術(shù)水平難以實現(xiàn)真正的“觸覺量子化學(xué)”。于是,一種新的量子化學(xué)計算方法浮出水面,叫做“實時量子化學(xué)”。
為了實現(xiàn)對研究對象進行既快速又高精確性的計算,“實時量子化學(xué)”應(yīng)運而生。其是通過鼠標(biāo)、鍵盤或?qū)S幂斎牍ぞ邅眚?qū)動所研究體系中分子結(jié)構(gòu)的操作,計算機將根據(jù)量子力學(xué)的波函數(shù)和相應(yīng)能量及其梯度的活性分子體系的快速計算,其計算結(jié)果獲得實時響應(yīng),操作者感覺到?jīng)]有延遲的數(shù)據(jù)流。
“實時量子化學(xué)”實現(xiàn)實時響應(yīng),需要兩個方面條件:其一是硬件條件,需要多核并聯(lián)的中央處理器(CPU)和專用的圖形處理器(GPU),來保證顯示刷新間隔在100毫秒之內(nèi)的速度;其二是波函數(shù)求解算法的優(yōu)化,尤其是在密度泛函理論框架內(nèi)自洽場(SCF)迭代快速收斂方法,同時需要選擇合適的基組來加快計算速度的辦法。最理想的是量子計算機的應(yīng)用,可以真正滿足“實時量子化學(xué)”的快速計算要求,從而實現(xiàn)“觸覺量子化學(xué)”的化學(xué)反應(yīng)過程的實時模擬和動態(tài)仿真。
實時量子化學(xué),可能改變未來如何進行量子化學(xué)的研究方式。觸覺量子化學(xué),是人類更直觀地對現(xiàn)有的科學(xué)數(shù)據(jù)的觸覺感開發(fā)邁開的第一步,通過應(yīng)用技術(shù)的更深嵌入,已經(jīng)在虛擬現(xiàn)實領(lǐng)域朝發(fā)展這個終極目標(biāo)方向進發(fā)。
在過去的50年里,計算化學(xué)的發(fā)展如火如荼,已將化學(xué)帶入一個新時代,計算化學(xué)促進了現(xiàn)代化學(xué)研究領(lǐng)域的一場革命性的變化。當(dāng)前,計算化學(xué)已經(jīng)深入到化學(xué)研究領(lǐng)域的方方面面,正在或者將要起到“領(lǐng)軍”作用。下一步,計算化學(xué)將面臨更復(fù)雜更新的挑戰(zhàn)。
目前薛定諤方程的求解,都是基于電子結(jié)構(gòu)理論并應(yīng)用各種簡化算法方案進行求解。而含時的薛定諤方程的求解、相對論的薛定諤方程求解等工作正在展開,并開始在各方面應(yīng)用。在過去的二十年中,量子化學(xué)的另一個分支:基于原子核運動理論的薛定諤方程,已經(jīng)獲得不含時的變分法解決方案,并快速的發(fā)展,多原子體系的核運動的薛定諤方程如同電子運動的勢能面(PES)一樣的“精確”。它宣告,我們現(xiàn)在已經(jīng)處在量子化學(xué)的第四階段。
第一到第三階段主要是以電子結(jié)構(gòu)技術(shù)為主體的發(fā)展階段,而第四個階段,則是以原子核運動為主體的發(fā)展階段。在這個階段中,我們以一個準(zhǔn)確的方式將其納入到量子化學(xué)來處理原子核運動。基于電子運動和基于原子核運動的量子化學(xué)聯(lián)合求解方法,將會獲得更多的分子結(jié)構(gòu)和分子運動信息,也必將在各個應(yīng)用領(lǐng)域獲得突破性發(fā)展。
量子計算機的誕生,必將大大縮短了計算成本,從而使從頭計算的范圍大幅度的增加:從幾百個原子的微觀體系擴大到上萬個原子聚合體計算,宏觀體系的量子化學(xué)計算將成為可能。這意味著對蛋白質(zhì)、核酸等大分子的生命載體和遺傳信息載體的空間結(jié)構(gòu)研究,將會有突破性進展。
隨著后基因組時代的到來,人們開始把研究的重點轉(zhuǎn)向了功能基因組,即從基因、蛋白質(zhì)中研究生命的本質(zhì),理解結(jié)構(gòu)與功能、發(fā)育與疾病的關(guān)系。隨著計算機技術(shù)速度的大幅度提高,特別是量子計算機將要問世,“從頭預(yù)測(Ab initio)”方法將可能成為蛋白質(zhì)空間結(jié)構(gòu)的主要預(yù)測方法。因為它不依賴于已有的結(jié)構(gòu)數(shù)據(jù)信息,直接從蛋白質(zhì)序列利用分子動力學(xué)原理預(yù)測和推斷結(jié)構(gòu)信息。從而可以揭示蛋白質(zhì)的結(jié)構(gòu)與功能的關(guān)系、總結(jié)蛋白質(zhì)結(jié)構(gòu)的構(gòu)成規(guī)律、預(yù)測蛋白質(zhì)肽鏈折疊和蛋白質(zhì)的結(jié)構(gòu)等。
同時,從頭預(yù)測方法與蛋白質(zhì)的比較建模(Comparafire mode)、折疊識別(Fold recognition)、網(wǎng)絡(luò)模型和基于隱馬爾可夫模型的機器學(xué)習(xí)方法等同源模建方法相比,延伸到了生命現(xiàn)象的核心。從蛋白質(zhì)序列和三維結(jié)構(gòu)中預(yù)測其功能信息,是后基因時代的一個重要課題。但目前尚需要解決的是:蛋白-蛋白相互作用;肽和肽模擬物;分子多樣性和藥理空間;分子藥效學(xué)(意義、潛力和挑戰(zhàn));早期階段的臨床療效和安全性等。
21世紀(jì)的化學(xué)不僅要面對簡單體系,還要面對包括生命體系在內(nèi)的復(fù)雜系統(tǒng)。因此,除了研究分子的成鍵和斷鍵,即研究離子鍵和共價鍵那樣的強作用力之外,還必須考慮復(fù)雜體系中的弱相互作用力,如氫鍵、范德華力等等,而目前的密度泛函理論尚不能解決這一問題,需要進一步發(fā)展。雖然氫鍵、范德華力等作用力較弱,但由此卻組裝成分子聚集體和分子互補體系。這種超分子體系常常具有全新的性能,或者可使通常無法進行的反應(yīng)得以進行。基于分子識別觀點進行設(shè)計、合成及組建新的、有各種功能的分子、超分子及納米材料,將是未來一段時間中化學(xué)的重要研究內(nèi)容。
而深入研究控制分子的各種作用力,研究它們的本質(zhì)并深刻了解分子識別,是一個頗具重大意義也是一個充滿挑戰(zhàn)的課題。
生物大分子體系的量子化學(xué)計算一直是一個具有挑戰(zhàn)性的研究領(lǐng)域,尤其對生物大分子體系的理論研究具有重要意義。由于量子化學(xué)可以在分子、原子、電子水平上對體系進行精細的理論研究,是其它理論研究方法所難以替代的。因此要深入理解有關(guān)酶的催化作用、基因的復(fù)制與突變、藥物與受體之間的識別與結(jié)合過程及作用方式等,都很有必要運用量子化學(xué)的方法對這些生物大分子體系進行研究。
毫無疑問,這種研究可以幫助人們有目的地調(diào)控酶的催化作用,甚至可以有目的地修飾酶的結(jié)構(gòu)、設(shè)計并合成人工酶;可以揭示遺傳與變異的奧秘,進而調(diào)控基因的復(fù)制與突變,使之造福于人類;可以根據(jù)藥物與受體的結(jié)合過程和作用特點設(shè)計高效低毒的新藥等等,可見運用量子化學(xué)的手段來研究生命現(xiàn)象是十分有意義的。
化學(xué)鍵究竟是如何斷裂和重組的? 分子是怎樣吸收能量的?并是怎樣在分子內(nèi)激發(fā)化學(xué)鍵達到特定的反應(yīng)狀態(tài)的?復(fù)雜體系的化學(xué)動力學(xué)、非穩(wěn)態(tài)粒子的動力學(xué)、超快的物化過程的實時探測和調(diào)控以及極端條件下的物理化學(xué)過程都已經(jīng)成為重要的研究方向。向生命學(xué)習(xí),研究生命過程中的各種化學(xué)反應(yīng)和調(diào)控機制,正成為探索反應(yīng)控制的重要途徑,真正在分子水平上揭示化學(xué)反應(yīng)的實質(zhì)及規(guī)律將指日可待。
理論化學(xué)與功能基因組學(xué)的結(jié)合:將為預(yù)測和在分子水平上理解蛋白質(zhì)的功能,奠定了堅實的基礎(chǔ)。利用在蛋白質(zhì)結(jié)構(gòu)的特殊殘基中的固有的,特殊的,化學(xué)的和靜電的性質(zhì),進行催化或識別。這些不同尋常的性質(zhì)可以通過計算獲得,因為蛋白質(zhì)的活性位點和結(jié)合位點可以通過三維結(jié)構(gòu)精確預(yù)測。
目前,計算機的飛速發(fā)展,使計算化學(xué)在各行各業(yè)得到廣泛的應(yīng)用,逐漸與各相關(guān)學(xué)科形成了一些嶄新的邊緣或交叉學(xué)科,如微觀反應(yīng)動力學(xué),量子催化、量子電化學(xué)和量子生物學(xué)等。與生命科學(xué)、材料科學(xué)的結(jié)合將會更加有力的推動分子生物學(xué)、藥物設(shè)計、新材料的“分子設(shè)計”向縱深發(fā)展。同時,隨著學(xué)科之間的交叉和相互滲透,也將啟發(fā)我們參考、借鑒其它學(xué)科的研究方法,使其相互結(jié)合,揚長避短,走向一個新的高度。
總而言之,計算化學(xué)的目的在于理解、預(yù)言和發(fā)現(xiàn)新的化學(xué)現(xiàn)象及其物理本質(zhì)。計算化學(xué)已經(jīng)、正在引領(lǐng)未來的化學(xué)發(fā)展。因為,量子屬于物理的、也屬于化學(xué)的,屬于量子世界的,也屬于經(jīng)典世界的。