原文標(biāo)題:Predictive biology: modelling, understanding and harnessing microbial complexity
發(fā)表期刊:Nature Reviews Microbiology
發(fā)表時(shí)間:2020.05.29
第一作者:Allison J. Lopatkin
通訊作者:James J. Collins
第一單位:MIT, Cambridge, MA, USA
原文鏈接:
https://doi.org/10.1038/s41579-020-0372-5
摘要
預(yù)測(cè)生物學(xué)是合成生物學(xué)和系統(tǒng)生物學(xué)的下一個(gè)偉大篇章,特別是對(duì)微生物而言。曾經(jīng)看起來不可行的任務(wù)正在越來越多地被實(shí)現(xiàn),比如設(shè)計(jì)和實(shí)現(xiàn)復(fù)雜的合成遺傳環(huán)路,執(zhí)行復(fù)雜的感知和驅(qū)動(dòng)功能,以及組裝具有特定的、預(yù)先定義組分的多物種細(xì)菌群落。這些成就是通過整合生物學(xué)、物理學(xué)和工程學(xué)等多學(xué)科知識(shí)而實(shí)現(xiàn)的,從而對(duì)生物設(shè)計(jì)有了一個(gè)新興的、定量的理解。隨著多組學(xué)數(shù)據(jù)的持續(xù)擴(kuò)增,它們將理論轉(zhuǎn)化為實(shí)踐的潛在應(yīng)用仍然牢牢植根于支配生物系統(tǒng)的基本量化原理。本綜述討論了:
① 微生物預(yù)測(cè)生物學(xué)的關(guān)鍵研究領(lǐng)域;
② 與微生物固有的復(fù)雜性相關(guān)的挑戰(zhàn);
③ 定量方法在提升微生物學(xué)可預(yù)測(cè)性方面的重要性。
引言
在當(dāng)前的大數(shù)據(jù)時(shí)代,預(yù)測(cè)分析已經(jīng)徹底改變了我們的日常生活。預(yù)測(cè)生物學(xué)致力于基于已知輸入數(shù)據(jù)的來預(yù)測(cè)相應(yīng)的生物結(jié)果,該學(xué)科在大數(shù)據(jù)爆發(fā)的背景下應(yīng)得以快速發(fā)展。然而,在過去的幾十年里,生物學(xué)并不像我們所希望的那樣容易進(jìn)入到預(yù)測(cè)分析框架里。在最近20年里,現(xiàn)代實(shí)驗(yàn)技術(shù)應(yīng)運(yùn)而生,并能夠?qū)⒋罅康纳飻?shù)據(jù)呈現(xiàn)出來。然而,將這些數(shù)據(jù)轉(zhuǎn)化為機(jī)制性或有意義的生物學(xué)知識(shí)仍然是一項(xiàng)艱巨的、勞動(dòng)密集型的任務(wù)。最近的一項(xiàng)研究估計(jì),致力于數(shù)據(jù)分析和整合的工作可能很快就會(huì)超過最初獲得數(shù)據(jù)所需的工作量,這對(duì)從宏基因組數(shù)據(jù)中識(shí)別微生物群落動(dòng)態(tài),建立準(zhǔn)確的細(xì)菌代謝動(dòng)力學(xué)模型,或推斷基因調(diào)控網(wǎng)絡(luò)等任務(wù)構(gòu)成了挑戰(zhàn)。盡管機(jī)器學(xué)習(xí)和其它人工智能(AI)技術(shù)擅長(zhǎng)分析和檢測(cè)大數(shù)據(jù)中的趨勢(shì)和規(guī)律,但它們?cè)谔峁┖屯晟?strong>生物學(xué)解釋方面做得并不好,特別是因?yàn)檫@些關(guān)系往往是非線性的。要將這些豐富的數(shù)據(jù)轉(zhuǎn)化為具體的生物學(xué)知識(shí),需要進(jìn)行相應(yīng)詳細(xì)的定量分析。
數(shù)學(xué)模型特別適合于解決這些需求,從而成為人工智能方法的根基。由于生物系統(tǒng)具有不斷變化的性質(zhì),因此動(dòng)力學(xué)模型與預(yù)測(cè)生物學(xué)關(guān)系尤為密切,這些模型是本綜述的主要焦點(diǎn)。事實(shí)上,這些經(jīng)典的系統(tǒng)生物學(xué)模型是查詢、解釋和參數(shù)化生物網(wǎng)絡(luò)的最成熟的技術(shù)之一。此外,從生物學(xué)第一性原理推導(dǎo)出的minimal models可以作為大數(shù)據(jù)推斷的網(wǎng)絡(luò)結(jié)構(gòu)的重要確認(rèn)。因此,它們與幾十年前一樣,在今天仍然具有重要意義。因此,盡管深度學(xué)習(xí)等現(xiàn)代“黑匣子”工具很有吸引力,但我們不能忘記或忽視對(duì)潛在的生物系統(tǒng)進(jìn)行數(shù)學(xué)建模的研究;相反,它應(yīng)該被視為新興技術(shù)的一種補(bǔ)充方法。因此,我們先從動(dòng)力學(xué)系統(tǒng)建模的簡(jiǎn)要概述開始。然后,再從生物復(fù)雜性不斷增加的背景下檢查建模的有效性,從較低級(jí)別的細(xì)胞過程(例如轉(zhuǎn)錄)開始,并逐步發(fā)展到群落級(jí)別的生態(tài)和進(jìn)化動(dòng)力學(xué)。這種自下而上的建模方法突出了預(yù)測(cè)生物學(xué)目前存在的機(jī)遇和挑戰(zhàn);因此,我們討論了數(shù)學(xué)模型闡明基本生物學(xué)設(shè)計(jì)原則的關(guān)鍵例子,并討論了繼續(xù)強(qiáng)調(diào)生物系統(tǒng)潛在動(dòng)力學(xué)的迫切需要。最后,概要了生物建模中的一些挑戰(zhàn),并探索了深度學(xué)習(xí)等新技術(shù)如何與系統(tǒng)建模相結(jié)合,以實(shí)現(xiàn)預(yù)測(cè)生物學(xué)的全部潛力。
微生物動(dòng)力學(xué)建模
經(jīng)典的系統(tǒng)生物學(xué)模型已經(jīng)被證明是一個(gè)基本的工具,我們可以用它來解釋微生物的許多復(fù)雜性。這些方法通常使用微分方程通過模擬隨時(shí)間變化的生物分子濃度來描述基因調(diào)控網(wǎng)絡(luò)的動(dòng)態(tài)。直觀地說,這種方法直接將觀察到的動(dòng)態(tài)與特定的生化相互作用聯(lián)系在一起。這樣的網(wǎng)絡(luò)模型可以用來生成所提出機(jī)制的可驗(yàn)測(cè)性假設(shè),并識(shí)別最佳或可行的參數(shù)空間以實(shí)現(xiàn)所需的功能。盡管基因網(wǎng)絡(luò)的數(shù)學(xué)表示可能足以精確地模擬觀察到動(dòng)態(tài)(如在遺傳觸發(fā)開關(guān)中),但在許多情況下,單獨(dú)基因網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)本身不足以完全預(yù)測(cè)生物行為。這種脫節(jié)通常是由于網(wǎng)絡(luò)組件之間不可預(yù)見的相互作用、細(xì)胞上增加的新陳代謝負(fù)擔(dān)和生物變異性造成的。然而,越來越明顯的是,細(xì)胞生長(zhǎng)和細(xì)胞內(nèi)生化網(wǎng)絡(luò)之間的耦合給預(yù)測(cè)增加了復(fù)雜性和可變性。生物化學(xué)網(wǎng)絡(luò)模型可以很容易地解決這個(gè)問題,通過在全細(xì)胞或種群水平上整合微生物生長(zhǎng)動(dòng)力學(xué)的反饋,可以很容易地解決這個(gè)問題。為此,同一項(xiàng)研究表明,由于生長(zhǎng)抑制而導(dǎo)致的基因表達(dá)對(duì)代謝負(fù)荷的影響將非線性引入了轉(zhuǎn)錄因子動(dòng)力學(xué),并將這種反饋納入他們的模型中,解釋了觀察到的雙穩(wěn)態(tài)。具體地說,代謝負(fù)荷和正反饋循環(huán)的結(jié)合足以重建觀察到的雙穩(wěn)態(tài):在低轉(zhuǎn)錄因子水平,最低的代謝負(fù)荷意味著細(xì)胞生長(zhǎng)迅速,從而保持低熒光報(bào)告信號(hào)。相反,高水平的轉(zhuǎn)錄因子誘導(dǎo)了大量的代謝負(fù)擔(dān),從而減緩了細(xì)胞的生長(zhǎng)和增殖;這防止了報(bào)告分子的稀釋,從而保持了強(qiáng)烈的熒光信號(hào)。盡管群落動(dòng)態(tài)最容易以相對(duì)增長(zhǎng)率為特征,既方便又全面,但它們不可避免地掩蓋了可能各自影響緊急功能的復(fù)雜層次。在動(dòng)態(tài)建模的背景下,經(jīng)常需要考慮生態(tài)(選擇、競(jìng)爭(zhēng)等)或進(jìn)化(適應(yīng)、水平基因轉(zhuǎn)移等)交互作用,或者兩者兼而有之,以精確地查看、量化并最終預(yù)測(cè)自然和工程系統(tǒng)的行為。理解這些潛在過程是如何縮放和相互影響的,對(duì)于開發(fā)更精確的動(dòng)力學(xué)模型至關(guān)重要。事實(shí)上,在許多情況下,對(duì)群落水平的相互作用進(jìn)行建模已被證明是有用的,包括預(yù)測(cè)細(xì)菌系統(tǒng)中突變出現(xiàn)、同源基因交換和生態(tài)分化的影響。
對(duì)不斷增加的生物復(fù)雜性進(jìn)行建模
微生物動(dòng)力學(xué),都受基本的內(nèi)在因素(轉(zhuǎn)錄、翻譯和代謝過程)和外在因素(環(huán)境、生態(tài)和進(jìn)化)的影響(圖 1)。這些因素及其相關(guān)過程本質(zhì)上是相互依賴的,并且經(jīng)常傳播可變性和反饋,這些可變性和反饋可以決定信號(hào)通路、微生物、種群和群落層面的突發(fā)行為。下面將強(qiáng)調(diào)如何在模型復(fù)雜性的每個(gè)漸進(jìn)步驟(從轉(zhuǎn)錄到群落級(jí)動(dòng)態(tài))定量地梳理各種復(fù)合因素,這提高了我們預(yù)測(cè)、理解和設(shè)計(jì)日益復(fù)雜的生物系統(tǒng)的基本能力。正如我們將看到的,在許多情況下,建模的目標(biāo)是定量描述這些因素及其相關(guān)過程如何影響細(xì)胞適合性或微生物生長(zhǎng)動(dòng)力學(xué)。

a | 影響增長(zhǎng)動(dòng)態(tài)的內(nèi)在因素。從左至右顯示了影響總體種群動(dòng)態(tài)的內(nèi)在過程:轉(zhuǎn)錄,翻譯,新陳代謝和種群增長(zhǎng)。第一行顯示單個(gè)基因(藍(lán)色)在所有四個(gè)過程中的遺傳信息流。下面的行顯示了轉(zhuǎn)錄水平的變化(以紅色表示的第二個(gè)基因的表達(dá)來改變藍(lán)色基因的表達(dá))如何導(dǎo)致種群水平的差異。b |影響生長(zhǎng)動(dòng)力學(xué)的外在因素。以從良好的(藍(lán)色)到較差的(紅色)底物的變化為代表的環(huán)境條件可以不同地影響生長(zhǎng)表型(左)??傮w種群產(chǎn)量和單個(gè)物種的豐度受到混合群落中局部生態(tài)相互作用的影響,例如,由于第二個(gè)種群(黃色)(較高)的盛行率較高,一個(gè)種群(藍(lán)色)受到抑制。相同的初始種群根據(jù)選擇壓力的不存在(頂部)或存在(底部)而表現(xiàn)出不同的進(jìn)化動(dòng)力學(xué),此處以有利于特定遺傳變異的抗生素(Abx)為代表(右)。
轉(zhuǎn)錄
在最基本的層面上,生物網(wǎng)絡(luò)是建立在基因表達(dá)模式上的,認(rèn)識(shí)到基因網(wǎng)絡(luò)的每個(gè)單獨(dú)組成部分本質(zhì)上都限制在相同的細(xì)胞內(nèi)資源庫中,這一點(diǎn)很重要。因此,僅僅過度表達(dá)一個(gè)基因會(huì)降低其它基因的表達(dá)水平。這些隱藏的和經(jīng)常被忽視的相互作用是由于對(duì)游離核糖體和RNA聚合酶的競(jìng)爭(zhēng)而產(chǎn)生的,并導(dǎo)致全球增長(zhǎng)率發(fā)生變化,這些變化歸因于基因表達(dá)能力。數(shù)學(xué)模型已經(jīng)被用來描述這些相互作用,并基于資源限制開發(fā)了基因表達(dá)的控制策略。為了調(diào)查基因表達(dá)對(duì)生長(zhǎng)的影響,一項(xiàng)研究量化了各種不同合成結(jié)構(gòu)的全局表達(dá)負(fù)擔(dān)。這一分析表明,表達(dá)并不嚴(yán)格地與宿主的負(fù)擔(dān)成反比,這種非線性在具有強(qiáng)核糖體結(jié)合位點(diǎn)(RBS)的結(jié)構(gòu)中尤其明顯,這表明RBS的強(qiáng)度可能是基因表達(dá)能力的基礎(chǔ)。作為對(duì)這些觀察的補(bǔ)充,對(duì)體內(nèi)基因表達(dá)的模擬表明,特定的轉(zhuǎn)錄序列(例如,稀有密碼子)只減少了具有強(qiáng)大RBS的設(shè)計(jì)的翻譯。因此,作者使用他們的模型優(yōu)化了正向設(shè)計(jì),并驗(yàn)證了最大化表達(dá)效率的構(gòu)建。環(huán)境因素對(duì)基因表達(dá)的影響也會(huì)限制微生物的生長(zhǎng)。另一項(xiàng)研究測(cè)定了不同環(huán)境條件下1800個(gè)大腸桿菌啟動(dòng)子活性水平的變化,包括不同的碳源、溫度和滲透脅迫。這一方法表明,一個(gè)恒定的全局比例因子可以唯一地描述每種情況下約70-90%的基因表達(dá)變化,而不考慮特定的啟動(dòng)子。換而言之,給定啟動(dòng)子在任何兩種不同條件下的活性水平都是成正比的;而且,在絕大多數(shù)被測(cè)試的啟動(dòng)子中,這種比例的大小是保持不變的。不同潛在解釋的機(jī)制模型定量地證明了全局資源分配策略最適合實(shí)驗(yàn)數(shù)據(jù);該模型假設(shè),在每種條件下,總啟動(dòng)子活性在特定條件和全局表達(dá)的基因之間分配,從而納入了專門用于每個(gè)基因的資源的相對(duì)比例和不同條件下的生長(zhǎng)速度差異。自此,綜合的計(jì)算或?qū)嶒?yàn)研究利用了對(duì)資源分配的基本理解,更深入地探索了支配轉(zhuǎn)錄調(diào)控的特定于環(huán)境的規(guī)則,并確定了代謝有效的基因回路的設(shè)計(jì)原則。作者發(fā)現(xiàn),負(fù)反饋基序可以控制相對(duì)的資源利用(從而在表達(dá)水平上進(jìn)行權(quán)衡),提高了整體效率,并提出了一種細(xì)胞優(yōu)先考慮多個(gè)能量密集型過程的機(jī)制。在一些實(shí)例中,加入基因表達(dá)能力對(duì)于精確模擬在基因重新編譯的大腸桿菌中觀察到的模式形成是必要的,這些結(jié)果為系統(tǒng)發(fā)育中尺度不變性的機(jī)制基礎(chǔ)提供了基本的見解。
翻譯
上面討論的基因表達(dá)中固有的混雜相互作用通常在蛋白質(zhì)水平上被進(jìn)一步放大,在蛋白質(zhì)水平上,合成和細(xì)胞增殖之間存在著內(nèi)在的關(guān)系。蛋白質(zhì)約占細(xì)胞干重的50%,蛋白質(zhì)維持(如修復(fù)、周轉(zhuǎn)等)是維持代謝的主要耗能成分。因此,與基因表達(dá)一樣,翻譯帶來的新陳代謝負(fù)擔(dān)也會(huì)影響細(xì)胞的適合性。事實(shí)上,一項(xiàng)研究使用核糖體圖譜來量化蛋白質(zhì)合成的絕對(duì)速率,并揭示了基本的細(xì)胞控制策略,通過這些策略,細(xì)胞可以優(yōu)化蛋白質(zhì)的生產(chǎn),以最大限度地提高生長(zhǎng)效率。作者通過計(jì)算研究了增加l-蛋氨酸生物合成的限制步驟甲硫氨酸的產(chǎn)量和收益是否會(huì)改善總體增長(zhǎng),而不考慮成本(由于對(duì)核糖體的競(jìng)爭(zhēng))。值得注意的是,該模型預(yù)測(cè),與實(shí)驗(yàn)測(cè)量結(jié)果非常匹配的MetE參數(shù)會(huì)出現(xiàn)最佳生長(zhǎng),這表明細(xì)胞可以調(diào)整Met的產(chǎn)量,以最大限度地增加生物產(chǎn)量。事實(shí)上,作者通過實(shí)驗(yàn)證明,從基線開始,MetE產(chǎn)量的增加或減少都會(huì)降低增長(zhǎng)率。除了與生產(chǎn)相關(guān)的成本外,表達(dá)蛋白質(zhì)的好處可以直接通過它的分解代謝活性來衡量,只要它們可以單獨(dú)測(cè)量。為了量化蛋白質(zhì)活性的成本,一項(xiàng)研究建立了一個(gè)巧妙的實(shí)驗(yàn)框架,將乳糖的生產(chǎn)與降解分離;利用一個(gè)適合度的定量模型,作者表明,乳糖滲透酶活性的成本,而不是它的生產(chǎn)成本,特別說明了細(xì)胞負(fù)擔(dān)的增加。沿著這些思路,另一項(xiàng)研究通過使用無細(xì)胞系統(tǒng)來估計(jì)翻譯效率,然后將這些估計(jì)合并到增長(zhǎng)負(fù)擔(dān)模型中,以準(zhǔn)確地預(yù)測(cè)有效的構(gòu)建設(shè)計(jì),從而類似地避免了混淆的生長(zhǎng)效應(yīng)。微生物學(xué)家特別感興趣的是揭示細(xì)胞如何在不同的條件下實(shí)現(xiàn)強(qiáng)健的蛋白質(zhì)動(dòng)態(tài)平衡,以及這如何轉(zhuǎn)化為整體的健康狀況。從基礎(chǔ)生物學(xué)和翻譯的角度來看,對(duì)這些功能能力進(jìn)行建模的能力都會(huì)產(chǎn)生影響:可靠地調(diào)節(jié)這些網(wǎng)絡(luò)可以讓我們對(duì)合成系統(tǒng)中的蛋白質(zhì)表達(dá)進(jìn)行更精細(xì)的控制,而促進(jìn)錯(cuò)誤折疊可能是一種替代策略。為此,對(duì)蛋白質(zhì)組水平上的資源分配的定量分析和建模揭示了使有效增長(zhǎng)最大化的各種控制策略。在動(dòng)態(tài)變化或惡劣的環(huán)境條件下,這些原則對(duì)于預(yù)測(cè)或優(yōu)化生長(zhǎng)和其他表型特別有用。使用通量受限模型來預(yù)測(cè)代謝表型和干預(yù)策略;雖然這種模型主要依賴于基因組規(guī)模的框架,因此不在本綜述的范圍內(nèi),但仍然必須注意,當(dāng)動(dòng)力學(xué)速率和半最大常數(shù)等其它代謝參數(shù)難以實(shí)驗(yàn)估計(jì)時(shí),這些簡(jiǎn)化的方法可能特別有用。上述研究表明,基于基本控制策略而不是基于特定的速率參數(shù)來建立模型,可以確保模型在廣泛的生理設(shè)置中保持預(yù)測(cè)值。這些研究工作表明,我們利用本地細(xì)菌網(wǎng)絡(luò)實(shí)現(xiàn)外部控制和工程設(shè)計(jì)的能力日益增強(qiáng);隨著我們對(duì)基本知識(shí)的理解不斷進(jìn)步,集成程度越來越高的模型可能會(huì)大量涌現(xiàn)。
代謝
代謝活動(dòng)對(duì)生長(zhǎng)(如生物量生產(chǎn))和非生長(zhǎng)維持功能(如應(yīng)激反應(yīng)、滲透調(diào)節(jié)等)都有影響,因此,描述代謝特異性效應(yīng)很容易被生長(zhǎng)動(dòng)力學(xué)所混淆。事實(shí)上,細(xì)胞在單一基質(zhì)上生長(zhǎng)的經(jīng)典Monod模型理想地描述了允許生長(zhǎng)環(huán)境中的動(dòng)力學(xué),適用于廣泛的理論和實(shí)驗(yàn)研究。然而,面對(duì)營(yíng)養(yǎng)限制或其它抑制環(huán)境,在這些環(huán)境中,新陳代謝致力于生存而不是生長(zhǎng),通常需要額外的復(fù)雜性來解釋種群行為;當(dāng)細(xì)菌受到各種壓力或快速變化的條件時(shí),這一點(diǎn)尤其相關(guān)。
恒化器實(shí)驗(yàn)促進(jìn)了這種維持代謝物的量化,并將這些內(nèi)源性代謝率納入生長(zhǎng)模型,使我們能夠梳理出代謝特異性依賴項(xiàng)。例如,雖然抗生素效力隨著細(xì)菌生長(zhǎng)速度呈線性增加,但我們開發(fā)并實(shí)驗(yàn)驗(yàn)證了一個(gè)數(shù)學(xué)模型,該模型表明,當(dāng)生長(zhǎng)和新陳代謝分離時(shí),抗生素的致死性取決于治療時(shí)的細(xì)菌代謝狀態(tài),而不是生長(zhǎng)速度。我們的工作表明,最初藥物-靶點(diǎn)相互作用后的代謝反應(yīng)驅(qū)動(dòng)了細(xì)菌對(duì)抗生素暴露的許多方面的反應(yīng),并揭示了一個(gè)代謝閾值,低于這個(gè)閾值,抗生素的致死性可以忽略不計(jì)。
將代謝通量分析與底物動(dòng)力學(xué)相結(jié)合的研究已經(jīng)為控制微生物生長(zhǎng)的規(guī)律提供了強(qiáng)大的進(jìn)化洞察力,并突出了混合計(jì)算模型的價(jià)值。這些發(fā)現(xiàn)和分析提供了對(duì)新陳代謝適應(yīng)各種環(huán)境刺激的時(shí)間動(dòng)力學(xué)和調(diào)節(jié)可塑性的洞察力。作者觀察到,對(duì)于某些糖的組合,每個(gè)系統(tǒng)的激活是同時(shí)發(fā)生的,而不是順序的。這不能用一個(gè)簡(jiǎn)化的模型來解釋,該模型將適合度作為生長(zhǎng)的函數(shù)進(jìn)行優(yōu)化,這表明多模態(tài)適合度可能是雙重糖利用的基礎(chǔ)。這些發(fā)現(xiàn)可以為未來在實(shí)驗(yàn)室或自然環(huán)境中控制微生物生長(zhǎng)的策略提供依據(jù),例如通過調(diào)節(jié)外源糖的組成來強(qiáng)制執(zhí)行所需的預(yù)先確定的生長(zhǎng)曲線。
深入了解代謝策略的調(diào)控機(jī)制,對(duì)于實(shí)現(xiàn)目標(biāo)函數(shù)最優(yōu)化的合成生物學(xué)和代謝工程應(yīng)用(例如,有效利用有限的資源),以及理解特定環(huán)境與其同源微生物群落之間的相互作用具有重要意義。事實(shí)上,新陳代謝在定義和塑造自然環(huán)境(如腸道微生物)中微生物種群的相互作用網(wǎng)絡(luò)中起著重要作用。
微生物群落水平動(dòng)力學(xué):生態(tài)與進(jìn)化過程
到目前為止,我們主要是在單個(gè)微生物的背景下討論生物復(fù)雜性。然而,正是這些個(gè)體細(xì)胞的集體效應(yīng)及其潛在的動(dòng)態(tài)決定了新出現(xiàn)的種群水平和群落水平的行為。一個(gè)典型的群體通常包含生化和遺傳水平的異質(zhì)性。這種變異性可以導(dǎo)致新出現(xiàn)的、多樣化的生態(tài)和進(jìn)化動(dòng)態(tài),包括競(jìng)爭(zhēng)、免受壓力保護(hù)、群落穩(wěn)定、結(jié)構(gòu)化環(huán)境中的合作、利他行為和水平基因轉(zhuǎn)移等等。微生物生態(tài)學(xué)和進(jìn)化的全部廣度和深度超出了本綜述的范圍。因此,在本節(jié)中,我們討論細(xì)菌種群和日益復(fù)雜的群落中的異質(zhì)性,突出說明對(duì)這種效應(yīng)進(jìn)行建模如何揭示了對(duì)微生物行為的基本洞察力的精選實(shí)例。
如上所述,由于固有的生物化學(xué)噪聲,即使是克隆種群也可能表現(xiàn)出異質(zhì)性,這可能導(dǎo)致復(fù)雜的種群水平動(dòng)態(tài)。這些效應(yīng)及其后果已經(jīng)得到了深入的研究,特別是在進(jìn)化和基因表達(dá)的隨機(jī)模型的支持下。這些模型已經(jīng)證明,噪聲引起的波動(dòng)可以通過生物網(wǎng)絡(luò)傳播,從而決定行為。將這樣的方法與反饋環(huán)和其他放大機(jī)制相結(jié)合,已經(jīng)產(chǎn)生了微生物模型,這些模型解釋了生長(zhǎng)動(dòng)力學(xué)中意想不到的實(shí)驗(yàn)觀察,包括總體適合度的增加或細(xì)胞大小的瞬時(shí)振蕩。生化異質(zhì)性也會(huì)極大地影響細(xì)菌對(duì)生態(tài)紊亂的直接反應(yīng)。在某些情況下,這種噪音可以被特定的基因網(wǎng)絡(luò)放大,作為非線性決策的一種形式。
與生化噪聲模型相比,理解遺傳異質(zhì)種群或群落的動(dòng)態(tài)是一個(gè)相對(duì)較新且未得到充分認(rèn)識(shí)的挑戰(zhàn);事實(shí)上,宏基因組學(xué)的出現(xiàn)直到最近才揭示了原位微生物群落的多樣性和復(fù)雜性。盡管如此,面對(duì)這種變異性,建模已經(jīng)被證明是推斷微生物群落組裝、功能和長(zhǎng)期動(dòng)態(tài)規(guī)律的一種特別有效的工具。不同的建??蚣芤呀?jīng)被用來基于較小的物種相互作用集推導(dǎo)出多物種組裝原理,這是預(yù)測(cè)復(fù)雜微生物繁殖動(dòng)態(tài)的第一步。這種方法揭示了特定的生態(tài)相互作用網(wǎng)絡(luò),可以解釋多物種群落內(nèi)的共存。
除生態(tài)因素外,一個(gè)群落的長(zhǎng)期命運(yùn)天生就取決于隨著時(shí)間的推移對(duì)其它種群和當(dāng)?shù)丨h(huán)境的適應(yīng)。這些進(jìn)化動(dòng)態(tài)可能導(dǎo)致意想不到的緊急特性。整合了生態(tài)和進(jìn)化過程的不同模型揭示了隨著時(shí)間的推移,這種反饋是如何約束或促進(jìn)穩(wěn)定的群落的。研究表明,盡管進(jìn)化是隨機(jī)的,但只要有了群落構(gòu)建和環(huán)境適應(yīng)的知識(shí),就可以預(yù)測(cè)到進(jìn)化。為此,最近的工作導(dǎo)出了簡(jiǎn)單的【粗粒度統(tǒng)計(jì)定律粗粒度模型 (baidu.com)】,這些定律可以用來描述群落動(dòng)態(tài),而不是動(dòng)力學(xué)建模;這樣的模型可以被利用來產(chǎn)生長(zhǎng)期預(yù)測(cè),而不需要完全知情的機(jī)械論基礎(chǔ)。
鑒于有助于微生物聯(lián)合體組裝和穩(wěn)定的無數(shù)相互作用和可變性來源,將模型指導(dǎo)的方法和高通量實(shí)驗(yàn)平臺(tái)相結(jié)合,可能有助于捕獲全面的潛在動(dòng)態(tài),從而提高我們的預(yù)測(cè)能力。
由于自然選擇是在表型水平上進(jìn)行的,因此生化異質(zhì)性和遺傳異質(zhì)性內(nèi)在地聯(lián)系在一起也就不足為奇了。生物化學(xué)變異性會(huì)影響微生物種群的長(zhǎng)期進(jìn)化結(jié)果,這取決于特定的環(huán)境。例如,一項(xiàng)研究表明,在周期性使用抗生素的情況下,隨機(jī)產(chǎn)生的‘滯后時(shí)間’(細(xì)胞分裂時(shí)間)延長(zhǎng)的突變體被選中。作者使用一個(gè)模型來預(yù)測(cè)滯后時(shí)間將被優(yōu)化,以匹配抗生素暴露的持續(xù)時(shí)間;這些預(yù)測(cè)與實(shí)驗(yàn)測(cè)量結(jié)果密切匹配,為進(jìn)化動(dòng)力學(xué)提供了至關(guān)重要的見解。
微生物對(duì)抗生素治療的反應(yīng)和隨后的耐藥性突變的進(jìn)化被合并到一個(gè)單一的數(shù)學(xué)框架中。這體現(xiàn)了預(yù)測(cè)復(fù)雜微生物群落動(dòng)態(tài)的主要挑戰(zhàn)之一:鑒于微生物基因組相對(duì)較小,以及它們的快速增殖和突變率,生態(tài)相互作用(例如,對(duì)擾動(dòng)的反應(yīng))往往與進(jìn)化變化同時(shí)發(fā)生。事實(shí)證明,建模在區(qū)分這些方面特別有用,提供了對(duì)每個(gè)過程的主要影響因素的基本見解。
挑戰(zhàn)與機(jī)遇
顯然,自然微生物系統(tǒng)和合成微生物系統(tǒng)的復(fù)雜性都因生物控制、生物分子可變性、網(wǎng)絡(luò)水平和基于種群的相互作用而變得更加復(fù)雜。各種各樣的建模策略使我們能夠?qū)崿F(xiàn)對(duì)這些系統(tǒng)的一定程度的可預(yù)測(cè)性和可控性。然而,隨著實(shí)驗(yàn)?zāi)芰涂捎脭?shù)據(jù)的廣度不斷增加,下一代生物模型將需要以更加深思熟慮和優(yōu)化的方式進(jìn)行設(shè)計(jì)。事實(shí)上,如上所述,增加模型復(fù)雜性并不一定會(huì)帶來更高的受益或準(zhǔn)確性。模型不應(yīng)包含盡可能多的復(fù)雜性,而應(yīng)基于明確定義的、具有生物學(xué)意義的假設(shè),基于對(duì)潛在混雜因素和周圍生物學(xué)背景的理解。在某些情況下,半機(jī)械式或粗粒度框架可能更適合于建立管理觀察到的微生物行為的一般規(guī)則。
就像軟件、架構(gòu)或產(chǎn)品設(shè)計(jì)一樣,建模應(yīng)該被認(rèn)為是形式遵循功能的情況-最低限度可行的、適合目的的模型是理想的,因?yàn)樗鼈兂浞置枋隽烁信d趣的動(dòng)態(tài),同時(shí)保持直觀和易懂。在實(shí)踐中,復(fù)雜性和抽象性之間的權(quán)衡通常由實(shí)驗(yàn)驗(yàn)證反復(fù)提供信息。盡管人們可以想象某些“經(jīng)驗(yàn)法則”,例如,在研究繁重的網(wǎng)絡(luò)時(shí)加入增長(zhǎng)動(dòng)力學(xué),或者在拓?fù)浣Y(jié)構(gòu)顯示非線性時(shí)整合噪聲效應(yīng),但最終還是要由建模者來確定可靠地捕捉感興趣的生物現(xiàn)象所需的尺度。
如上所述,預(yù)測(cè)性建模促進(jìn)了我們對(duì)生物學(xué)理解的許多進(jìn)步,展示了它的實(shí)用性。然而,隨著該領(lǐng)域的發(fā)展,目前仍然存在一些技術(shù)和概念上的挑戰(zhàn),這些挑戰(zhàn)限制了我們對(duì)復(fù)雜生物系統(tǒng)基礎(chǔ)知識(shí)的范圍和細(xì)節(jié)。在許多情況下,可以立即利用數(shù)學(xué)建模方法來開始解決這些缺點(diǎn)。在本節(jié)中,我們確定了認(rèn)為是預(yù)測(cè)生物學(xué)領(lǐng)域的關(guān)鍵限制的四個(gè)主要挑戰(zhàn),特別強(qiáng)調(diào)合成生物學(xué)和系統(tǒng)生物學(xué)。我們將討論每個(gè)挑戰(zhàn)的代表性方面和示例,并強(qiáng)調(diào)合并建??赡芴貏e有益的方式。
與前面關(guān)于復(fù)雜性的討論一樣,這些挑戰(zhàn)通常是建立在彼此的基礎(chǔ)上并相互促進(jìn)的。此外,我們特別提醒要警惕越來越多地使用先進(jìn)的計(jì)算技術(shù),包括機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。正如引言中提到的,更經(jīng)典的建模與這些基于人工智能的方法的集成代表了數(shù)量生物學(xué)令人興奮的新途徑,但必須以理性、知情的方式使用。事實(shí)上,我們認(rèn)為,強(qiáng)調(diào)動(dòng)力系統(tǒng)建模和下一代機(jī)器學(xué)習(xí)各自優(yōu)勢(shì)的混合策略代表了預(yù)測(cè)生物學(xué)的未來。
1. 預(yù)測(cè)復(fù)雜的基因網(wǎng)絡(luò)動(dòng)力學(xué)
即使在幾十年的進(jìn)步之后,準(zhǔn)確預(yù)測(cè)潛在的基因調(diào)控網(wǎng)絡(luò)(無論是自然的還是人工的)所決定的細(xì)菌細(xì)胞動(dòng)力學(xué)仍然是一個(gè)重大的挑戰(zhàn),因此我們?cè)谶@里首先討論它。隨著基因通路變得越來越復(fù)雜,由于細(xì)胞內(nèi)的混雜因素以及對(duì)環(huán)境條件的敏感性增加,預(yù)測(cè)它們的動(dòng)態(tài)變得相應(yīng)地變得更加困難。這些困難隨著異質(zhì)性的增加而進(jìn)一步加劇,即使在進(jìn)化不是重要考慮的短時(shí)間跨度內(nèi)也是如此。盡管有這些挑戰(zhàn),基因通工程的進(jìn)步,與建模方法相結(jié)合,為這個(gè)領(lǐng)域的未來提供了一幅藍(lán)圖。
最先進(jìn)的合成基因通路的精確度和復(fù)雜性達(dá)到了前所未有的水平。展望未來,要實(shí)現(xiàn)明確定義的行為,將需要優(yōu)化通路本身的生物物理約束,最小化不想要的次要影響(例如,資源負(fù)擔(dān)或噪聲),并擴(kuò)展附帶的模型以考慮種群間的相互作用。隨著特征明確的遺傳部分、以及快速無細(xì)胞組裝方法的出現(xiàn),這變得越來越有可能,從而產(chǎn)生高度復(fù)雜和分層的通路。繼續(xù)挖掘和表征生物分子成分,以及建立報(bào)告最優(yōu)組裝配置的方法,將效率限制降至最低,這將確保即使微生物工程的范圍擴(kuò)大,模型仍保持直觀和信息豐富。
除了基因通路本身的組成部分之外,具有明確敏感性和精算功能的特征良好的微生物群落的文庫(例如,基因通路的種群水平類似物)可以允許模塊化的群落組裝,就像它們的基因通路前身一樣。盡管有一些這方面的研究了,但還需要做大量的工作來系統(tǒng)地定義這些生態(tài)單位(例如,隔離、基因通路、環(huán)境或某種組合),并實(shí)現(xiàn)它們的系統(tǒng)表征。
2. 大規(guī)模數(shù)據(jù)的推論和參數(shù)化
最終,預(yù)測(cè)種群動(dòng)態(tài)的能力取決于從日益龐大的數(shù)據(jù)集中發(fā)現(xiàn)具有生物學(xué)意義的見解。雖然大型計(jì)算基礎(chǔ)設(shè)施可訪問性的提高使我們有能力開始探索這些數(shù)據(jù)集,但隨之而來的是巨大的挑戰(zhàn)。這些挑戰(zhàn)之一,也是我們提出的第二個(gè)挑戰(zhàn)是,由下一代和高通量技術(shù)產(chǎn)生的數(shù)據(jù)集的巨大規(guī)??赡軙?huì)導(dǎo)致不可預(yù)見的協(xié)變量或因素,模糊了生物學(xué)意義和統(tǒng)計(jì)意義之間的區(qū)別。機(jī)器學(xué)習(xí)方法非常適合于處理大數(shù)據(jù)集,以前的研究已經(jīng)使用這些方法來整合和搜索大量類型和數(shù)量的數(shù)據(jù),以提取感興趣的特定特征,如識(shí)別網(wǎng)絡(luò)體系結(jié)構(gòu)。然而,機(jī)器學(xué)習(xí)模型容易出現(xiàn)過擬合、偏差和不可解釋性,導(dǎo)致模型結(jié)構(gòu)難以在體外驗(yàn)證或缺乏預(yù)測(cè)價(jià)值。
3. 合適的模型參數(shù)化和抽象化
因此,第三個(gè)關(guān)鍵的和相關(guān)的挑戰(zhàn)是如何有效地從大數(shù)據(jù)集中提取準(zhǔn)確的、生物相關(guān)的參數(shù)。有許多方法可以將機(jī)器學(xué)習(xí)和人工智能與動(dòng)態(tài)建模方法相結(jié)合,以提高向前推進(jìn)的參數(shù)估計(jì)的可靠性。也許其中最能實(shí)現(xiàn)的是使用算法來抽象和簡(jiǎn)化建模方法。例如,使用人工智能方法發(fā)現(xiàn)的生物關(guān)系可以用來簡(jiǎn)化后續(xù)的(半)機(jī)械模型,理想地減少所需參數(shù)的數(shù)量和/或獲得可靠數(shù)值的難度。事實(shí)上,一項(xiàng)研究使用支持向量機(jī)方法推導(dǎo)出一個(gè)簡(jiǎn)化的標(biāo)準(zhǔn),該標(biāo)準(zhǔn)在沒有明確描述潛在的互惠作用的情況下預(yù)測(cè)一般互惠群體的結(jié)果(共存或崩潰)。通過模擬和實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了抽象判據(jù)的預(yù)測(cè)性。這種簡(jiǎn)化方法也可以應(yīng)用于相反的方向-機(jī)械模型可以用來約束自動(dòng)算法探索的交互空間。對(duì)于必須同時(shí)考慮生態(tài)和進(jìn)化壓力的混合微生物群落模型,精確參數(shù)估計(jì)的重要性尤為明顯。在這些模型中,僅梳理和合并相關(guān)屬性對(duì)于得出有用和可翻譯的見解至關(guān)重要。結(jié)合適當(dāng)抽象的模型,采用創(chuàng)新的實(shí)驗(yàn)方法,例如生長(zhǎng)率估計(jì)的宏基因組量化,來評(píng)估難以測(cè)量的參數(shù),無疑將通過消除無信息的協(xié)變量來提高生物學(xué)相關(guān)性。
4. 將體外觀察轉(zhuǎn)化為體內(nèi)觀察
我們提出的最后一個(gè)挑戰(zhàn)是翻譯過程:我們?nèi)绾巫詈玫貜捏w外實(shí)驗(yàn)室環(huán)境中獲得觀察結(jié)果和結(jié)論,并將它們應(yīng)用于體內(nèi)環(huán)境和生物醫(yī)學(xué)背景下出現(xiàn)的微生物群落?努力增加實(shí)驗(yàn)條件與自然環(huán)境的相關(guān)性,無論是通過轉(zhuǎn)向活體模型,還是通過整合化學(xué)和物理約束來更好地模擬感興趣的環(huán)境,可以更好地與旨在納入額外生物復(fù)雜性的數(shù)學(xué)模型開發(fā)以互補(bǔ)的方式結(jié)合起來。缺乏可譯性通常在另一個(gè)方向上也很明顯,即在實(shí)驗(yàn)室環(huán)境中重建自然系統(tǒng)。例如,自然界中發(fā)現(xiàn)的大多數(shù)微生物是不可培養(yǎng)的,實(shí)驗(yàn)室微生物菌株往往描述得很差;需要培養(yǎng)技術(shù)和/或現(xiàn)場(chǎng)測(cè)量的進(jìn)步來建立準(zhǔn)確的預(yù)測(cè)模型。這些方法也許有一天能夠使目前無法培養(yǎng)的菌株能夠在體外進(jìn)行操作。
經(jīng)典系統(tǒng)方法由動(dòng)力學(xué)建模和實(shí)驗(yàn)驗(yàn)證之間的連續(xù)反饋定義。 隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的日益普及,預(yù)測(cè)生物學(xué)的新范式將越來越多地結(jié)合所有三種互補(bǔ)方法,這要?dú)w功于下一代高通量技術(shù)可訪問的廣泛實(shí)驗(yàn)數(shù)據(jù)。
結(jié)論
動(dòng)態(tài)模型在我們對(duì)生物行為的集體理解方面取得了許多進(jìn)展,特別是在微生物群體中。這些模型允許我們?cè)诙鄠€(gè)層面上探究生物復(fù)雜性,從基因表達(dá)到進(jìn)化結(jié)果。盡管有這種靈活性,但仍然有一些挑戰(zhàn)限制了預(yù)測(cè)生物學(xué)的影響。毫無疑問,解決這些挑戰(zhàn)將需要并行的多學(xué)科交叉努力,以推動(dòng)微生物學(xué)的實(shí)驗(yàn)和計(jì)算技術(shù)超越當(dāng)前的最先進(jìn)水平。然而,在過去的二十年里,動(dòng)力系統(tǒng)模型在微生物學(xué)中的效用已被證明是無價(jià)的。

大數(shù)據(jù)和機(jī)器學(xué)習(xí)方法的日益流行為經(jīng)典系統(tǒng)方法提供了一個(gè)新時(shí)代的選擇。整合這些進(jìn)展以建立下一代預(yù)測(cè)生物學(xué)模型無疑將產(chǎn)生有意義的研究結(jié)果(圖 2)。事實(shí)上,最近的幾項(xiàng)研究表明,基于計(jì)算模型效用結(jié)合機(jī)器學(xué)習(xí)的非常規(guī)使用可以提供強(qiáng)大的量化觀察力,包括生成生態(tài)相互作用的粗粒度預(yù)測(cè),提高計(jì)算效率以加速模型預(yù)測(cè),以及闡明藥物擾動(dòng)和細(xì)胞反應(yīng)之間的因果機(jī)制關(guān)系。這些類型的綜合方法包含了兩個(gè)最完美的方面:一方面,建模提供了對(duì)微生物系統(tǒng)和參數(shù)空間的具體機(jī)械觀察,否則很難探索(如果不是不可能的話);另一方面,數(shù)據(jù)包含了足夠的生物學(xué)信息,因此,使用分析工具,可以對(duì)噪音進(jìn)行分類,以找到生物學(xué)意義。
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I'm a line ! Thanks for your attention !-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
參考:https://blog.csdn.net/woodcorpse/article/details/107873443