這篇文獻(xiàn)是今年的11月發(fā)表在Nature reviews上的一篇綜述,題目是The epigenetic basis of cellular heterogeneity。主要是從幾個(gè)表觀遺傳特征來說明細(xì)胞之間的異質(zhì)性。并且總結(jié)了目前為止,在單細(xì)胞水平上的表觀遺傳分析實(shí)驗(yàn)的手段和方法,介紹了一些最新的研究進(jìn)展。是表觀研究的一篇很新也很細(xì)的文章。文章很長(zhǎng),可以慢慢閱讀,也建議有時(shí)間的同學(xué)下載英文原文來看。
摘要
以單細(xì)胞測(cè)序?yàn)榛A(chǔ)的基因轉(zhuǎn)錄水平的分析方法已揭示在形態(tài)上無法區(qū)分的細(xì)胞之間的表達(dá)水平存在顯著的異質(zhì)性。這種可變性對(duì)組織生物學(xué)和疾病狀態(tài)(如癌癥)有重要的功能暗示。在bulk細(xì)胞和單細(xì)胞樣品中,表觀基因組信息如染色質(zhì)可接近性、核小體定位、組蛋白尾部修飾和增強(qiáng)子-啟動(dòng)子相互作用的圖譜顯示,染色質(zhì)狀態(tài)的這些特征有助于相關(guān)基因的表達(dá)或抑制。隨著單細(xì)胞表觀基因組分析方法的發(fā)展,能夠?qū)蝹€(gè)細(xì)胞的染色質(zhì)狀態(tài)進(jìn)行高分辨率的映射。最近使用這些技術(shù)的研究提供了證據(jù),表明染色質(zhì)組織不同方面的差異共同定義了在其他高度相似的細(xì)胞之間基因表達(dá)的異質(zhì)性。
前言
多細(xì)胞生物由具有不同生理功能的特化組織組成。盡管它們擁有相同或接近相同的基因組DNA序列,這些組織通過保持不同的基因表達(dá)譜在功能上有所區(qū)別。然而,即使是形態(tài)上同質(zhì)也被發(fā)現(xiàn)在基因表達(dá)和刺激反應(yīng)中表現(xiàn)出細(xì)胞間的差異。這種細(xì)胞異質(zhì)性已經(jīng)在許多生物體和發(fā)育環(huán)境中被檢測(cè)到,并在組織和疾病狀態(tài)(如癌癥)的生物學(xué)中具有重要作用。它也常常與表型相關(guān)基因的表達(dá)異質(zhì)性有關(guān)。例如,胚胎干細(xì)胞之間的表達(dá)異質(zhì)性可以改變分化特征。此外,病原體細(xì)胞或癌細(xì)胞之間的表達(dá)異質(zhì)性可能與人類疾病有關(guān)。取自同一腫瘤的癌細(xì)胞可以在形態(tài)和基因表達(dá)上表現(xiàn)出很大的異質(zhì)性,而這些差異與治療和疾病的發(fā)展有關(guān)。特別是,腫瘤干細(xì)胞表現(xiàn)出特定的基因表達(dá)、分化和增殖特征,有助于腫瘤發(fā)生和治療耐藥性。這些例子強(qiáng)調(diào)了基因表達(dá)的細(xì)胞間差異以及將這些差異與特定的細(xì)胞特性聯(lián)系起來將提高我們對(duì)發(fā)育和疾病的理解。
細(xì)胞間基因表達(dá)異質(zhì)性是一個(gè)活躍的研究領(lǐng)域,多種機(jī)制被認(rèn)為有助于這一現(xiàn)象。基因表達(dá)是一個(gè)多方面的過程,開始于將基因組DNA模板的一部分轉(zhuǎn)錄成信使RNA。轉(zhuǎn)錄以“爆發(fā)(bursts)”的形式發(fā)生,這是短時(shí)間轉(zhuǎn)錄活躍的狀態(tài)被更長(zhǎng)的轉(zhuǎn)錄沉默狀態(tài)打斷。隨機(jī)轉(zhuǎn)錄爆發(fā)可能導(dǎo)致相似細(xì)胞之間表達(dá)水平的變化。此外,基因激活和抑制的細(xì)胞間差異可能導(dǎo)致表達(dá)異質(zhì)性。在大多數(shù)細(xì)胞中,在任何給定時(shí)間里只有一部分基因是有轉(zhuǎn)錄活性的。這包括持續(xù)表達(dá)的“管家”基因,以及與細(xì)胞當(dāng)前環(huán)境和發(fā)育狀態(tài)相關(guān)的基因。一個(gè)基因是否被轉(zhuǎn)錄取決于轉(zhuǎn)錄因子和啟動(dòng)子等蛋白質(zhì)與基因組調(diào)控元件如啟動(dòng)子和增強(qiáng)子的結(jié)合。在真核生物中,對(duì)這些調(diào)控元件的接近在一定程度上受到周圍染色質(zhì)環(huán)境的控制,包括核小體的定位和組成,組蛋白尾巴修飾和三維結(jié)構(gòu)相互作用。染色質(zhì)狀態(tài)的這些方面通常被稱為表觀遺傳標(biāo)記(epigenetic marks),因?yàn)樗鼈兊某志眯院退鼈儗?duì)相關(guān)基因轉(zhuǎn)錄的強(qiáng)大影響(圖1)。單個(gè)細(xì)胞之間的基因表達(dá)異質(zhì)性可能是由這些現(xiàn)象以及其他未定性機(jī)制的組合引起的。

實(shí)驗(yàn)方法對(duì)包含數(shù)千或數(shù)百萬個(gè)細(xì)胞的樣本進(jìn)行操作(“bulk- cell”方法),為細(xì)胞群提供單個(gè)集合或平均信號(hào)。因此,它們不適用于解決細(xì)胞間基因表達(dá)和表觀遺傳標(biāo)記的差異。新興的技術(shù)能夠?qū)渭?xì)胞表觀遺傳標(biāo)記進(jìn)行分析,如染色質(zhì)可及性、核小體定位、DNA甲基化、組蛋白翻譯后修飾和enhancer-promoter相互作用(表1)或(表2)。在這篇綜述中,我們總結(jié)最近的研究,使用單細(xì)胞方法從本質(zhì)上揭示基因表達(dá)的異質(zhì)性以及是否homogeneous群的細(xì)胞表現(xiàn)出染色質(zhì)狀態(tài)的變化。


測(cè)定細(xì)胞異質(zhì)性
(一)Bulk- cell方法測(cè)定細(xì)胞群之間的差異
由于遺傳和表觀遺傳因素的影響,來自同一生物體不同組織的細(xì)胞群表現(xiàn)出表型異質(zhì)性。人類細(xì)胞之間的遺傳差異包括倍性數(shù)目的差異,如單倍體配子和多倍體肌肉細(xì)胞。表觀遺傳差異,指的是在基因組序列水平之上運(yùn)作的機(jī)制,有助于在相同遺傳信息的細(xì)胞之間產(chǎn)生具有不同功能的特異細(xì)胞類型。例如,組蛋白尾部共價(jià)修飾的差異有助于在功能上區(qū)分小鼠中的輔助T細(xì)胞變體和native CD4 T細(xì)胞。這種細(xì)胞和組織類型的特異性對(duì)于復(fù)雜的多細(xì)胞生命的功能是非常必要的。
組織的表觀遺傳特異性通過影響與這些特性相關(guān)基因的表達(dá)水平和/或潛力來影響細(xì)胞特性。了解組織和細(xì)胞類型之間基因表達(dá)的差異及其所帶來的功能差異已成為現(xiàn)代分子生物學(xué)的一個(gè)突出主題。傳統(tǒng)的全基因組測(cè)量基因表達(dá)的技術(shù),如DNA微陣列和二代RNA測(cè)序(RNA- seq),是在包含數(shù)千或數(shù)百萬的bulk- cell 樣本上進(jìn)行的,并提供基因表達(dá)的平均概況。類似地,bulk- cell表觀基因組學(xué)方法,如ChIP-seq提供了許多細(xì)胞組蛋白修飾的平均profile。雖然這些bulk- cell方法提供了關(guān)于不同細(xì)胞群體間基因表達(dá)和表觀遺傳標(biāo)記富集差異的有價(jià)值信息,但這些方法缺乏解決群體內(nèi)細(xì)胞間異質(zhì)性所需的分辨率(圖2)。

(二)單細(xì)胞方法測(cè)定群體內(nèi)差異
細(xì)胞間基因表達(dá)的異質(zhì)性往往與細(xì)胞發(fā)育潛能或疾病特征的功能差異有關(guān)。例如,人類誘導(dǎo)的多能干細(xì)胞包含一些細(xì)胞亞群,這些細(xì)胞亞群表現(xiàn)出與多能性和細(xì)胞命運(yùn)“選擇”相關(guān)的基因表達(dá)差異。同樣,重要的多能性基因Rex1和Oct4的表達(dá)異質(zhì)性揭示了小鼠胚胎干細(xì)胞的亞群為分化成不同的細(xì)胞系做好準(zhǔn)備。由于表達(dá)異質(zhì)性與細(xì)胞分化、發(fā)育和疾病有關(guān),因此了解群體內(nèi)細(xì)胞間表達(dá)的差異以及這種差異產(chǎn)生的機(jī)制是很重要的。雖然在20世紀(jì)90年代,基因表達(dá)在單個(gè)細(xì)胞中得到了成功的測(cè)定,但這些研究通常依賴于人力的方法,如將引物和酶注射到人工分離的細(xì)胞中。隨著時(shí)間的推移,通過微陣列技術(shù)的改進(jìn)和RNA- seq的出現(xiàn),單細(xì)胞技術(shù)的通量和分辨率得到了極大的提高。特別是,基于測(cè)序的方法能夠同時(shí)提供數(shù)千個(gè)單個(gè)細(xì)胞的基因轉(zhuǎn)錄組圖譜。事實(shí)上,單細(xì)胞RNA- seq (scRNA- seq)的廣泛應(yīng)用表明,高度相似的細(xì)胞之間的轉(zhuǎn)錄異質(zhì)性似乎是真核生物、細(xì)菌和clonally來源的細(xì)胞群體之間的普遍現(xiàn)象。
表觀遺傳機(jī)制,如染色質(zhì)狀態(tài)的變化,為細(xì)胞基因表達(dá)異質(zhì)性的貢獻(xiàn)提供了有吸引力的candidates。在過去的十年中,基于測(cè)序的方法已經(jīng)開發(fā)出來,可以在單個(gè)細(xì)胞中產(chǎn)生基因組范圍內(nèi)的表觀遺傳標(biāo)記(表1)。這些方法測(cè)定了群體內(nèi)單個(gè)細(xì)胞之間的表觀遺傳差異,使多種應(yīng)用成為可能,這在使用bulk- cell方法時(shí)是不可行的。例如,在細(xì)胞周期中發(fā)生的表觀基因組變化可以在傳代培養(yǎng)物中直接分析,而不需要化學(xué)干擾。此外,在一個(gè)細(xì)胞群體內(nèi)的表觀基因組狀態(tài)具有微妙的可塑性,例如在個(gè)體干細(xì)胞之間表現(xiàn)出可變的分化啟動(dòng),這就需要使用單細(xì)胞技術(shù)。最后,使用單細(xì)胞方法可以在不需要抗體或熒光細(xì)胞標(biāo)記的情況下,以一種unbiased的方式識(shí)別較大組織或培養(yǎng)物中罕見的細(xì)胞亞型。這些優(yōu)點(diǎn)也使單細(xì)胞表觀基因組學(xué)方法成為研究細(xì)胞間基因表達(dá)差異機(jī)制的理想方法。
雖然單細(xì)胞方法可以揭示單個(gè)表觀遺傳標(biāo)記在細(xì)胞間的異質(zhì)性,但這些方法無法同時(shí)描繪同一單細(xì)胞中多個(gè)標(biāo)記與轉(zhuǎn)錄水平。因此,這些技術(shù)只能表明表觀遺傳現(xiàn)象和轉(zhuǎn)錄水平之間存在相關(guān)性,而不能直接證明這些關(guān)系。為了解決這一局限性,研究人員正在開創(chuàng)“多組學(xué)”方法,這些方法能夠與基因表達(dá)和/或染色質(zhì)狀態(tài)的其他方面共同描繪表觀遺傳標(biāo)記(表2)。
(三)限制性與輔助方法
以測(cè)序?yàn)榛A(chǔ)的單細(xì)胞RNA表達(dá)和表觀基因組修飾技術(shù)依賴于目標(biāo)序列的擴(kuò)增。因此,它們可能會(huì)受到擴(kuò)增偏倚、文庫(kù)大小差異、缺失數(shù)據(jù)或低RNA捕獲率引起的實(shí)驗(yàn)噪音的影響。盡管多個(gè)計(jì)算技術(shù)已經(jīng)開發(fā)能夠減輕這些噪音的來源,目前限制scRNA - seq是轉(zhuǎn)錄本定量通常僅限于那些最高的基因表達(dá),通常每個(gè)細(xì)胞只有5000 - 9000表達(dá)的transcripts?;跓晒獾姆菧y(cè)序方法,如熒光原位雜交可以作為驗(yàn)證scRNA- seq發(fā)現(xiàn)的平行方法。特別是,單分子RNA熒光原位雜交技術(shù)為單細(xì)胞轉(zhuǎn)錄本分析提供了一種互補(bǔ)的方法,由于其靈敏度,可以準(zhǔn)確量化低表達(dá)的基因。與scRNA- seq數(shù)據(jù)不同,目前還沒有實(shí)用的基于成像技術(shù)來驗(yàn)證來自單細(xì)胞染色質(zhì)可接近性、DNA甲基化和組蛋白修飾實(shí)驗(yàn)的結(jié)果。這些數(shù)據(jù)集大多數(shù)通過與相應(yīng)的增強(qiáng)子或啟動(dòng)子信號(hào)富集的bulk- cell數(shù)據(jù)的比較來進(jìn)行基準(zhǔn)測(cè)試(詳情請(qǐng)參閱以下部分)。然而,值得注意的是,基于三維結(jié)構(gòu)成像的分析現(xiàn)在可以獨(dú)立驗(yàn)證一些使用高通量染色體構(gòu)象捕獲(Hi- C)識(shí)別的單細(xì)胞三維染色質(zhì)相互作用。
染色質(zhì)可接近性
(一)細(xì)胞間染色質(zhì)可接近性的差異
染色質(zhì)包括高度濃縮和難以接近的區(qū)域,也包括較松散的區(qū)域。染色質(zhì)中DNA的可接近性,尤其是在順式調(diào)控區(qū)域,如增強(qiáng)子和啟動(dòng)子,影響著基因的轉(zhuǎn)錄親和性,從而在促進(jìn)或抑制基因表達(dá)中起著重要作用?;蚪M染色質(zhì)易接近性可以測(cè)定,使用DNase I超敏感位點(diǎn)測(cè)序(DNase - seq), DNA識(shí)別可接近基于易消化的酶DNase I。 DNase I超敏的位點(diǎn)(DHSs)通常代表核小體減少的順式調(diào)控元件,與轉(zhuǎn)錄因子和其他調(diào)控蛋白結(jié)合。染色質(zhì)可接近性也可以通過ATAC- seq測(cè)定,這種方法類似于DNase-seq,基于對(duì)Tn5轉(zhuǎn)座子的易感性來測(cè)定染色質(zhì)可接近性。DNase- seq和ATAC- seq都已被用于單細(xì)胞分析,簡(jiǎn)稱為scDNase- seq和scATAC- seq(表1)。早期的scATAC- seq方法代表了細(xì)胞通量和每個(gè)細(xì)胞的read密度之間的權(quán)衡。然而,最近發(fā)表的一種scATAC- seq方法改進(jìn)的read密度為每個(gè)細(xì)胞10萬個(gè)reads。與之前的scATAC- seq方法相比,scDNase- seq方法提供了更高的read覆蓋率(每個(gè)細(xì)胞約35萬個(gè)reads),但只有幾十個(gè)細(xì)胞。由于DNase- seq和ATAC- seq檢測(cè)到的大多數(shù)峰重疊,在接下來的討論中我們將使用術(shù)語“染色質(zhì)可接近區(qū)域”來指代DNase-seq檢測(cè)到的DHSs和ATAC- seq檢測(cè)到的染色質(zhì)可接近位點(diǎn)。
不同細(xì)胞的染色質(zhì)可接近性存在很大的異質(zhì)性。定量比較表明,兩個(gè)單細(xì)胞之間大約25%的染色質(zhì)可接近區(qū)域是不同的。在bulk- cell數(shù)據(jù)中可接近的染色質(zhì)區(qū)域包含低read密度的細(xì)胞的可變頻率低,而強(qiáng)烈的可接近染色質(zhì)區(qū)域與多個(gè)組蛋白標(biāo)記有關(guān),表明組蛋白修飾可能有助于活躍轉(zhuǎn)錄調(diào)控元件的可接近性。不足為奇的是,在可接近性方面表現(xiàn)出低細(xì)胞間差異的基因啟動(dòng)子顯著豐富了組成型housekeeping基因功能,如轉(zhuǎn)錄和RNA處理。
(二)染色質(zhì)易接近性的可變是功能性的
可以假設(shè)染色質(zhì)可及性的細(xì)胞間異質(zhì)性來自于實(shí)驗(yàn)技術(shù)的差異,因此是人為的。這種可能性可以通過基因表達(dá)異質(zhì)性和染色質(zhì)可及性之間的相關(guān)性來研究。例如,由技術(shù)噪音引起的可及性變化將不會(huì)被預(yù)測(cè)與基因表達(dá)異質(zhì)性相關(guān)。然而,在基因調(diào)控元件的染色質(zhì)可及性的細(xì)胞間差異與相關(guān)基因表達(dá)的差異之間已經(jīng)觀察到強(qiáng)烈的正相關(guān),支持了染色質(zhì)可及性異質(zhì)性的功能作用。此外,同時(shí)檢查染色質(zhì)可及性和基因表達(dá)的研究往往揭示了以其他方式無法揭示的相關(guān)性。例如,在bulk細(xì)胞數(shù)據(jù)中,可接近染色質(zhì)區(qū)域的read密度與mRNA水平相關(guān),達(dá)到一個(gè)較低的閾值,超過該閾值進(jìn)一步增加密度,表達(dá)是不敏感的。這一觀察結(jié)果表明,最低水平的可接近性足以促進(jìn)轉(zhuǎn)錄復(fù)合體的結(jié)合。在單細(xì)胞中,高轉(zhuǎn)錄基因的啟動(dòng)子和增強(qiáng)子幾乎均勻地與染色質(zhì)可及區(qū)域重疊,表明轉(zhuǎn)錄水平與染色質(zhì)可及性之間的聯(lián)系廣泛地適用于單個(gè)細(xì)胞。此外,單細(xì)胞染色質(zhì)可及性數(shù)據(jù)已經(jīng)成功地用于將人類白細(xì)胞分離成與已知的B細(xì)胞、T細(xì)胞和單核細(xì)胞類型相對(duì)應(yīng)的主要clusters。這些結(jié)果不僅表明這些單細(xì)胞數(shù)據(jù)中染色質(zhì)可及性的變化包含了bulk細(xì)胞方法無法獲得的重要生物學(xué)信息,而且顯示了單細(xì)胞方法的獨(dú)特特性和應(yīng)用方法。
單個(gè)細(xì)胞分辨率下的基因表達(dá)和染色質(zhì)可及性的單獨(dú)分析表明,它們之間存在正相關(guān)關(guān)系,使用多組學(xué)方法對(duì)同一細(xì)胞中染色質(zhì)可及性和mRNA進(jìn)行共譜分析(表2)提供了直接證據(jù),表明這些差異是相關(guān)的。例如,最近開發(fā)的一種方法將scATAC- seq應(yīng)用于基因組DNA,而將scRNA- seq應(yīng)用于同一細(xì)胞的mRNA。當(dāng)在人類初級(jí)免疫細(xì)胞上使用時(shí),這揭示了mRNA表達(dá)和每個(gè)細(xì)胞的染色質(zhì)可及性之間的直接關(guān)系,而不需要在不相關(guān)的數(shù)據(jù)集之間繪制相關(guān)性。基因表達(dá)和染色質(zhì)可及性的共譜分析也有助于直接關(guān)聯(lián)和計(jì)算測(cè)試順式調(diào)控元件與其所控制基因之間的關(guān)系。例如,一項(xiàng)研究從成年小鼠大腦皮層獲得的單細(xì)胞基因表達(dá)和染色質(zhì)可及性數(shù)據(jù)中鑒定了超過30,000種新的調(diào)控關(guān)系。使用這兩種數(shù)據(jù)類型更容易識(shí)別遠(yuǎn)端調(diào)控關(guān)系,并且結(jié)合使用遠(yuǎn)端和近端調(diào)控元件比單獨(dú)使用近端元件更能準(zhǔn)確預(yù)測(cè)基因表達(dá)。識(shí)別和描述這些功能關(guān)系的能力強(qiáng)調(diào)了單細(xì)胞多組學(xué)分析的價(jià)值。
與可以通過RNA熒光原位雜交等方法直接驗(yàn)證的scRNA- seq數(shù)據(jù)不同,沒有平行的方法來驗(yàn)證從scDNase- seq或scATAC- seq數(shù)據(jù)集中發(fā)現(xiàn)的特定染色質(zhì)區(qū)域的可及性在細(xì)胞間的差異。即便如此,scDNase- seq或scATAC- seq數(shù)據(jù)的基準(zhǔn)可以通過比較pooled的單細(xì)胞數(shù)據(jù)和來自ENCODE等來源的bulk-細(xì)胞“金標(biāo)準(zhǔn)”數(shù)據(jù)來完成。此外,scATAC- seq和scDNase- seq數(shù)據(jù)質(zhì)量可以通過使用單細(xì)胞數(shù)據(jù)對(duì)混合細(xì)胞群進(jìn)行計(jì)算聚類分析來獨(dú)立評(píng)估。例如,如上所述,人類白細(xì)胞產(chǎn)生與B細(xì)胞、T細(xì)胞和單核細(xì)胞類型相對(duì)應(yīng)的簇,表明scATAC- seq提供了有意義的生物信息。
(三)細(xì)胞周期和轉(zhuǎn)錄因子是染色質(zhì)可及性變化的基礎(chǔ)
最近的研究表明,染色質(zhì)可及性的細(xì)胞的差異可能來自細(xì)胞周期階段的不同步性和轉(zhuǎn)錄因子表達(dá)和/或結(jié)合的差異。例如,對(duì)傳代的人類白血病細(xì)胞K562進(jìn)行的scATAC- seq顯示,ATAC- seq信號(hào)在細(xì)胞周期中不同復(fù)制時(shí)間的基因組區(qū)域內(nèi)存在異質(zhì)性。這些觀察結(jié)果表明,在復(fù)制過程中DNA含量的變化有助于傳代細(xì)胞中ATAC- seq信號(hào)的變化。其他研究表明,特定的轉(zhuǎn)錄因子表達(dá)/結(jié)合的可變性與相關(guān)結(jié)合位點(diǎn)染色質(zhì)可及性的異質(zhì)性高度相關(guān),且這種關(guān)系獨(dú)立于細(xì)胞周期效應(yīng)。例如,對(duì)白血病K562細(xì)胞進(jìn)行的scATAC-seq發(fā)現(xiàn)序列特異性轉(zhuǎn)錄因子GATA1和GATA2的異質(zhì)表達(dá)(參考文獻(xiàn)56),這兩種轉(zhuǎn)錄因子對(duì)脊椎動(dòng)物多種類型血細(xì)胞的發(fā)育和自我更新非常重要。這些因子的結(jié)合motif在統(tǒng)計(jì)上與染色質(zhì)可及性的異質(zhì)性相關(guān),獨(dú)立于細(xì)胞周期的影響。在小鼠心臟祖細(xì)胞中進(jìn)行的另一項(xiàng)scATAC- seq研究發(fā)現(xiàn),染色質(zhì)可及性與轉(zhuǎn)錄因子ISL1和NKX2-5的結(jié)合有關(guān)(參考文獻(xiàn)68)。此外,人類免疫細(xì)胞在記憶T細(xì)胞中發(fā)育相關(guān)轉(zhuǎn)錄因子AP-1、FOS和JUN以及單核細(xì)胞中CEBP和PU.1的結(jié)合位點(diǎn)上表現(xiàn)出明顯的異質(zhì)性。根據(jù)在這些免疫細(xì)胞中觀察到的染色質(zhì)可及性的異質(zhì)性程度,很可能這些群體存在于“phenotypic continuum”中,而不是一組不同的染色質(zhì)狀態(tài)。
盡管大多數(shù)序列特定的轉(zhuǎn)錄因子只有在染色質(zhì)可接近位點(diǎn)能夠識(shí)別相關(guān)的DNA motis,一些轉(zhuǎn)錄因子GATA -家庭和PU.1一類轉(zhuǎn)錄因子的成員被稱為“pioneer factors”,它們能夠在封閉區(qū)域結(jié)合。在封閉和異染色質(zhì)區(qū)域中,pioneer factors與目標(biāo)motif的結(jié)合可以導(dǎo)致易接近的染色質(zhì)位點(diǎn)的形成。因此,上述免疫細(xì)胞間染色質(zhì)可及性的異質(zhì)性可能部分源于觀察到的pioneer factors如GATA1、GATA2和PU1的表達(dá)異質(zhì)性。相比之下,大多數(shù)不具有pioneering活性的轉(zhuǎn)錄因子可能依賴于染色質(zhì)可及性的變化。因此,上述研究與一種模型一致,即pioneer factors結(jié)合和/或表達(dá)的異質(zhì)性有助于染色質(zhì)可及性的異質(zhì)性以及其他序列特異性轉(zhuǎn)錄因子的結(jié)合(圖3)。

(四)不同的染色質(zhì)可及性對(duì)發(fā)育和疾病的影響
染色質(zhì)可及性的異質(zhì)性研究對(duì)疾病和發(fā)育產(chǎn)生了重要的作用。例如,許多癌癥表現(xiàn)出高水平的細(xì)胞-細(xì)胞表觀遺傳異質(zhì)性,這可能驅(qū)動(dòng)癌細(xì)胞的進(jìn)化和疾病的進(jìn)展。在人白血病K562細(xì)胞系中,使用scRNAseq觀察到細(xì)胞表面標(biāo)記基因CD24在表達(dá)水平上存在異質(zhì)性,并且CD24高表達(dá)與GATA2高表達(dá)相關(guān)(參考文獻(xiàn)75)。細(xì)胞表現(xiàn)出高水平的CD24表達(dá)被分選出來,隨后scATAC - seq分析顯示GATA2結(jié)合motif染色質(zhì)可接近性增加,與維持造血祖細(xì)胞狀態(tài)的基因染色質(zhì)可接近性也升高了(相對(duì)于表達(dá)低水平的CD24的細(xì)胞) (ref.75)。這些結(jié)果表明,K562細(xì)胞亞群比其他群體更具有“干性”。低分化亞群的存在與研究癌癥干細(xì)胞如何促進(jìn)患者的治療耐藥性和疾病復(fù)發(fā)有關(guān)。在另一項(xiàng)研究中,scATAC- seq數(shù)據(jù)顯示,小鼠興奮性神經(jīng)元和腎小管細(xì)胞群體中的染色質(zhì)可及性存在相當(dāng)大的異質(zhì)性,而且這種差異與細(xì)胞在其親本組織中的位置相關(guān)。這一觀察表明,實(shí)體組織內(nèi)的表觀遺傳異質(zhì)性部分來自于對(duì)細(xì)胞組織微環(huán)境的反應(yīng)。這些例子突出了研究染色質(zhì)可及性異質(zhì)性的方法的潛力,為未來提供生物學(xué)見解。
核小體定位
(一)核小體定位的異質(zhì)性取決于基因組背景
核小體相對(duì)于DNA序列的定位在基因調(diào)控特征的組織中起著中心作用。利用微球菌核酸酶消化深度測(cè)序(MNase- seq)可以在全基因組范圍內(nèi)探索核小體的組織結(jié)構(gòu),利用微球菌核酸酶(MNase)消化可獲得的DNA,并對(duì)剩余的蛋白質(zhì)結(jié)合的DNA片段進(jìn)行測(cè)序。該方法直接對(duì)核小體結(jié)合區(qū)域進(jìn)行測(cè)序,與DNase-seq和ATAC- seq測(cè)序的無核小體DHSs不同(圖4a)。MNase- seq最近已被用于單細(xì)胞分析(scMNase- seq)(表1),核小體組織的單細(xì)胞圖譜增強(qiáng)了我們對(duì)核小體定位、染色質(zhì)可及性和基因表達(dá)之間關(guān)系的理解。

早期使用基于微陣列的DNA footprinting分析的研究表明,高度轉(zhuǎn)錄的基因通常包含一個(gè)無核小體的上游轉(zhuǎn)錄起始位點(diǎn)和一個(gè)在其下游的固定定位的' +1核小體'。使用MNase - seq檢測(cè)人類T細(xì)胞,發(fā)現(xiàn)結(jié)合RNA聚合酶II (Pol II)的啟動(dòng)子在核小體定位位點(diǎn)在活躍基因的轉(zhuǎn)錄起始點(diǎn)的周圍,在啟動(dòng)子和增強(qiáng)子上核小體的重組與基因活性有關(guān)(圖1)。這一現(xiàn)象已在多種組織類型和生物被證實(shí),與使用scMNase - seq的發(fā)現(xiàn)高度一致。此外,scMNase- seq為核小體在轉(zhuǎn)錄沉默基因組區(qū)域的定位模式提供了見解。雖然bulk-細(xì)胞MNase- seq無法解決異染色質(zhì)和沉默基因啟動(dòng)子的核小體組織模式,但scMNase- seq揭示了這些區(qū)域具有規(guī)則間隔但隨機(jī)排列的核小體(相對(duì)于潛在的DNA序列)(圖1)。這些規(guī)則排列的核小體可能來自于染色質(zhì)重塑和組裝因子抑制的染色質(zhì)結(jié)構(gòu),而不考慮潛在的基因組序列。值得注意的是,這種排列的隨機(jī)定位是細(xì)胞間異質(zhì)性的來源,并與核小體相對(duì)定位于潛在DNA序列的活性基因的啟動(dòng)子和增強(qiáng)子形成鮮明對(duì)比。scMNase- seq還提供了關(guān)于DHSs周圍核小體定位的信息。觀察到兩種不同的定位模式:一種位于核小體兩側(cè)之間,平均距離為~190 bp,另一種平均距離為300 bp。在一個(gè)細(xì)胞群體中,80%以上的DHSs表現(xiàn)出兩種間距類型相當(dāng)大的異質(zhì)性(圖4b)。此外,這種核小體定位的細(xì)胞間差異與DHSs和靶基因表達(dá)的差異呈正相關(guān)。因此,DHSs可以通過其可接近的程度和其核小體間距模式來識(shí)別,這兩者都有助于細(xì)胞的異質(zhì)性。
(二)核小體定位的異質(zhì)性揭示了譜系priming
細(xì)胞群可以基于單細(xì)胞數(shù)據(jù)集(如scMNase- seq)計(jì)算聚類。有趣的是,基于核小體定位的聚類分析發(fā)現(xiàn),在缺乏相應(yīng)基因表達(dá)差異的情況下,細(xì)胞亞群表現(xiàn)出明顯的表觀遺傳模式。例如,基于細(xì)胞表面標(biāo)記物的表達(dá)模式純化的鼠native CD4 T細(xì)胞,表現(xiàn)出不同的細(xì)胞集群顯示核小體消耗模式類似于輔助T 1 (TH1)或TH2細(xì)胞的細(xì)胞特異增強(qiáng)子上。Motif分析顯示,TH1和TH2增強(qiáng)子的核小體丟失分別與細(xì)胞類型特異性轉(zhuǎn)錄因子RELA和GATA3的motif相關(guān)。這些結(jié)果表明,超過40%的naive CD4 T細(xì)胞在表觀遺傳學(xué)上被誘導(dǎo)分化為TH1或TH2細(xì)胞(圖4c)。使用scRNA- seq數(shù)據(jù)的聚類分析無法檢測(cè)到這些亞群,因?yàn)門H1或TH2特異性基因僅被啟動(dòng),但尚未轉(zhuǎn)錄。此外,它們不會(huì)被bulk細(xì)胞表觀遺傳分析揭示,因?yàn)閎ulk細(xì)胞分析只提供了整個(gè)細(xì)胞群的平均譜。符合在小鼠naive CD4 T細(xì)胞中觀察到的可能的表觀遺傳啟動(dòng),40%的培養(yǎng)小鼠胚胎干細(xì)胞在胚狀體特異性增強(qiáng)子中表現(xiàn)出核小體丟失。這些細(xì)胞也表現(xiàn)出核小體定位的異質(zhì)性,這與與內(nèi)胚層或中胚層markers相關(guān)的基因有關(guān),這表明胚胎干細(xì)胞對(duì)不同的譜系,如髓系和神經(jīng)管的命運(yùn)是不同的。這個(gè)分化啟動(dòng)和核小體定位異質(zhì)性可能導(dǎo)致部分細(xì)胞間的結(jié)合的譜系特定轉(zhuǎn)錄因子有差異(圖2)。
雖然scMNase-seq可以同時(shí)測(cè)量核小體的位置和染色質(zhì)的可及性,其他一些技術(shù)可以還可以測(cè)定同一細(xì)胞中的DNA甲基化和/或RNA水平(表2),并揭示了在單細(xì)胞水平上染色質(zhì)動(dòng)力學(xué)的新見解。例如,一項(xiàng)使用DNA甲基化和染色質(zhì)可及性的多組學(xué)分析的研究表明,Pol II的抑制導(dǎo)致著床前小鼠胚胎中基因近端無核小體區(qū)域的衰減。這些區(qū)域富集了與重要轉(zhuǎn)錄因子(如SP1和E2F4)相關(guān)的結(jié)合motif,支持轉(zhuǎn)錄在產(chǎn)生或維持這些近端無核小體區(qū)域中的致病作用。此外,對(duì)單個(gè)人類K562細(xì)胞和GM12878淋巴母細(xì)胞的核小體定位和DNA甲基化的串聯(lián)圖譜顯示,無核小體區(qū)域的DNA甲基化是缺失的。研究發(fā)現(xiàn),在小鼠干細(xì)胞分化過程中,這種負(fù)相關(guān)趨勢(shì)越來越明顯,表明染色質(zhì)可及性、甲基化缺失和譜系啟動(dòng)之間存在潛在的關(guān)系。
總的來說,本節(jié)討論的研究支持了一種模型,即核小體中定位于活性啟動(dòng)子和增強(qiáng)子的細(xì)胞-細(xì)胞的差異將轉(zhuǎn)錄異質(zhì)性與染色質(zhì)狀態(tài)聯(lián)系起來,并通過譜系啟動(dòng)來決定細(xì)胞的命運(yùn)。
組蛋白修飾
(一)不同的組蛋白修飾與不同的染色質(zhì)狀態(tài)有關(guān)
染色質(zhì)狀態(tài)經(jīng)常用組蛋白尾巴的修飾與否來描述。這些翻譯后的共價(jià)修飾是由專門的表觀遺傳機(jī)制介導(dǎo)的,并對(duì)染色質(zhì)結(jié)構(gòu)和基因表達(dá)產(chǎn)生顯著影響。在這些表觀遺傳標(biāo)記中富集的染色質(zhì)區(qū)域表現(xiàn)出的功能特征是單獨(dú)繪制核小體組織所不能揭示的。組蛋白修飾主要使用ChIP-seq進(jìn)行分析,這揭示了不同的組蛋白修飾在轉(zhuǎn)錄活性和轉(zhuǎn)錄抑制的染色質(zhì)中不同模式的富集(圖1)。例如,組蛋白H3K4me富集于活性基因,而H3K27me富集于沉默基因。與H3K4me和H3K27me相關(guān)的基因,被稱為“二價(jià)修飾”,可能會(huì)根據(jù)細(xì)胞表面信號(hào)事件啟動(dòng)未來的激活或抑制。組蛋白尾部也可以乙?;源龠M(jìn)基因激活,而去乙?;瘎t與基因沉默相關(guān)。然而,一項(xiàng)無偏差的全基因組乙?;芯匡@示,這兩種組蛋白乙酰轉(zhuǎn)移酶和組蛋白去乙酰酶在許多沉默的基因啟動(dòng)子中中度富集。進(jìn)一步的研究表明,H3K4沉默啟動(dòng)子,然后通過乙?;瘷C(jī)制的短暫進(jìn)行乙?;腿ヒ阴;膭?dòng)態(tài)循環(huán)。組蛋白甲基化、乙?;腿ヒ阴;膮f(xié)同作用阻止了Pol II與這些基因的結(jié)合,但為它們未來的激活做好了準(zhǔn)備。
(二)組蛋白修飾的單細(xì)胞分析可以識(shí)別細(xì)胞亞群
在第一次使用單細(xì)胞ChIP-seq分析在單細(xì)胞分辨率的組蛋白修飾的報(bào)告之后,一些最新的技術(shù)被開發(fā)出來,包括單細(xì)胞染色質(zhì)免疫切割,然后測(cè)序(scChIC - seq),單細(xì)胞在靶標(biāo)下切割并使用核酸酶釋放(scCUT&RUN)和單細(xì)胞染色質(zhì)整合標(biāo)記測(cè)序(ChILseq)。采用Tn5轉(zhuǎn)座酶介導(dǎo)的tagmentation也被開發(fā)出來,例如索引抗體介導(dǎo)的染色質(zhì)tagmentation測(cè)序(iACT-seq),CUT&TAG和組合barcode和有針對(duì)性的染色質(zhì)釋放(CoBATCH)(表1)。結(jié)合split-pool barcode時(shí),這些方法可以顯著增加的通量,從數(shù)十或數(shù)百到成千上萬個(gè)細(xì)胞。
目前還沒有建立平行的方法來驗(yàn)證上述單細(xì)胞技術(shù)檢測(cè)的特定基因組位點(diǎn)組蛋白修飾的變化。這些數(shù)據(jù)集通常通過與pooled的單細(xì)胞數(shù)據(jù)和黃金標(biāo)準(zhǔn)的bulk細(xì)胞ChIP-seq數(shù)據(jù)比較,以及它們是否適合于將細(xì)胞群計(jì)算聚類為不同的細(xì)胞類型來進(jìn)行驗(yàn)證。如果已知的細(xì)胞亞群存在于樣本群體中,這樣的聚類分析可以作為獨(dú)立的驗(yàn)證,證明該方法提供了有用的生物學(xué)信息。例如,在人類白細(xì)胞中使用scChIC- seq獲得的H3K4me3譜進(jìn)行聚類分析,得到了與特征細(xì)胞類型包括B細(xì)胞、T細(xì)胞、自然殺傷細(xì)胞和單核細(xì)胞相對(duì)應(yīng)的聚類。用CoBATCH對(duì)小鼠內(nèi)皮細(xì)胞中H3K27ac乙?;膯渭?xì)胞圖譜同樣能夠基于細(xì)胞的起源組織正確地聚集細(xì)胞。這些研究揭示了單細(xì)胞組蛋白修飾的映射可以識(shí)別細(xì)胞亞群,其能力與成熟的基于scRNA-seq數(shù)據(jù)的聚類方法相似。
(三)單細(xì)胞組蛋白修飾的分析揭示了細(xì)胞異質(zhì)性
組蛋白修飾在建立對(duì)轉(zhuǎn)錄至關(guān)重要的染色質(zhì)狀態(tài)方面的重要作用表明,細(xì)胞間組蛋白修飾的差異有助于基因表達(dá)的異質(zhì)性。事實(shí)上,多個(gè)單細(xì)胞研究已經(jīng)確定了組蛋白標(biāo)記中的細(xì)胞異質(zhì)性,并建立了這種異質(zhì)性與基因表達(dá)水平之間的相關(guān)性。例如,H3K27ac在小鼠內(nèi)皮細(xì)胞中表現(xiàn)出不同程度的富集,這與與特定細(xì)胞系相關(guān)的序列特異性轉(zhuǎn)錄因子的表達(dá)相對(duì)應(yīng)。與基因啟動(dòng)子和增強(qiáng)子相關(guān)的H3K4me2測(cè)定顯示,在小鼠胚胎干細(xì)胞群體中存在相當(dāng)大的差異。這種差異在多能相關(guān)的基因增強(qiáng)子和轉(zhuǎn)錄抑制基因上都可以觀察到,這些數(shù)據(jù)集能夠解析三個(gè)不同的胚胎干細(xì)胞亞群。此外,來自不同人類和小鼠細(xì)胞類型的單細(xì)胞H3K4me3圖譜在每種細(xì)胞類型中都表現(xiàn)出顯著的細(xì)胞異質(zhì)性,而這種異質(zhì)性被發(fā)現(xiàn)與基因表達(dá)的細(xì)胞異質(zhì)性顯著相關(guān)。在T細(xì)胞亞群中,這種異質(zhì)性似乎與naive T細(xì)胞的分化表達(dá)轉(zhuǎn)錄因子BCL11B有關(guān)和TH1細(xì)胞的PRDM1的表達(dá)差異有關(guān)。綜上所述,這些研究表明,組蛋白修飾的異質(zhì)性往往與細(xì)胞群中特定譜系命運(yùn)的不同親和力有關(guān)。有趣的是,免疫細(xì)胞中的組蛋白修飾隨著年齡的增長(zhǎng)呈現(xiàn)出越來越大的異質(zhì)性,這表明控制老年人表觀遺傳異質(zhì)性/免疫細(xì)胞分化的機(jī)制可能發(fā)生改變。
組蛋白修飾也被發(fā)現(xiàn)與核小體組織的異質(zhì)性有關(guān)。例如,交叉引用scMNase-seq數(shù)據(jù)與bulk-cell ChIP-seq老鼠胚胎干細(xì)胞中的數(shù)據(jù)顯示基因組區(qū)域中,富集的染色質(zhì)組蛋白標(biāo)記如H3K4me1 H3K4me3, H3K27ac, H3K9ac H2AZ,與豐富的異染色質(zhì)的組蛋白修飾H3K27me3表現(xiàn)出高度的位置一致性 (reF.78)。啟動(dòng)子表現(xiàn)出活性和抑制性組蛋白修飾的“二價(jià)富集”,被發(fā)現(xiàn)與相關(guān)異構(gòu)染色質(zhì)可接近性相關(guān)。這些相關(guān)性表明,組蛋白修飾影響核小體的組織,或者,這兩個(gè)過程共同受到相同的基本潛在機(jī)制的影響,最終影響到觀察到的基因表達(dá)中的細(xì)胞異質(zhì)性。
理想情況下,上述組蛋白尾部修飾與其他類型表觀基因組數(shù)據(jù)集之間的相關(guān)性將直接使用多組學(xué)方法進(jìn)行測(cè)試。然而,多組學(xué)方法能夠?qū)⒔M蛋白修飾與基因表達(dá)同時(shí)分析,與核小體定位或染色質(zhì)可接近性還不能一起分析。在其他應(yīng)用中,這些方法可以直接測(cè)試同一單個(gè)細(xì)胞中富集特定組蛋白修飾的染色質(zhì)landscapes的基因表達(dá)。因此,這些類型的多組學(xué)方法需要闡明調(diào)節(jié)組蛋白修飾的細(xì)胞間變化的機(jī)制及其功能含義。
DNA甲基化
(一)用bulk細(xì)胞方法揭示DNA甲基化動(dòng)力學(xué)和異質(zhì)性
術(shù)語DNA甲基化通常指修飾的核苷酸5-甲基胞嘧啶(5mC),它是第一個(gè)被識(shí)別的表觀遺傳因素,其發(fā)現(xiàn)早于我們對(duì)DNA作為遺傳物質(zhì)的理解。Bulk cell對(duì)5mC的全基因組定位方法為DNA甲基化的分布和動(dòng)力學(xué)提供了廣泛的見解。雖然5mC通常存在于開花植物的所有序列環(huán)境中,但哺乳動(dòng)物DNA中主要富集5mC的序列是胞嘧啶5 '到3 '方向緊隨鳥嘌呤的序列。這些CpG位點(diǎn)頻率異常升高的基因組區(qū)域被稱為“CpG島”,在超過三分之二的基因啟動(dòng)子中存在,可以作為表觀遺傳調(diào)控開關(guān),在甲基化時(shí)限制基因的表達(dá)。啟動(dòng)子CpG島甲基化介導(dǎo)的基因沉默可在正常發(fā)育和腫瘤發(fā)生過程中發(fā)生。與組蛋白修飾帶來的相對(duì)可塑性的轉(zhuǎn)錄抑制相比,啟動(dòng)子DNA甲基化導(dǎo)致的基因沉默更加持久。可能由于這種穩(wěn)定性,這是主要的表觀遺傳沉默機(jī)制用于抑制內(nèi)源性轉(zhuǎn)座子、印跡基因和體細(xì)胞多能性相關(guān)基因。
雖然大多數(shù)DNA甲基化是相對(duì)穩(wěn)定的,但對(duì)bulk細(xì)胞的全基因組亞硫酸氫鹽測(cè)序(BS-seq)顯示,許多增強(qiáng)子和轉(zhuǎn)錄因子結(jié)合位點(diǎn)表現(xiàn)出動(dòng)態(tài)甲基化狀態(tài),且在不同的人類細(xì)胞和組織類型中富集程度不同。DNA相關(guān)蛋白在這些位點(diǎn)的結(jié)合被認(rèn)為與DNA甲基轉(zhuǎn)移酶活性競(jìng)爭(zhēng),以產(chǎn)生不同的甲基化模式。
(二)單細(xì)胞和多組學(xué)方法揭示DNA甲基化異質(zhì)性
用于全基因組5mC分析的單細(xì)胞方法的出現(xiàn)(表1),包括單細(xì)胞BS-seq,揭示了小鼠和人類細(xì)胞之間的大量DNA甲基化異質(zhì)性。例如,等位基因特異性reporter使用表明,調(diào)控元件的DNA甲基化差異直接影響相關(guān)基因的轉(zhuǎn)錄,并有助于細(xì)胞間基因表達(dá)的異質(zhì)性。相對(duì)于其他表觀基因組數(shù)據(jù)類型,有許多多組學(xué)技術(shù)適用于研究單細(xì)胞中DNA甲基化異質(zhì)性、基因表達(dá)以及其他表觀遺傳標(biāo)記之間的功能相互作用(表2)。因此,許多此類功能相互作用已被詳細(xì)研究。例如,啟動(dòng)子甲基化被發(fā)現(xiàn)與轉(zhuǎn)錄沉默相關(guān),但遠(yuǎn)端調(diào)控元件的甲基化與相關(guān)基因的表達(dá)呈現(xiàn)出正相關(guān)和負(fù)相關(guān)的平衡。這些觀察表明,DNA甲基化可能在基因啟動(dòng)子和增強(qiáng)子中扮演不同的角色。有趣的是,利用單細(xì)胞甲基組和轉(zhuǎn)錄組測(cè)序(scM&T),遠(yuǎn)端調(diào)控元件的甲基化異質(zhì)性與異質(zhì)性基因表達(dá)相關(guān),揭示了DNA甲基化和基因表達(dá)變異之間的功能聯(lián)系。雖然scM&T數(shù)據(jù)的計(jì)算聚類確認(rèn)了甲基化和基因表達(dá)之間的顯著相關(guān)性,但聚類模式也存在于DNA甲基化或表達(dá)數(shù)據(jù)中。這一觀察表明,DNA甲基化和基因表達(dá)是互補(bǔ)的。另一項(xiàng)研究也使用了scM&T對(duì)小鼠肌肉干細(xì)胞中的DNA甲基化和基因表達(dá)進(jìn)行共同分析。該研究發(fā)現(xiàn),基因啟動(dòng)子的DNA甲基化異質(zhì)性與相關(guān)基因表達(dá)的異質(zhì)性水平較高有關(guān)。這些研究中的一致觀察結(jié)果強(qiáng)烈支持多種細(xì)胞類型中基因表達(dá)異質(zhì)性和DNA甲基化異質(zhì)性之間的功能相互作用。
有幾種方法可用來共同分析DNA甲基化和其他表觀遺傳因素,如在同一單個(gè)細(xì)胞核小體定位和染色質(zhì)接觸(表2)。使用這些方法獲得的數(shù)據(jù)提供了關(guān)于DNA甲基化在染色質(zhì)生物學(xué)中的作用信息。例如,單核甲基染色質(zhì)構(gòu)象捕獲測(cè)序(sn-m3C-seq)被用于對(duì)單個(gè)人腦前額皮質(zhì)細(xì)胞的5mC和染色質(zhì)構(gòu)象進(jìn)行共譜。該方法利用5mC圖譜根據(jù)細(xì)胞類型精確地聚類細(xì)胞,從而能夠識(shí)別細(xì)胞類型特異性的染色質(zhì)組織特征。利用這種方法,可以確定細(xì)胞類型特異性染色質(zhì)環(huán),以及細(xì)胞類型特異性接觸和DNA甲基化富集之間的相關(guān)性。一項(xiàng)類似的研究使用methyl-HiC對(duì)單個(gè)細(xì)胞中的5mC和染色質(zhì)接觸進(jìn)行共譜,揭示了小鼠胚胎干細(xì)胞細(xì)胞核中空間接近的遠(yuǎn)端基因組區(qū)域之間DNA甲基化狀態(tài)的協(xié)調(diào)。DNA甲基化也與核小體定位也可以一起進(jìn)行研究:對(duì)多個(gè)小鼠著床前胚胎的細(xì)胞進(jìn)行單細(xì)胞染色質(zhì)landscape測(cè)序(scCOOL-seq),揭示了個(gè)體間強(qiáng)烈的表觀遺傳差異。例如,5mC分布和核小體定位在胚胎之間的異質(zhì)性大于來自同一胚胎的細(xì)胞之間的異質(zhì)性,這表明在解釋從多個(gè)動(dòng)物或人類患者收集單細(xì)胞表觀基因組數(shù)據(jù)集的研究時(shí)必須謹(jǐn)慎。總之,這些描述DNA甲基化以及基因表達(dá)和其他表觀遺傳特征的多組學(xué)方法為涉及DNA甲基化異質(zhì)性的染色質(zhì)生物學(xué)和功能關(guān)系提供了獨(dú)特的見解。此外,他們強(qiáng)調(diào)了未來將多組學(xué)方法擴(kuò)展到其他表觀基因組數(shù)據(jù)類型的好處。
增強(qiáng)子-啟動(dòng)子的相互作用
(一)基于3C的方法映射染色質(zhì)接觸和增強(qiáng)子-啟動(dòng)子相互作用
在哺乳動(dòng)物基因組中,順式調(diào)控元件直接引導(dǎo)基因的轉(zhuǎn)錄,并且通常位于離它們所調(diào)控的基因數(shù)千堿基遠(yuǎn)的地方。在這些調(diào)控元件中有增強(qiáng)子,它可以促進(jìn)包含多個(gè)非相關(guān)基因的目標(biāo)基因在長(zhǎng)基因組距離上的表達(dá)。哺乳動(dòng)物基因組中包含的增強(qiáng)子比基因多很多倍,說明了這些調(diào)控系統(tǒng)在基因表達(dá)中發(fā)揮的重要作用。特別是,在發(fā)育過程中精確的空間和時(shí)間基因表達(dá)往往是通過使用復(fù)雜的增強(qiáng)子網(wǎng)絡(luò)實(shí)現(xiàn)的。增強(qiáng)子能夠通過染色質(zhì)化和折疊與基因啟動(dòng)子形成物理相互作用來調(diào)控轉(zhuǎn)錄。這種增強(qiáng)子-啟動(dòng)子的相互作用是由于染色質(zhì)的空間排列而發(fā)生的遠(yuǎn)程接觸的例子。個(gè)體的成對(duì)接觸可以在bulk細(xì)胞樣本中通過染色質(zhì)構(gòu)象捕獲(3C)檢測(cè)來定量,同時(shí)Hi-C是一種基于測(cè)序的方法,能夠在全基因組范圍內(nèi)定量遠(yuǎn)端染色質(zhì)相互作用。對(duì)bulk細(xì)胞Hi-C數(shù)據(jù)的計(jì)算分析有助于繪制增強(qiáng)子-啟動(dòng)子相互作用的圖譜,從而有助于闡明控制基因表達(dá)的調(diào)控關(guān)系。例如,許多增強(qiáng)子-啟動(dòng)子的相互作用已被發(fā)現(xiàn)與基因表達(dá)同時(shí)發(fā)生,并在基因被抑制時(shí)被消除。這些接觸的功能性質(zhì)是由富集活性組蛋白修飾和轉(zhuǎn)錄因子結(jié)合強(qiáng)有力的相關(guān)性支持的。
bulk細(xì)胞映射染色質(zhì)接觸的方法提供了樣本平均信號(hào),不能解決細(xì)胞間的差異或異質(zhì)性。在單細(xì)胞水平上研究染色質(zhì)的空間排列,各種基于Hi-C的方法已經(jīng)被介紹(表1)。使用這些技術(shù),在不同類型的細(xì)胞中觀察到染色質(zhì)接觸的大量異質(zhì)性,這與不同的發(fā)育狀態(tài)相關(guān)。例如,一項(xiàng)使用單細(xì)胞Hi-C的研究觀察到,基于細(xì)胞周期階段,單個(gè)小鼠胚胎干細(xì)胞的基因組組織存在顯著差異,揭示了基因組復(fù)雜性,這在使用bulk細(xì)胞傳代培養(yǎng)樣品中是不可能觀察到的。單細(xì)胞技術(shù)還使研究人員能夠剖析染色質(zhì)接觸對(duì)干細(xì)胞發(fā)育事件和卵母細(xì)胞受精過程的貢獻(xiàn)。例如,對(duì)小鼠胚胎干細(xì)胞的多組學(xué)Hi-C和DNA甲基化數(shù)據(jù)的計(jì)算聚類揭示了胚胎干細(xì)胞亞群的存在,該亞群顯示甲基組模式與胚胎肢體發(fā)育相關(guān)。此外,單核相互作用組映射揭示了染色質(zhì)的空間重組發(fā)生在小鼠卵母細(xì)胞到受精卵的轉(zhuǎn)變,并將其與體細(xì)胞的組織狀態(tài)進(jìn)行對(duì)比。單細(xì)胞技術(shù)提供的靈敏度是必要的,以描述這種發(fā)育過渡,因?yàn)樗l(fā)生在單細(xì)胞階段。這些研究的結(jié)果突出了利用染色質(zhì)接觸的單細(xì)胞映射提供的靈敏度和分辨率獲得的生物學(xué)上的見解。重要的是,基于成像的并行技術(shù)已經(jīng)開發(fā)出來,能夠驗(yàn)證使用基于序列的方法識(shí)別的染色質(zhì)相互作用。例如,Hi-M,一種高通量、高分辨率、高覆蓋、基于顯微鏡技術(shù),可以同時(shí)可視化完整果蠅胚胎單個(gè)細(xì)胞的轉(zhuǎn)錄活性和染色體組織。類似地,多個(gè)超高分辨率顯微鏡研究提供了千堿基尺度上的染色質(zhì)折疊和在單位點(diǎn)相互作用的信息。盡管它們相對(duì)較新,但這些高靈敏度的基于成像的方法代表了染色質(zhì)接觸映射的一個(gè)令人興奮的前沿,并可能在未來促進(jìn)多種類型表觀基因組數(shù)據(jù)的協(xié)同可視化。
(二)CTCF促進(jìn)增強(qiáng)子-啟動(dòng)子相互作用,并限制表達(dá)異質(zhì)性
增強(qiáng)子-啟動(dòng)子的接觸在順式DNA調(diào)控元件和反式染色質(zhì)結(jié)合因子調(diào)節(jié)。其中研究最多的反式因子是內(nèi)聚復(fù)合體和CTCF。CTCF在染色質(zhì)長(zhǎng)距離接觸的形成和更大的拓?fù)溆虻慕Y(jié)構(gòu)中是公認(rèn)的關(guān)鍵調(diào)控因子,并在拓?fù)溆蛑g或染色質(zhì)濃縮區(qū)和開放區(qū)之間的邊界處富集。CTCF結(jié)合位點(diǎn)的刪除可以破壞它們之間的絕緣區(qū)域。一項(xiàng)單細(xì)胞Hi-C研究顯示,CTCF/內(nèi)聚素介導(dǎo)的染色質(zhì)環(huán)在單個(gè)細(xì)胞之間是異質(zhì)性的。除了在染色質(zhì)結(jié)構(gòu)域的結(jié)構(gòu)組織中發(fā)揮作用外,最近的數(shù)據(jù)表明,CTCF還有助于更動(dòng)態(tài)化增強(qiáng)子-啟動(dòng)子相互作用。在小鼠EL4細(xì)胞系中,使用三酶Hi-C (3eHi-C)分析染色質(zhì)相互作用的無偏差分析顯示,CTCF結(jié)合、調(diào)控區(qū)域的相互作用和增強(qiáng)子活性之間呈正相關(guān)。此外,CTCF結(jié)合位點(diǎn)被發(fā)現(xiàn)分散著增強(qiáng)子元素,活性基因啟動(dòng)子與CTCF結(jié)合位點(diǎn)的相互作用程度高于非活性啟動(dòng)子。有趣的是,盡管在CTCF knockdown后基因表達(dá)水平只有非常輕微的下降,但CTCF的缺失導(dǎo)致T細(xì)胞特異性基因Gata3、Thy1、Cd28和Cd5表達(dá)的異質(zhì)性顯著增加。此外,CriSPr–Cas9介導(dǎo)的Th1、Cd5和Runx3位點(diǎn)特異性CTCF結(jié)合位點(diǎn)的缺失損害了各自增強(qiáng)子-啟動(dòng)子的相互作用,導(dǎo)致其細(xì)胞間表達(dá)差異增加。綜上所述,這些觀察結(jié)果支持了增強(qiáng)子-啟動(dòng)子接觸在細(xì)胞群中限制發(fā)育基因表達(dá)異質(zhì)性中的作用。
CTCF如何促進(jìn)增強(qiáng)子-啟動(dòng)子相互作用和控制基因表達(dá)差異的呢?考慮到CTCF和內(nèi)聚素在物理和功能上相互作用,并且CTCF結(jié)合位點(diǎn)和增強(qiáng)子在基因組中彼此穿插,一種可能的機(jī)制是CTCF結(jié)合增強(qiáng)子和啟動(dòng)子附近的區(qū)域,并通過與內(nèi)聚素的相互作用使這些元素接近。因此,這將增加局部增強(qiáng)子和啟動(dòng)子的“濃度”,這將有利于增強(qiáng)子-啟動(dòng)子相互作用,并誘導(dǎo)靶基因的表達(dá)(圖5)。在該模型中,降低CTCF結(jié)合和增強(qiáng)子-啟動(dòng)子相互作用會(huì)降低轉(zhuǎn)錄激活的有效性和一致性,增加靶基因表達(dá)的差異。

發(fā)育基因的表達(dá)以一種間歇性的脈沖模式發(fā)生,在活躍和不活躍的轉(zhuǎn)錄狀態(tài)之間以不規(guī)則的間隔轉(zhuǎn)換。這種零星的激活導(dǎo)致了細(xì)胞間基因表達(dá)的異質(zhì)性。此外,這些轉(zhuǎn)錄爆發(fā)的動(dòng)力學(xué)具有高度的基因特異性,并受非隨機(jī)因素的控制,如附近的順式調(diào)控元件和周圍染色質(zhì)環(huán)境的特征。在最近對(duì)乳腺癌活細(xì)胞的單分子成像研究中,轉(zhuǎn)錄雌激素依賴基因TFF1在雌二醇處理后在不同細(xì)胞中表現(xiàn)出顯著的異質(zhì)表達(dá)水平(即使在激素飽和存在條件下)。有趣的是,這種異質(zhì)性被發(fā)現(xiàn)與轉(zhuǎn)錄不活躍狀態(tài)持續(xù)時(shí)間的顯著差異相對(duì)應(yīng)。TFF1上游近端增強(qiáng)子的缺失導(dǎo)致該基因的表達(dá)降低,這是由于與親代細(xì)胞系相比,轉(zhuǎn)錄爆發(fā)量減少了兩倍。這一結(jié)果表明,增強(qiáng)子-啟動(dòng)子的接觸對(duì)于控制發(fā)育調(diào)控基因中轉(zhuǎn)錄活性狀態(tài)發(fā)生的頻率是不可或缺的,因此對(duì)限制細(xì)胞群中基因表達(dá)的異質(zhì)性很重要。然而,目前尚不清楚TFF1的轉(zhuǎn)錄失活狀態(tài)為何對(duì)雌二醇刺激沒有反應(yīng),而激活狀態(tài)卻能顯著增加轉(zhuǎn)錄爆發(fā)頻率。一種可能性是這種反應(yīng)可能需要特定的組蛋白修飾模式。這一觀點(diǎn)得到了雌激素特異性染色質(zhì)結(jié)合蛋白TRIM24的化學(xué)抑制的支持,TRIM24阻斷了溴域與乙?;M蛋白的結(jié)合,導(dǎo)致TFF1的誘導(dǎo)減少了三倍??傊?,這些研究支持了增強(qiáng)子-啟動(dòng)子相互作用在控制細(xì)胞間基因表達(dá)異質(zhì)性方面的重要性。
最后的總結(jié)和展望部分就不翻譯了,就是對(duì)前面的部分進(jìn)行了一個(gè)總結(jié)。