- 長(zhǎng)期以來,研究人員一直在基于轉(zhuǎn)錄組數(shù)據(jù)來探索有關(guān)復(fù)雜細(xì)胞群體和過程的生物學(xué)見解。樣本本身的異質(zhì)性以及基因表達(dá)的細(xì)胞間差異促使科學(xué)家從批量(bulk)細(xì)胞的平均值測(cè)定轉(zhuǎn)向單細(xì)胞RNA測(cè)序,以便更準(zhǔn)確地描述復(fù)雜的生物系統(tǒng)。然而,單單憑借轉(zhuǎn)錄組的信息,也許無法講述細(xì)胞的完整故事,科學(xué)家通常還想了解造成這些基因表達(dá)差異背后的原因 – 也就是說,從機(jī)理上解釋通過轉(zhuǎn)錄分析觀察到的基因表達(dá)模式變化。

- 轉(zhuǎn)錄組在本質(zhì)上其實(shí)是高度協(xié)調(diào)的基因表達(dá)程序的副產(chǎn)物。該程序受到表觀基因組、DNA和組蛋白修飾的調(diào)控,這些因素通過影響轉(zhuǎn)錄因子等DNA結(jié)合蛋白與基因組DNA的相互作用,從而激活或抑制基因表達(dá)。表觀基因組調(diào)控增加了生物學(xué)的復(fù)雜性,不僅驅(qū)動(dòng)了令人著迷的發(fā)育相關(guān)事件,讓有著相同DNA的細(xì)胞具有不同的身份并形成多種類型的組織和器官,同時(shí)也推動(dòng)了細(xì)胞的異質(zhì)性,從而促進(jìn)了復(fù)雜的疾病生物學(xué)。了解這種調(diào)控如何在單細(xì)胞中發(fā)揮作用,有望揭示不同細(xì)胞間轉(zhuǎn)錄差異背后的深層次的生物學(xué)復(fù)雜機(jī)制。
從開放染色質(zhì)到深入了解基因調(diào)控
- 染色質(zhì)轉(zhuǎn)座酶可接近性分析(ATAC)是一種通過鑒定開放染色質(zhì)區(qū)域來研究基因組物理結(jié)構(gòu)的方法。該技術(shù)使用了一種高活性的轉(zhuǎn)座酶,該酶可以結(jié)合在開放染色質(zhì)區(qū)域,在對(duì)該區(qū)域進(jìn)行切割的同時(shí)插入測(cè)序接頭,通過該方法獲得的測(cè)序文庫包含了開放染色質(zhì)區(qū)域所富含的序列。
從開放染色質(zhì)中可以獲得什么信息?
- 染色質(zhì)結(jié)構(gòu)的動(dòng)態(tài)重塑是影響哪些基因會(huì)發(fā)生轉(zhuǎn)錄以及何時(shí)轉(zhuǎn)錄的主要機(jī)制之一。當(dāng)染色質(zhì)開放時(shí),DNA結(jié)合蛋白可以接近調(diào)控序列,從而實(shí)現(xiàn)轉(zhuǎn)錄。scATAC-seq能夠提供染色質(zhì)可接近性的信息,并揭示單個(gè)細(xì)胞中基因轉(zhuǎn)錄活躍的區(qū)域。但是,它的功能并不止于此。數(shù)十萬個(gè)調(diào)控元件在不同背景下協(xié)同作用以協(xié)調(diào)基因表達(dá)模式,而scATAC-seq能夠提供這些不同元件的信息,包括其細(xì)胞類型特異性、結(jié)合位點(diǎn)基序,以及轉(zhuǎn)錄因子之類的低表達(dá)基因是否有可能開啟。

- 染色質(zhì)開放區(qū)域與基因轉(zhuǎn)錄的活躍區(qū)域相關(guān)。染色質(zhì)轉(zhuǎn)座酶可接近性分析(ATAC)可以特異性生成染色質(zhì)開放區(qū)域的DNA短片段。將這些剪切位點(diǎn)映射回基因組可以給我們提供一個(gè)窗口,以便了解轉(zhuǎn)錄因子基序結(jié)合、啟動(dòng)子和增強(qiáng)子區(qū)域,以及常染色質(zhì)和異染色質(zhì)區(qū)域。
通過ATAC-seq來定義細(xì)胞類型和狀態(tài)
- 與單細(xì)胞RNA-seq一樣,單細(xì)胞ATAC-seq也可以對(duì)相似的細(xì)胞類型和狀態(tài)進(jìn)行鑒定和聚類。不過,scATAC-seq數(shù)據(jù)所用的細(xì)胞類型注釋方法略有不同。使用scATAC-seq進(jìn)行細(xì)胞注釋的最簡(jiǎn)單的方法是將開放啟動(dòng)子區(qū)域作為轉(zhuǎn)錄活性的信號(hào)。

此外也可以利用細(xì)胞類型特異性的特征集合對(duì)細(xì)胞類型進(jìn)行注釋,這些集合是根據(jù)已分選細(xì)胞子集的批量細(xì)胞ATAC數(shù)據(jù)得出的。最后,如果有相同或相似樣本的單細(xì)胞基因表達(dá)數(shù)據(jù),那么scRNA-seq數(shù)據(jù)的注釋可作為完善scATAC-seq聚類注釋的參考。這些不同策略的相對(duì)表現(xiàn),以及如何使用它們的詳細(xì)信息,都可以在這篇技術(shù)指南中找到(1)。
scATAC-seq提供了與單細(xì)胞基因表達(dá)數(shù)據(jù)互補(bǔ)的信息,在某些情況下,甚至可以提供更高的細(xì)胞狀態(tài)分辨率。在對(duì)免疫檢查點(diǎn)調(diào)節(jié)劑VISTA的深入分析中,研究人員結(jié)合單細(xì)胞基因表達(dá)、T細(xì)胞受體(TCR)圖譜分析和單細(xì)胞ATAC分析,發(fā)現(xiàn)VISTA的缺失會(huì)導(dǎo)致記憶樣T細(xì)胞的擴(kuò)增,并以靜息細(xì)胞為代價(jià)。此外,ATAC-seq的數(shù)據(jù)表明,記憶樣T細(xì)胞簇中TCR效應(yīng)基因的可接近性增加,說明這些細(xì)胞已啟動(dòng)對(duì)TCR的應(yīng)答。歡迎查閱這篇《單細(xì)胞測(cè)序深化免疫腫瘤學(xué)研究》,了解scRNA-seq和scATAC-seq聯(lián)合使用如何提供強(qiáng)大的多組學(xué)分辨率,以幫助研究免疫檢查點(diǎn)調(diào)控。
推斷發(fā)育軌跡和鑒定調(diào)控元件
scATAC-seq還能夠?qū)Πl(fā)育軌跡進(jìn)行計(jì)算推斷。染色質(zhì)可接近性的改變是細(xì)胞分化和發(fā)育的主要驅(qū)動(dòng)特征。為了改變細(xì)胞狀態(tài)(或細(xì)胞類型),細(xì)胞必須首先準(zhǔn)備好改變其轉(zhuǎn)錄程序,而scATAC-seq提供了這些準(zhǔn)備過程的讀數(shù)。發(fā)育軌跡的鑒定是基于這樣一個(gè)事實(shí),即轉(zhuǎn)錄程序相似的細(xì)胞可能是相關(guān)的,開放染色質(zhì)圖譜相似的細(xì)胞可以被分在一組。
研究人員可以根據(jù)這些關(guān)系以數(shù)字序列來編排單個(gè)細(xì)胞,從而確定分化過程中細(xì)胞的時(shí)間順序。為了展示如何推斷發(fā)育軌跡,10x Genomics的科學(xué)家對(duì)近20,000個(gè)骨髓單核細(xì)胞和CD34+分選細(xì)胞開展了scATAC-seq。這篇中文的應(yīng)用指南(2)介紹了他們?nèi)绾瓮茢鄰母杉?xì)胞到B細(xì)胞、單核細(xì)胞和紅系細(xì)胞的發(fā)育軌跡。有了發(fā)育軌跡,scATAC-seq數(shù)據(jù)可幫您實(shí)現(xiàn)更進(jìn)一步的研究,確定不同分化狀態(tài)下變化并可能決定分化狀態(tài)的轉(zhuǎn)錄因子基序和增強(qiáng)子。

- 斯坦福大學(xué)的研究人員發(fā)布了一個(gè)重要的應(yīng)用案例,在其混合表型急性白血病(MPAL)研究中證明了利用單細(xì)胞ATAC數(shù)據(jù)構(gòu)建發(fā)育軌跡的能力。這種癌癥是由代表多個(gè)造血譜系的細(xì)胞組成的。此外,患者樣本中的癌細(xì)胞顯示了與淋巴樣細(xì)胞和髓樣細(xì)胞都相關(guān)的標(biāo)志物基因,這導(dǎo)致它們的細(xì)胞類型含糊不清。為了弄清這些癌細(xì)胞的真正細(xì)胞表型和發(fā)育起源,研究人員利用寡核苷酸偶聯(lián)抗體來研究表面蛋白,借助scRNA-seq來研究基因表達(dá),并通過scATAC-seq來研究染色質(zhì)可接近性,以此繪制出健康人體血液的發(fā)育軌跡參考圖。然后,他們將癌細(xì)胞樣MPAL細(xì)胞的表型投影到該參考圖中,首先將其分為“健康樣”或“疾病樣”,然后按照最相關(guān)的發(fā)育狀態(tài)進(jìn)一步分類,包括祖細(xì)胞樣、紅細(xì)胞樣、淋巴細(xì)胞樣、髓細(xì)胞樣和T/NK細(xì)胞樣(3)。

探索基因調(diào)控網(wǎng)絡(luò)
-
有了繪制開放染色質(zhì)區(qū)域的能力,研究人員還能開始了解細(xì)胞內(nèi)的信息流。轉(zhuǎn)錄因子在哪里結(jié)合以及它們開啟或關(guān)閉哪些基因,這取決于DNA上是否存在結(jié)合位點(diǎn),以及該結(jié)合位點(diǎn)是否可接近。因此,通過scRNA-seq揭示或通過scATAC-seq推斷的轉(zhuǎn)錄因子基因活性,以及只能通過表觀遺傳學(xué)方法辨別的靶基因結(jié)合位點(diǎn)的可接近性,都對(duì)細(xì)胞類型特異性的網(wǎng)絡(luò)有著重要貢獻(xiàn)。例如,為了讓轉(zhuǎn)錄因子1(TF1)調(diào)控特定細(xì)胞中的TF2,該細(xì)胞中的TF1基因必須具有活性,且TF2基因上的TF1結(jié)合位點(diǎn)必須可以接近。
建立基因調(diào)控網(wǎng)絡(luò)。TF2的轉(zhuǎn)錄需要TF1(藍(lán)色)的表達(dá),且TF2上的TF1結(jié)合位點(diǎn)可以接近。來源:改編自Hupé et al., 2012 (CC BY 3.0) -
通過scATAC-seq數(shù)據(jù),研究人員可以根據(jù)開放染色質(zhì)上順式調(diào)控元件的基因活性評(píng)分來推斷特定細(xì)胞中轉(zhuǎn)錄因子的表達(dá)。推定的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的可接近性可作為轉(zhuǎn)錄因子表達(dá)數(shù)據(jù)的補(bǔ)充,以建立細(xì)胞類型特異性的調(diào)控網(wǎng)絡(luò)。斯坦福大學(xué)的研究人員在上文提到的混合表型急性白血病研究中,利用這種方法及其scATAC-seq數(shù)據(jù),將啟動(dòng)子可接近性與靶基因表達(dá)相關(guān)聯(lián),從而確定了調(diào)控白血病基因的疾病特異性網(wǎng)絡(luò)(3)。重要的是,各個(gè)細(xì)胞譜系和發(fā)育狀態(tài)的轉(zhuǎn)錄因子活性以及更廣泛的調(diào)控網(wǎng)絡(luò)都可以追蹤,而這在單獨(dú)使用scRNA-seq時(shí)頗具挑戰(zhàn)性。淋巴譜系軌跡中的轉(zhuǎn)錄因子動(dòng)態(tài)。A. HSC和MPP富含HOXA9活性。B. CLP和B細(xì)胞祖細(xì)胞富含EBF1活性。C. B細(xì)胞富含SOX2活性。D. 細(xì)胞類型特異性的轉(zhuǎn)錄因子HOXA9、EBF1和 SOX2分別在淋巴譜系軌跡的早期、中期和晚期被激活。圖中所示曲線是擬合到ChromVAR偏離分?jǐn)?shù)的平滑樣條,該分?jǐn)?shù)由擬時(shí)間維度中的min-max歸一化。
單細(xì)胞ATAC-seq入門
起初,ATAC-seq提供的這種表觀遺傳數(shù)據(jù)似乎令人望而卻步。您將直接查看DNA序列片段,而不是對(duì)轉(zhuǎn)錄本進(jìn)行計(jì)數(shù)。然而,Loupe Browser(4)等工具可幫助您以單細(xì)胞分辨率獲得染色質(zhì)可接近性的整體視圖,而從中獲得的見解將加深您對(duì)復(fù)雜系統(tǒng)的生物學(xué)理解,從僅僅知道基因已經(jīng)打開到了解其如何被激活。
參考資料
- https://support.10xgenomics.com/single-cell-atac/index/doc/technical-note-cell-type-annotation-strategies-for-single-cell-atac-seq-data
- https://www.10xgenomics.com/cn/resources/application-notes/deciphering-epigenetic-regulation-with-single-cell-atac-seq/
- J Granja et al., Single-cell multiomic analysis identifies regulatory programs in mixed-phenotype acute leukemia. Nat Biotechnol. 37, 12 (2019).
- https://support.10xgenomics.com/single-cell-atac/software/visualization/latest/tutorial
- https://www.sohu.com/a/412892456_120776019

