scATAC:人類基因組的染色質(zhì)可及性圖譜-3

scATAC:人類基因組的染色質(zhì)可及性圖譜
scATAC:人類基因組的染色質(zhì)可及性圖譜-1
scATAC:人類基因組的染色質(zhì)可及性圖譜-2

results3:
An atlas of cCREs in adult human cell types
成年人類的細胞類型cCRES圖譜

為了識別 111 種細胞類型中的每一種中的可接近染色質(zhì)區(qū)域,我們匯總了來自每個細胞簇的所有細胞核的染色質(zhì)可接近性概況,并應(yīng)用了針對單細胞數(shù)據(jù)優(yōu)化的峰值調(diào)用程序。然后,我們合并了這些可訪問的染色質(zhì)區(qū)域,以獲得 890,130 個non-overlapping cCRE 的列表(圖 2A)。


image.png

這些 cCRE 涵蓋了 ENCODE 聯(lián)盟發(fā)布的 cCRE 注冊表中 58.9% 的元件,還包括 420,152 個以前未注釋的元素。為了對這些 cCRE 進行基準測試(benchmark),我們接下來比較了在當前研究中由批量 DNase-seq 分析的生物樣本和由 sci-ATAC-seq 識別的細胞類型之間的染色質(zhì)可及性概況。總的來說,sci-ATAC-seq 細胞類型比bulk tissue或永生化細胞系生物樣品更接近原代細胞類型生物樣品,并且由 sci-ATAC-seq 定義的具有較高組織豐度的流行細胞類型與bulk tissue更相似,與DNase-seq 生物樣本相比,具有更多稀有細胞類型。在當前研究中描述的 111 種細胞類型中,44 種(40%)與 ENCODE 聯(lián)盟描述的任何大量生物樣本沒有顯示出統(tǒng)計學上顯著的相關(guān)性。這些細胞類型中有許多是罕見的:它們的最大組織豐度中位數(shù)僅為 3.2%,其中 36 個(81.8%)占任何組織中所有細胞的不到 10%??傊@些研究結(jié)果表明,我們的數(shù)據(jù)集將以前代表性不足的 cCRE 從體內(nèi)人類細胞類型貢獻到現(xiàn)有目錄中,特別是來自bulk tissue中豐度低的細胞類型。

為了評估這些 cCRE 的潛在功能,我們接下來將它們與轉(zhuǎn)基因報告基因驗證的哺乳動物增強子目錄進行比較,發(fā)現(xiàn)經(jīng)過驗證的組織特異性增強子在占很大比例的細胞類型中,并且在對應(yīng)組織中鑒定出的細胞核表現(xiàn)出更高的染色質(zhì)可及性 (圖 2B)。


image.png

例如,與其他細胞類型相比,心臟中經(jīng)過驗證的增強子在心房心肌細胞(Z 評分:1.41)和心室心肌細胞(Z 評分:1.43)中顯示出更高的平均染色質(zhì)可及性(圖 2B),這表明細胞類型特異性之間存在良好的相關(guān)性染色質(zhì)可及性和組織特異性增強子活性。我們進一步發(fā)現(xiàn),來自 49 種成人組織類型(GTEx Consortium,2020)的表達數(shù)量性狀基因座 (eQTL) 在流行的細胞類型中最常見,例如內(nèi)皮細胞和平滑肌細胞。此外,來自同質(zhì)組織(如肝臟和甲狀腺)的 eQTL 在相應(yīng)的細胞類型中顯示出最強的可及性,這些細胞類型包含組織中鑒定的大部分細胞核。這些結(jié)果表明, bulk tissue eQTL 最能代表與豐富細胞類型和同質(zhì)組織中的基因表達相關(guān)的序列變異,并且對于同質(zhì)組織中的稀有細胞類型或異質(zhì)組織中的獨特細胞類型可能不太具有代表性。

接下來,我們根據(jù)到最近的 TSS 的距離對每個 cCRE 進行分類,如圖 2A 所示。當前目錄中的大多數(shù) (80.94%) cCRE 與帶注釋的 TSS 相距超過 2,000 bp。直接位于 TSS 上方或啟動子區(qū)域附近的 cCRE 顯示出更高水平的序列保守性和更高的染色質(zhì)可及性(圖 2C 和 2D)。


image.png

image.png

相比之下,基因遠端 cCRE 的可訪問性較低,并且相對于其可訪問性顯示出更大的差異(圖 2D),表明存在高度可訪問的啟動子近端 cCRE 的共享程序以及跨細胞類型和物種的基因遠端 cCRE 的可變程序。為了進一步剖析細胞類型特異性染色質(zhì)特征和調(diào)控程序,我們應(yīng)用基于熵的策略揭示了 435,142 個 cCRE,這些 cCRE 在一種或幾種細胞類型中表現(xiàn)出受限的可及性(圖 2E)。

image.png

接下來,我們對細胞類型受限的 cCRE 應(yīng)用了 GREAT GO富集分析和基序富集分析,以揭示每種細胞類型的推定生物學過程和 TF,這在很大程度上與預(yù)期的細胞類型特異性功能相關(guān)( [FDR] <0.01) .例如,僅限于肝細胞的 cCRE 產(chǎn)生了生物過程GO Term,例如類固醇代謝過程(圖 2F),

image.png

并且富含肝細胞核因子 TF 家族成員 HNF1A/B、HNF4A/G 和 ONECUT1/2 的結(jié)合位點(圖 2G) 。


image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容