文章題目:Single-cell analyses define a continuum of cell state and composition changes in the malignant transformation of polyps to colorectal cancer
發(fā)表雜志:Nature genetics (IF 41.307)
發(fā)表時間:2022-6-20
DOI:10.1038/s41588-022-01088-x
摘要
??為了繪制健康結腸向癌前腺瘤轉變?yōu)榻Y直腸癌(CRC)過程中發(fā)生的細胞組成和細胞狀態(tài)變化,作者收集了48個息肉、27個正常組織和6個CRCs的單細胞染色質可及性譜和單細胞轉錄組,每個樣本從1,000到10,000個細胞,這些樣本來自于攜帶或不攜帶生殖系APC突變的患者。大部分息肉和CRC細胞表現為干細胞樣表型,作者定義了這些干細胞樣細胞從穩(wěn)態(tài)發(fā)展為CRC時發(fā)生的一系列表觀遺傳和轉錄變化。晚期息肉含有越來越多的干細胞樣細胞、調節(jié)性T細胞和癌前相關的成纖維細胞亞型。在癌癥狀態(tài)下,作者觀察到T細胞衰竭、runx1調控的癌癥相關成纖維細胞以及上皮細胞中與HNF4A基序相關的可接近性增加。散發(fā)CRC的DNA甲基化變化與可及性變化在這一連續(xù)過程中呈強反相關,進一步確定了息肉分子分期的調控標志物。
前言
??識別驅動浸潤性癌癥形成的基因和途徑一直是許多大規(guī)?;蚪M學工作的核心焦點。然而,大多數研究都集中在晚期腫瘤的大量分析上,并且在很大程度上忽略了癌前病變。因此對從正常到癌前病變再到癌變狀態(tài)過渡期間發(fā)生的表型變化進展的詳細理解,以及這種轉變的分子驅動因素,仍然未得到充分探索。
??CRC是研究沿惡性轉化的表型狀態(tài)連續(xù)性的理想系統,因為它遵循從正常到非典型再到癌的刻板進展,包括癌前息肉的形成,隨后可引起CRC。與這些轉變相關的許多變化幾乎適用于所有CRC惡性腫瘤,以腺瘤到癌序列(the colorectal adenoma–carcinoma sequence,圖1)為典型。
??腺瘤性結腸息肉(APC)病基因是結直腸癌抑癌基因,可在胚系和體系水平出現異常調節(jié)。據統計,有80-90%的結直腸腫瘤是由APC的喪失引起的。導致β-連環(huán)蛋白穩(wěn)定和WNT信號傳導增加,進而導致腸增生。其他癌癥驅動基因(如KRAS,TP53和SMAD4)的后續(xù)突變導致轉化為癌。

??由于APC突變幾乎普遍是息肉和CRC的始發(fā)事件,因此具有APC種系突變的家族性腺瘤性息肉病(FAP)患者是研究息肉病自然進展的合適人群。這些患者通常在成年早期發(fā)展成數百個息肉,因此個體患者可以提供許多不同分子年齡和進展階段的息肉,所有這些都在同一個種系背景中出現。
本文研究內容
??為了繪制從健康結腸到浸潤性癌的表型連續(xù)體上發(fā)生的調節(jié)和轉錄組學變化,作為人類腫瘤圖譜網絡的一部分,作者分析了健康結腸,息肉和CRC的單核轉錄組(snRNA-seq)和表觀基因組(scATAC-seq)。許多息肉是從接受手術結腸切除術的FAP患者那里獲得的,這樣既可以分析具有不同大小和起源位置的息肉,也可以收集鄰近的未受影響的結腸組織。
??從這些單細胞數據集中,作者首先對免疫(immune)、基質(stromal)和上皮(epithelial)細胞類型進行分類。發(fā)現成纖維細胞(fibroblast)亞群在從正常結腸到CRC的過渡過程中發(fā)生了很大的變化。作者鑒定出僅存在于CRC組織中的耗竭T細胞(exhausted T)的亞群。作者在轉錄和表觀遺傳學數據中觀察到,在息肉和CRC中,有很大一部分細胞表現出干細胞樣狀態(tài)(stem-like state)。作者的研究發(fā)現,息肉形成了從正常結腸到大腸癌的表觀遺傳學和轉錄連續(xù)體,其特征是染色質的順序打開和關閉以及與癌癥狀態(tài)相關的基因的上調和下調。作者確定了與從正常結腸到癌的不同轉化階段相關的調控元件和轉錄因子(TFs),包括含有TCF和LEF基序的區(qū)域可及性的早期增加以及含有KLF基序的區(qū)域的可及性喪失。在該途徑的最后階段,即惡性轉化中,觀察到含有HNF4A基序的區(qū)域的可及性增加。最后,作者的實驗表明息肉的可及性變化與散發(fā)性大腸癌中的DNA甲基化變化具有很強的負相關性,并確定了這些區(qū)域中的一個子集,這些區(qū)域在惡性連續(xù)體(malignant continuum)早期改變了其可及性狀態(tài),這表明了檢測癌前息肉的潛在策略。
結論
結論1 繪制惡性轉化過程中的分子變化圖
??作者從8個FAP和7個非FAP供體中收集了81個樣本,并生成了單細胞數據(圖2a)。每個組織樣本均進行了匹配的scATAC-seq和snRNA-seq,從80個樣品中獲得了447,829個細胞的高質量單細胞染色質可及性數據,大多數樣品的平均轉錄起始位點(transcription start site,TSS)富集率約為8;從70個樣品中獲得了201,884個細胞的單細胞轉錄組數據。
??當所有snRNA-seq細胞數據和scATAC-seq細胞數據投射到低維亞空間中時,基質細胞和免疫細胞通常按細胞類型聚集,而上皮細胞在很大程度上分裂成不同的簇(圖2b,圖2c),包括來自息肉,未受影響的組織或CRC的細胞。因此,通過從所有樣品中亞群細胞來注釋免疫細胞和基質細胞,并分別分析上皮細胞。

結論2 息肉和大腸癌中富含T細胞和骨髓細胞
??免疫細胞包括B細胞、T細胞、單核細胞、巨噬細胞、樹突狀細胞和肥大細胞(圖2d)。作者檢查了已知標記基因的表達以注釋snRNA-seq數據,并檢查了染色質活性評分(給定基因體內和周圍可及性的度量),與標記基因相關以注釋scATAC細胞。作者在scATAC數據中鑒定出一簇耗竭T細胞,這些T細胞在耗竭T細胞基序中表現出高基因評分和耗竭T細胞基序的可及性,并被已發(fā)表的數據集標記為耗竭T細胞。
??所鑒定的免疫細胞類型幾乎存在于所有樣本中,盡管某些細胞類型在特定疾病狀態(tài)下富集或耗盡(圖2e)。例如,相對于未受影響的組織,調節(jié)性T細胞(Treg)在息肉中富集,而相對于息肉,幼稚B、記憶B和生發(fā)中心細胞(germinal center)在未受影響的組織中富集。
??息肉和大腸癌中Treg富集以及大腸癌中耗竭T細胞富集,這表明在癌前和癌性狀態(tài)下存在免疫逃避機制。T細胞衰竭是響應于慢性抗原刺激而發(fā)生的,其特征在于細胞因子產生減少和抑制性受體表達增加,被認為是癌癥免疫逃逸的主要機制。
??[相關信息]慢性感染和癌癥病人,由于長期暴露于持續(xù)性抗原和炎癥,T 細胞受到持續(xù)刺激,精疲力竭的 T 細胞逐漸失去效應功能,記憶T細胞特征也開始缺失,稱為 T 細胞耗竭(T Cell Exhaustion)。耗竭 T 細胞在功能上有別于效應 T 細胞和記憶 T 細胞,其特點是效應功能喪失,抑制性受體(IRS)表達增高且持續(xù),表觀遺傳和轉錄譜改變,代謝方式改變(圖3)。

??基質細胞方面,鑒定到神經膠質細胞,脂肪細胞和多種類型的內皮細胞和成纖維細胞。成纖維細胞亞型包括隱窩成纖維細胞(crypt fibroblasts,WNT2B或RSPO3高表達),絨毛成纖維細胞(villus fibroblasts,WNT5B高表達)和肌原纖維細胞(myofibroblasts,ACTA2和TAGLN高表達)。在絨毛成纖維細胞中觀察到BMP信號基因的高表達。作者還觀察到一簇腫瘤相關成纖維細胞簇(CAFs),其幾乎完全由來自CRC的細胞組成,以及富含息肉和CRC細胞的scATAC成纖維細胞簇,可接近一些與CAF相同的基因,稱之為癌前相關成纖維細胞(preCAFs)。這些結果表明,息肉和腫瘤中存在表型不同的成纖維細胞,因此可能在癌前病變的腫瘤發(fā)生中發(fā)揮作用。
??接下來,作者整合了scATAC序列和snRNA序列數據集,以分析潛在驅動基因表達的調控元件和轉錄因子。作者將數據集與典型相關分析(CCA)進行比對,并將RNA文件分配給每個scATAC細胞中。
結論3 scATAC揭示癌前相關成纖維細胞(preCAF)群體
??CAFs通過多種機制促進癌癥的發(fā)展和進展,包括基質重塑、與癌細胞的信號相互作用和干擾免疫監(jiān)測(圖4)。作者觀察到一個具有高表達已知CAF標記基因FAP和TWIST1的CAF簇。CAF最重要的snRNA-seq標記物包括FAP、VCAN和COL1A2(圖4a),它們參與細胞外基質重塑并在多種癌癥中上調。CAFs對這些基因的特異性表達表明,成纖維細胞參與癌組織中獨特的細胞外基質重塑,而這種重塑在正常結腸或癌前息肉中并不存在。
??雖然已知CAF可以促進CRC進展,但接下來探索了成纖維細胞在癌前病變中的作用。由于preCAF簇富含來自息肉的細胞,檢查了CAFs標記基因周圍的可及性,并發(fā)現許多這些基因在preCAF細胞亞型中比在其他成纖維細胞亞型更容易獲得。例如,CAFs分泌WNT2以促進CRC中的細胞增殖和血管生成。CAFs和preCAFs在WNT2 TSS上表現出最大的可及性(圖4b),表明染色質變化促進了WNT2在CAFs和preCAFs中的表達。CAF和preCAFs之間存在相似之處,并表明preCAFs可以執(zhí)行與CAFs類似的功能。
??[相關信息]腫瘤組織中大量的腫瘤相關成纖維細胞(cancer associated fibroblasts, CAFs)為腫瘤的發(fā)展構建了良好的環(huán)境(占基質細胞50%以上)。CAFs在癌癥中扮演重要作用:CAFs不僅可通過分泌多種細胞因子或代謝產物抑制免疫細胞的功能,促進腫瘤發(fā)展、侵襲、轉移;CAFs 還具有塑造腫瘤外基質、形成藥物或治療性免疫細胞滲透屏障的阻止藥物與免疫細胞向腫瘤組織的深層滲透,從而降低腫瘤治療效果。因此,通過調控 CAFs 或克服其屏障作用抑制腫瘤是腫瘤治療的新手段。
結論4 RUNX1 與 CAF 中的廣泛可訪問性相關
??作者發(fā)現,CAF標記峰對JUN/FOS和CEBP基序富集,preCAF標記峰對JUN/FOS和FOX基序富集(圖4 c,d)。與其DNA基序的染色質可及性活性水平之間相關性最相關的TF是RUNX1,RUNX2和CEBPB(圖4 e)。然后作者在基質細胞的UMAP圖和小提琴圖中繪制了這些轉錄因子(TF)的表達水平(RNA expression)和基序活性(chromVAR deviation z-scores),并注意到具有類似基序的RUNX1和RUNX2的染色質活性水平在CAFs和preCAFs中最高(圖4 f)。然而,RUNX1主要在CAFs和preCAFs中表達,而RUNX2在CAFs中的表達要低得多,這表明RUNX1在RUNX基序中比RUNX2在CAFs中更強。

結論5 息肉富含干細胞樣上皮細胞
??作者構建了正常上皮結腸細胞的RNA-seq和ATAC-seq參考數據(圖5 a),并使用已知標記基因的基因表達和基因活性評分來注釋該正常組織中的細胞類型。發(fā)現來自息肉和CRC的上皮細胞傾向于沿著正常的分化軌跡投射到更接近干細胞和其他未成熟細胞的位置,而來自未受累組織的細胞在整個上皮區(qū)室中相對均勻地投射(圖5b)。根據投影中最近的正常細胞對所有上皮細胞進行分類,發(fā)現來自息肉和CRC的樣本富含干細胞樣上皮細胞,而對于成熟的腸細胞,腫瘤的上皮細胞的耗竭,這表明上皮細胞在從正常到息肉的轉化過程中越來越多地表現出干細胞樣表型(圖5 b-d)。推測息肉和CRC中的干細胞樣細胞群可能代表這些組織中的“癌癥”干細胞。
??為了量化樣本中單個細胞的干細胞度,作者為每個snRNA序列和scATAC序列細胞分配了量化干細胞度的分數,并通過每個樣本中的干細胞分數分布來排序樣本(圖5 e)。正如預期的那樣,未受影響的樣本通常具有較低的干細胞度評分。許多息肉聚集在未受影響的組織附近,表明它們是相對良性的。然而,來自大多數息肉和CRC的細胞通常具有較高的干細胞度評分,其中一些顯示出更大的干擴散,而另一些則具有更緊密的干評分分布,表明一些息肉可能更具異質性。

結論6 干細胞樣細胞形成潛在的惡性腫瘤連續(xù)體
??接下來,作者將息肉和CRC干細胞樣細胞的基因表達和染色質可及性與正常干細胞進行比較,以確定癌前病變和癌變病變中的異?;虮磉_和調節(jié)程序。在計算每個樣本的干細胞樣細胞和最近的正常細胞類型的細胞之間的差異峰后,計算這些差異峰的主成分log2FC,并按樣品沿該空間中樣條擬合的位置對樣本進行排序(圖6 a),其中排序中的位置可以解釋為從正常組織到癌癥的連續(xù)體中的位置。分析結果表明,干細胞與這些干細胞樣息肉細胞之間的基因表達和染色質可及性的差異遵循從早期到晚期息肉到侵襲性CRC的刻板進展。

結論7 基因表達沿惡性連續(xù)體變化
??通過選擇在至少兩個樣品中差異表達的基因,然后將這些基因聚類為十個k均值簇來檢查沿這種惡性連續(xù)體的基因表達變化(圖6 e)。這些簇對應于在惡性轉化的不同階段差異表達的基因組。例如,與未受影響的干細胞相比,簇1-4包含早期息肉中干細胞樣細胞中上調的基因。第4組的成員包括OLFM4,這是腸道干細胞的標志物,表明當息肉的干細胞樣細胞接近惡性腫瘤時,OLMF4的表達增加。第4組還包括GPX2,一種已知在CRC中上調的谷胱甘肽過氧化物酶,通過減少過氧化氫來緩解氧化應激,促進腫瘤發(fā)生和轉移(圖6 h)。
結論8 息肉顯示TCF和LEF活性增加
??為了鑒定與侵襲性轉化相關的息肉組,作者將至少兩個樣本中與最接近的未受影響細胞類型相比,將36374個峰值顯著差異聚類為十個k均值簇(圖6 f),揭示了五個在癌癥過渡的不同階段變得更容易接近的簇和五個變得不那么容易接近的簇。為了識別TF在從正常結腸到CRC的轉變中驅動染色質可及性變化,作者從圖6 f計算了每個峰簇中基序的超幾何富集,并確保了這些結果的穩(wěn)定性(圖6 g)。
??TCF和LEF家族基序在所有簇中都得到了豐富,這些簇在整個惡性腫瘤連續(xù)體(簇1-5)中變得更加容易獲得,這與APC的丟失導致細胞核中β連鏈蛋白積累的事實一致,其與TCF和LEF TFs相互作用以驅動WNT信號傳導。
??在后期息肉和CRC中更容易接近的3簇峰也表現出ASCL2基序的富集(圖6 g)。ASCL2是腸道干細胞命運的主要調節(jié)劑,誘導ASCL2缺失導致小鼠LGR5腸道干細胞丟失。與息肉上皮中更莖樣狀態(tài)與更晚期惡性連續(xù)評分之間的聯系一致,ASCL2表達隨著息肉接近惡性轉化而逐漸增加(圖6 h),再次表明“超級莖”樣表型,其中干狀態(tài)的主調節(jié)因子甚至比正常干細胞中更活躍。
??沿惡性連續(xù)體丟失的基序包括HOX家族基序,KLF基序和GATA基序(圖6 g)。簇4和5僅在CRC樣品中表現出較大的可及性增加,并且HNF4A基序的富集最大(圖6 g)。這一觀察結果表明,HNF4A在息肉中的使用差異,其中它減少以驅動WNT信號傳導,而在CRC中,它被上調以驅動癌癥特異性可及性差異。
結論9 細胞組成的沿惡性連續(xù)體的重塑
??作者計算了每種細胞類型對每個樣品的分數貢獻作為惡性腫瘤連續(xù)體中位置的函數,并發(fā)現一些細胞類型與沿惡性腫瘤連續(xù)體的進展高度相關。例如,在整個惡性轉化過程中,樣品中干細胞的比例逐漸增加(圖7 a,i)。隨著息肉轉化為癌,組織中成熟腸細胞的數量減少(圖7 b,i)。Milo分析顯示,在惡性腫瘤連續(xù)體的末端,干細胞樣細胞的鄰域往往明顯更豐富。在主要由未成熟和成熟的高腳杯細胞組成的分泌室中,觀察到許多息肉中未成熟高腳杯細胞的分數增加。作者在癌癥組織中看到普遍缺乏對分泌譜系的分化,有效地消除了未成熟和成熟的高腳杯細胞(圖7 c,d,i)。這一觀察結果與先前報道非粘性結腸腺癌中杯狀細胞耗竭的工作一致。在以前的工作中還發(fā)現,MUC2的敲除導致小鼠中形成更多的腺瘤和癌,這表明未成熟和成熟的高腳杯細胞的喪失甚至可能導致腫瘤發(fā)生。
??在上皮隔室之外,作者還觀察到從未受影響的息肉到癌的轉變過程中細胞組成的變化。在基質室內,前CAFs的比例逐漸增加,而CAFs僅出現在CRC中(圖7 g,h)。在免疫區(qū)室內,在更惡性的息肉和CRC中增加Tregs,而疲憊的T細胞僅出現在CRC中(圖7 e,f)。已知Tregs抑制抗腫瘤免疫反應,并且通常以高水平存在于腫瘤微環(huán)境中,Tregs的逐漸增加可能是癌前息肉免疫逃逸的一種機制。

結論10 比較CRC DNA甲基化變化與連續(xù)體可及性
??異常DNA甲基化是CRC腫瘤發(fā)生的主要機制,但甲基化變化的時間和程度在惡性轉化之前和期間驅動染色質可及性的變化尚不清楚。在癌癥基因組圖譜(TCGA)DNA甲基化數據(Illumina 450K陣列)中鑒定了正常和CRC樣品之間的差異甲基化探針。對于來自至少一個450K陣列探針的上皮細胞的~89000個染色質可及性峰,確定有多少重疊至少一個高甲基化位點,至少一個低甲基化位點或沒有差異甲基化位點。然后,作者根據峰是圖6 h中確定的顯著上調或顯著下調簇的成員將峰分成組。
??對于重疊的低甲基化探針的峰,大約三分之一(534)屬于沿連續(xù)體變得明顯更容易接近的簇,而<0.5%(5)變得明顯不那么容易接近(圖8 a)。作者看到重疊的高甲基化探針的峰的相似對應關系,大約四分之一(754)變得不那么容易接近,<0.5%(9)變得更加容易接近。因此,CRC中的高甲基化和低甲基化幾乎完美地預測了該位點的可及性將分別減少或增加,或者保持不變。在未達到顯著性閾值的峰中,作者觀察到重疊的高甲基化探針的峰內的總可達性較低,而當它們重疊的低甲基化探針時,可及性更高(圖8 b)。然而,作者還觀察到,79.4%(2,096)的明顯更容易接近的峰和76.3%(2,440)的較難接近的峰與非差分探針重疊,這意味著大多數染色質可及性變化可能不是由甲基化驅動的。
??接下來,作者繪制了惡性腫瘤連續(xù)體中重疊的高甲基化和低甲基化探針的差異峰的數量(圖8 c),并發(fā)現在CRC中最終差異甲基化的區(qū)域發(fā)生的染色質可及性變化沿著從正常到癌癥的轉變積累,在晚期息肉和CRC中觀察到的最大數量。
??在CRC中與高甲基化探針重疊的區(qū)域中,息肉變得不那么容易接近,這是幾個先前報道的癌癥特異性高甲基化位點。例如,在正常結腸、未受影響的FAP結腸和非常早期的息肉中,ITGA4基因附近的啟動子區(qū)域和多個遠端調節(jié)元件是可觸及的,但在進展為CRC的早期變得閉合,即使在低級別息肉中也保持閉合(圖8 d)。在作者的數據集中,與高甲基化探針重疊的差分峰最近的基因是NR5A2。該基因附近的多個峰沿著惡性腫瘤連續(xù)體變得不那么容易接近(圖8 d),并且NR5A2的表達也沿著惡性腫瘤連續(xù)體逐漸減少。NR5A2是一種核受體,與廣泛的功能有關,包括炎癥和細胞增殖。NR5A2的高甲基化,可及性降低和基因表達降低表明,可能由NR5A2丟失引發(fā)的促炎狀態(tài)可能在腫瘤發(fā)生中起作用。

參考文獻
[1] Davies R J, Miller R, Coleman N, et al. Colorectal cancer screening: prospects for molecular stool analysis[J]. Nature Reviews Cancer, 2005, 5(3): 199-209.
[2]Blank CU, Haining WN, Held W, et al. Defining 'T cell exhaustion'. Nat Rev Immunol. 2019;19(11):665-674.
[3]Ping Q, Yan R, Cheng X, et al. Cancer-associated fibroblasts: overview, progress, challenges, and directions [published correction appears in Cancer Gene Ther. 2021 Jun 28;:]. Cancer Gene Ther. 2021;28(9):984-999.
[4]Mao X, Xu J, Wang W, et al. Crosstalk between cancer-associated fibroblasts and immune cells in the tumor microenvironment: new findings and future perspectives. Mol Cancer. 2021;20(1):131.
[5]Becker WR, Nevins SA, Chen DC, et al. Single-cell analyses define a continuum of cell state and composition changes in the malignant transformation of polyps to colorectal cancer. Nat Genet. 2022;54(7).