2022-09-05

Cancer Disc | 構(gòu)建腫瘤發(fā)育圖譜:腫瘤相關(guān)細胞譜系和發(fā)育程序

原創(chuàng)?榴蓮不酥?圖靈基因?2022-09-05 10:21?發(fā)表于江蘇

收錄于合集#前沿分子生物學(xué)機制

撰文:榴蓮不酥

IF=?38.272

推薦度:?????

亮點:

本文系統(tǒng)地比較了癌癥基因組圖譜(TCGA)腫瘤樣本和小鼠器官形成細胞圖譜(MOCA)單細胞數(shù)據(jù),以構(gòu)建人類腫瘤的發(fā)育圖譜。使用該圖將腫瘤解卷積為發(fā)育成分,這反過來又可構(gòu)建能高精度預(yù)測腫瘤類型的D-MLP分類器。為使用發(fā)育映射來幫助診斷病理學(xué)以及新興單細胞數(shù)據(jù)集如何影響臨床癌癥護理作為診斷工具參考圖譜提供了原理證明。

2022年8月30日,在Cancer Discovery雜志上發(fā)表了一篇名為“Developmental Deconvolution for Classification of Cancer Origin”的文章,系統(tǒng)地比較了TCGA和MOCA兩種圖譜來構(gòu)建人類腫瘤的發(fā)育圖譜,并由此定義了一個深度學(xué)習(xí)的基于基因表達數(shù)據(jù)提取腫瘤發(fā)展軌跡的人工智能工具,可預(yù)測腫瘤類型,有利于提高對患者的治療成功率。


惡性腫瘤的診斷依賴于腫瘤外觀的組織病理學(xué)分類,通常與突變分析和臨床表現(xiàn)等其他特征聯(lián)系一起。然而,許多腫瘤表現(xiàn)出一系列異質(zhì)外觀,這可能部分反映了它們發(fā)展中的未知差異。缺乏診斷信息導(dǎo)致使用具有嚴重毒性和不良結(jié)果的非靶向療法治療許多癌癥。了解惡性腫瘤中失調(diào)的起源或發(fā)育途徑的細胞類型是癌癥生物學(xué)的主要目標,并且將能夠針對這些途徑進行更精確的診斷和治療干預(yù)。

當應(yīng)用于放射學(xué)和組織病理學(xué)中的圖像處理時,機器學(xué)習(xí)分類器已顯示出作為新工具的前景。然而,圖像分類器只檢測視覺特征,有時會受到偽影的影響。使用分子特征的分類器具有通過捕獲非視覺信息來幫助診斷的巨大潛力,最近的方法已證明在結(jié)合視覺和分子特征進行分類方面具有價值。然而,基因表達分類器由于大量特征而遭受過擬合,這導(dǎo)致對新數(shù)據(jù)集的預(yù)測能力較差,或者選擇了小型基因組進行測量。如何在從基因表達數(shù)據(jù)中提取最相關(guān)信息的同時減少特征數(shù)量仍然是構(gòu)建集成診斷模型的關(guān)鍵挑戰(zhàn)。

為了解決這些問題,使用了兩個綜合圖譜:癌癥基因組圖譜(TCGA)和小鼠器官形成細胞圖譜(MOCA)。概述了TCGA和MOCA數(shù)據(jù)集之間的系統(tǒng)比較及其在構(gòu)建診斷工具中的用途。簡而言之,將腫瘤映射到屬于主要細胞譜系和發(fā)育程序的軌跡。這可將大量腫瘤基因表達特征解卷積為發(fā)育成分,然后研究團隊將其輸入到輸出腫瘤類型的多層感知器分類器中。

圖1:通過發(fā)育反卷積和機器學(xué)習(xí)診斷惡性腫瘤


首先系統(tǒng)地比較了每個TCGA樣本與每個MOCA單細胞的基因表達譜。為了可視化數(shù)據(jù),用了TCGA腫瘤類型和MOCA細胞亞軌跡。接下來折疊了相同發(fā)育子軌跡的所有細胞的相關(guān)系數(shù),并將它們可視化為單個相似性分數(shù)。此外觀察到預(yù)期的發(fā)育譜系關(guān)系:具有神經(jīng)嵴軌跡的黑色素瘤樣本(SKCM)、具有上皮譜系的癌腫瘤和具有中胚層衍生發(fā)育譜系的間充質(zhì)腫瘤類型都顯示出很強的相似性。

有趣的是,腫瘤與發(fā)育軌跡的比較也揭示了意想不到的或新出現(xiàn)的關(guān)系。分析注意到膠質(zhì)母細胞瘤與主要發(fā)育軌跡神經(jīng)管或脊索和特定神經(jīng)嵴亞型的強相關(guān)性,而其他主要軌跡神經(jīng)嵴譜系沒有顯示出如此強的相似性。觀察到具有強正相關(guān)和負相關(guān)的高度信息軌跡,與腫瘤具有混合關(guān)系的軌跡以及許多其他關(guān)系。通過檢查與每種類型正、負和可變相關(guān)的軌跡數(shù)量,對每種TCGA腫瘤類型進行了類似的分析。正如預(yù)期的那樣,許多TCGA腫瘤具有正相關(guān)和負相關(guān)的軌跡。有趣的是,一組腫瘤的特征在于腹膜后的解剖位置,并顯示出所有類型的相關(guān)關(guān)系。這些分析共同為TCGA樣本類型提供了發(fā)展軌跡的強大地圖。

圖2:TCGA與發(fā)展軌跡的系統(tǒng)映射


許多癌癥已被假定為去分化疾病。通過在比較腫瘤和正常組織時樣本和軌跡之間的關(guān)系如何隨時間變化以評估前者與后者相比是否去分化。在發(fā)育軌跡上繪制了與其相應(yīng)瘤旁正常組織的系統(tǒng)相關(guān)性,同時還記錄了每個細胞的胚胎日。膠質(zhì)母細胞瘤與所有時間點的神經(jīng)元細胞都表現(xiàn)出高度相似性,而正常大腦與后期時間點的神經(jīng)細胞更相似。接下來將該分析擴展到一個泛癌隊列,確定了與每個樣本具有最高正相關(guān)性的MOCA細胞,并將這些細胞的已知胚胎時間段分類。與正常組織相比,腫瘤早期胚胎期的泛癌富集。此外,通過計算每個TCGA樣本的標準化“胚胎期分數(shù)”。發(fā)現(xiàn)腫瘤向較低的胚胎期評分轉(zhuǎn)移,這與惡性腫瘤部分由去分化驅(qū)動的觀點一致。

為了評估較高級別的腫瘤是否比較低級別的腫瘤更容易去分化這一假設(shè),分析了腫瘤等級是否與發(fā)育時間相對應(yīng)。與3級腫瘤相比,2級腫瘤在胚胎后期顯示出相對富集。此外,2級腫瘤向更高的胚胎期評分轉(zhuǎn)移,這與后期發(fā)育階段的相似性高度一致??傊?,這些結(jié)果表明發(fā)育映射捕獲了惡性腫瘤的相關(guān)組織病理學(xué)特征。

圖3:通過比較樣本類型和發(fā)育時間之間的關(guān)系進行驗證


在TCGA樣本和發(fā)育軌跡之間創(chuàng)建系統(tǒng)圖,啟發(fā)我們嘗試對人類腫瘤基因表達進行系統(tǒng)發(fā)育反卷積。在反卷積中,由組成部分組成的記錄信號被解構(gòu)為來自每個組成部分的單獨信號。發(fā)育組件(DC)在所有腫瘤樣本中進行縮放并繪制在雷達圖上,雷達圖代表每個樣本的發(fā)育期、子軌跡和DC評分的信息。顯示了單個肝細胞癌(LIHC)的發(fā)育反卷積的代表性雷達圖。

在單個雷達圖中繪制了所有肝細胞癌的信號。所有LIHC樣本的特點是肝臟軌跡評分升高和神經(jīng)元軌跡耗盡。相比之下,低級別膠質(zhì)瘤顯示神經(jīng)元軌跡的高信號和肝臟軌跡的低信號,與映射結(jié)果一致。接下來分析了發(fā)育反卷積在區(qū)分不同腫瘤類型方面的有效性。使用UMAP降維繪制了所有TCGA樣本的發(fā)育成分評分,并按組織類型和腫瘤類型進行注釋。此外,大多數(shù)腫瘤類型都高度聚集證實發(fā)育反卷積提取了顯著的基因表達數(shù)據(jù)。轉(zhuǎn)移樣本聚集在一起,部分原因是該組中SKCM的過度表現(xiàn)。總之,這表明TCGA-MOCA映射可用于將腫瘤基因表達解卷積為發(fā)育成分,以解決大多數(shù)腫瘤類型的方式。

圖4:腫瘤樣本的發(fā)育反卷積。


通過發(fā)育反卷積解決不同腫瘤類型的能力提高了設(shè)計監(jiān)督機器學(xué)習(xí)(SML)方法對惡性腫瘤進行分類的可能性。研究團隊推斷基于發(fā)育反卷積分數(shù)的分類器將從基因表達中提取最相關(guān)的數(shù)據(jù),同時還以胚胎發(fā)育程序在腫瘤中失調(diào)的形式捕獲基因之間的非線性關(guān)系。

首先,廣泛收集數(shù)據(jù)。除了TCGA,還整合了來自其他癌癥隊列的樣本以及我們從FFPE組織生成的測序數(shù)據(jù)。接下來將樣本分成兩個獨立的群組用于構(gòu)建模型的訓(xùn)練群組和模型從未見過的單獨群組,稍后用于測試性能。接下來將發(fā)展反卷積方法與直接在基因表達數(shù)據(jù)上進行訓(xùn)練進行了比較。在組裝的病例隊列中選擇了表達變化最大的基因與D-MLP進行匹配,并訓(xùn)練了一個新分類器評估了新分類器在測試集上的準確性??傊芯繄F隊得出結(jié)論,與直接對相似數(shù)量的輸入特征的基因表達數(shù)據(jù)進行訓(xùn)練相比,發(fā)育反卷積產(chǎn)生的分類精度更高。

圖5:腫瘤類型發(fā)育多層感知器(D-MLP)分類器的構(gòu)建和測試。


未知原發(fā)性癌癥仍然是一個主要的臨床問題,惡性腫瘤表現(xiàn)出侵襲性特征和較差的患者預(yù)后。在臨床上出現(xiàn)CUP的患者中,通過使用H&E染色、免疫組化和腫瘤突變分析可以有效解決病例。然而一部分病例未能通過所有當前可用的診斷技術(shù),仍然是需要新方法的真正診斷困境。因此,研究團隊將D-MLP分類器應(yīng)用于20個此類CUP病例,代表了機構(gòu)中最具挑戰(zhàn)性的診斷困境。分類器對大多數(shù)情況做出了強有力的診斷預(yù)測,分布在分類類型中。CUP的發(fā)育反卷積顯示,內(nèi)皮軌跡對大約一半的病例有很大貢獻;同樣,間充質(zhì)軌跡對大約一半的病例有很大貢獻。

如果臨床上可用,這種發(fā)育信息可以補充診斷決策。免疫組化顯示乳腺標志物、肺和黑色素瘤呈陰性,上皮標志物呈陽性,并且泌尿生殖起源可變或者弱陽性。分析腹水中的細胞,D-MLP分類器對該病例給出了卵巢癌的強有力預(yù)測。六個月后,經(jīng)過廣泛的額外臨床檢查,發(fā)現(xiàn)患者有腫塊,證實為卵巢漿液性癌??傊诎l(fā)育反卷積的深度學(xué)習(xí)分類器可以作為有用的輔助工具,影響診斷和臨床決策。

圖6:通過發(fā)育多層感知器D-MLP診斷未知原發(fā)性癌癥。

綜上所述,本研究的結(jié)果給出了人類腫瘤的發(fā)展圖譜,并提出了一種新的工具,以減少病理學(xué)診斷的不確定性,并暗示癌癥的診斷分類。

作者介紹

SalilGarg,醫(yī)學(xué)博士,麻省總醫(yī)院和哈佛醫(yī)學(xué)院病理學(xué)研究員,麻省理工學(xué)院科赫綜合癌癥研究所臨床研究員。其所領(lǐng)導(dǎo)的實驗室結(jié)合了來自細胞生物學(xué)、系統(tǒng)生物學(xué)和生物信息學(xué)的方法來理解異質(zhì)性以及它是如何導(dǎo)致癌癥治療失敗的。在一個相關(guān)的方向上,研究團隊正在使用腫瘤的發(fā)展繪圖來建立新的癌癥診斷,更精確地定義癌癥實體和預(yù)測治療反應(yīng)。長期目標是了解癌癥和發(fā)展的異質(zhì)性是如何產(chǎn)生的,了解哪些癌癥是由發(fā)展現(xiàn)象驅(qū)動的,并利用這些知識來改善癌癥的治療和診斷。

參考文獻

Moiso E, Farahani A, Marble HD, Hendricks A, Mildrum S, Levine S, Lennerz JK, Garg S. Developmental Deconvolution for Classification of Cancer Origin. Cancer Discov. 2022 Aug 30:CD-21-1443. doi: 10.1158/2159-8290.CD-21-1443. Epub ahead of print. PMID: 36041084.=

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容