Hackl, H., Charoentong, P., Finotello, F., & Trajanoski, Z. (2016). Computational genomics tools for dissecting tumour-immune cell interactions.?Nature Reviews Genetics,?17(8), 441.
摘要:
癌癥免疫療法方面的突破和高通量技術(shù)成本的降低,引發(fā)了使用基因組工具對(duì)腫瘤免疫細(xì)胞相互作用的深入研究。 數(shù)據(jù)的豐富性和復(fù)雜性帶來(lái)了相當(dāng)大的挑戰(zhàn),需要計(jì)算工具來(lái)處理、分析和實(shí)現(xiàn)可視化。 近年來(lái),研究人員已經(jīng)開發(fā)各種用于挖掘腫瘤免疫和基因組數(shù)據(jù)的工具并提供新穎的機(jī)制解讀。本文我們將綜述用于癌癥免疫研究的各類計(jì)算基因組學(xué)工具,并提供有關(guān)要求和功能的信息。
關(guān)鍵詞:
正文:
癌癥免疫療法基于誘導(dǎo)或增強(qiáng)對(duì)癌癥的免疫應(yīng)答的藥劑。 目前,除了靶向癌細(xì)胞的單克隆抗體外,單一療法還基于三種策略:使用檢查點(diǎn)阻斷劑,接種新抗原和過繼性T細(xì)胞轉(zhuǎn)移。 另外,免疫單一療法的組合以及免疫療法和靶向療法的組合也正在研究中。
癌癥免疫療法有可能適應(yīng)腫瘤的變化,因?yàn)槊庖呦到y(tǒng)能促進(jìn)特定的T細(xì)胞的產(chǎn)生,識(shí)別腫瘤表面發(fā)生改變的抗原從而殺死腫瘤細(xì)胞。然而,腫瘤細(xì)胞可以通過上調(diào)免疫細(xì)胞表面的免疫檢查點(diǎn)分子,如細(xì)胞毒性T淋巴細(xì)胞相關(guān)蛋白4(CTLA4)或程序性細(xì)胞死亡分子1(PD1)來(lái)逃避免疫系統(tǒng)的檢測(cè)。最近,已經(jīng)引入了幾種阻斷免疫檢查點(diǎn)并由此增強(qiáng)抗腫瘤T細(xì)胞應(yīng)答的抗體,并顯示出顯著的臨床效果。接受CTLA4靶向抗體治療的黑色素瘤患者,3年后存活曲線達(dá)到平臺(tái)期,表明這種方法持久的益處甚至治愈潛力。此外,PD1靶向抗體的功效不僅在黑色素瘤中顯示,而且在九種不同的腫瘤類型中也顯示出來(lái),如非小細(xì)胞肺癌,肝癌,腎癌和淋巴癌7。我們目前正在目睹檢查點(diǎn)阻滯劑的快速發(fā)展,從150多項(xiàng)臨床試驗(yàn)中可以看出,它們被用在單一療法或聯(lián)合治療中7。然而,只有一小部分患者對(duì)檢查點(diǎn)阻滯劑的單一療法有反應(yīng),因此確定精確的作用模式和預(yù)測(cè)標(biāo)志物是需要深入研究的主題。
繼第一批癌癥免疫療法 - 即單克隆抗體的使用,以及檢查點(diǎn)阻斷劑免疫療法的開發(fā),和其他免疫治療策略,包括治療性疫苗和工程化T細(xì)胞,使得腫瘤 - 免疫細(xì)胞相互作用成為焦點(diǎn)。解析這些復(fù)雜的相互作用,有望鑒定預(yù)測(cè)性生物標(biāo)志物,發(fā)展新藥或新的治療手段,并且促進(jìn)機(jī)制研究。然而,由于這兩種多細(xì)胞生態(tài)系統(tǒng)的演變和異質(zhì)性,使得腫瘤-免疫細(xì)胞相互作用的研究具有相當(dāng)大的挑戰(zhàn):癌癥的發(fā)展,可以看作是一種進(jìn)化過程;免疫系統(tǒng),包含許多先天和適應(yīng)性免疫細(xì)胞亞群,其中一些表現(xiàn)出表型可塑性并具有記憶。NGS技術(shù)和其他中高通量技術(shù)正在產(chǎn)生大量數(shù)據(jù),需要信息系統(tǒng)來(lái)處理和分析數(shù)據(jù),提取信息以開發(fā)機(jī)制理論并支持臨床決策。因此,癌癥免疫基因組學(xué)也可以被視為信息科學(xué),并將為新型免疫治療策略的開發(fā)和成功應(yīng)用鋪平道路。
在本綜述中,我們首先簡(jiǎn)要介紹腫瘤-免疫細(xì)胞的相互作用,然后討論用于挖掘癌癥基因組數(shù)據(jù)和提取免疫參數(shù)的計(jì)算基因組學(xué)工具。 我們專注于對(duì)NGS數(shù)據(jù)的更高級(jí)別分析,包括腫瘤浸潤(rùn)淋巴細(xì)胞(TILs)的定量,腫瘤抗原的鑒定和T細(xì)胞受體(TCRs)的分析,并提供有關(guān)需求和功能的信息以幫助選擇工具和分析管道的組裝。 雖然這里的重點(diǎn)是癌癥免疫學(xué),但所討論的計(jì)算方法也為研究其他疾病提供了手段,如自身免疫,炎癥,感染或移植物抗宿主疾病。

腫瘤-免疫細(xì)胞互作
癌癥免疫循環(huán)包括幾個(gè)連續(xù)步驟:癌細(xì)胞產(chǎn)生的新抗原在癌細(xì)胞死亡后釋放并被樹突細(xì)胞捕獲。 接下來(lái),樹突細(xì)胞將主要組織相容性復(fù)合物(MHC)分子上捕獲的抗原呈遞給T細(xì)胞,導(dǎo)致針對(duì)癌癥特異性抗原的效應(yīng)T細(xì)胞應(yīng)答的引發(fā)和活化。 在趨化因子梯度的指導(dǎo)下,活化的T細(xì)胞進(jìn)入并滲入腫瘤部位。 T細(xì)胞通過T細(xì)胞受體(TCR)和新抗原-MHC復(fù)合物之間的相互作用特異性識(shí)別并結(jié)合癌細(xì)胞并殺死癌細(xì)胞(細(xì)胞溶解活性)。 各種分子和基因組學(xué)工具可用于評(píng)估這些癌癥免疫細(xì)胞相互作用的每個(gè)階段及其刺激或抑制因子。

組學(xué)數(shù)據(jù)分析概述
NGS技術(shù)在基因組,轉(zhuǎn)錄組或表觀基因組分析中的應(yīng)用是腫瘤免疫基因組學(xué)數(shù)據(jù)的主要來(lái)源。此外,最近在圖像技術(shù)和相關(guān)軟件工具以及細(xì)胞表型分析技術(shù)方面取得了進(jìn)展,可以生成與基因組類型相輔相成的數(shù)據(jù)類型。對(duì)于腫瘤免疫基因組學(xué)中大多數(shù)問題,可以應(yīng)用與癌癥基因組學(xué)中相同的NGS技術(shù),它們包括全外顯子組測(cè)序(WES),全基因組測(cè)序(WGS),RNA-seq,用于DNA甲基化分析的亞硫酸氫鹽測(cè)序和單細(xì)胞測(cè)序。 然而,對(duì)于特定應(yīng)用,例如TCR測(cè)序,需要仔細(xì)考慮讀取長(zhǎng)度,測(cè)序數(shù)據(jù)(WES,WGS或RNA-seq)的深度和類型。
在癌癥免疫學(xué)的背景下對(duì)組學(xué)數(shù)據(jù)的分析可以被視為兩步程序(圖2)。在對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理之后,第一步是組學(xué)數(shù)據(jù)分析,主要關(guān)注腫瘤本身。該步驟包括用于鑒定SNP,小的插入和缺失,拷貝數(shù)變異(CNV),結(jié)構(gòu)變異,基因融合以及變體注釋的工具?;蚪M分析組中的另一組工具用于分析使用RNA-seq評(píng)估的基因的表達(dá),從WES和/或SNP陣列數(shù)據(jù)估計(jì)腫瘤異質(zhì)性或分析DNA甲基化模式。第二類分析使用免疫基因工具,更關(guān)注腫瘤-免疫細(xì)胞相互作用。作為輸入數(shù)據(jù),它們使用基因組分析和/或原始測(cè)序數(shù)據(jù)的輸出。這些免疫基因組學(xué)分析的結(jié)果提供了有關(guān)腫瘤微環(huán)境的兩個(gè)關(guān)鍵特征的信息:浸潤(rùn)的免疫細(xì)胞的組成和功能定向以及腫瘤抗原的來(lái)源和數(shù)量。

使用基因組數(shù)據(jù)確定腫瘤浸潤(rùn)的細(xì)胞組成
由于不同類型的TIL對(duì)腫瘤進(jìn)展有不同的影響,確定腫瘤中免疫浸潤(rùn)的細(xì)胞組成不僅提供了預(yù)后信息,而且還可以促進(jìn)標(biāo)志物預(yù)測(cè)和新治療策略的發(fā)展。成像和細(xì)胞表型技術(shù)被廣泛使用,可以提供有關(guān)免疫結(jié)構(gòu)的部分信息,但細(xì)胞表型分析技術(shù)的固有局限性阻礙了大量TIL亞群的特征化。因此,研究人員開發(fā)了計(jì)算基因組工具以提供TIL的全面圖像。應(yīng)用于此目的的計(jì)算基因組學(xué)工具可以分組為基因集富集分析(GSEA)和去卷積方法(圖3a)。值得注意的是,GSEA和反卷積方法都依賴于個(gè)體細(xì)胞群的表達(dá)譜矩陣。用這些方法重建的TIL亞群包括在表達(dá)譜的參考矩陣中定義的免疫亞群。
富集方法依賴于基因集分析技術(shù),基于樣本之間的比較或單樣本方法。 GSEA評(píng)估排序基因列表,用于統(tǒng)計(jì)富集參與某種途徑和細(xì)胞過程的基因。在比較方法中,基于兩種生物狀態(tài)之間的差異表達(dá)對(duì)基因進(jìn)行排序?;蛘撸梢允褂脝螛颖綠SEA(ssGSEA)富集評(píng)分,表示特定基因組中的哪些基因在單個(gè)樣品中上調(diào)或下調(diào)了。 GSEA可用于解釋從微陣列或RNA-seq獲得的基因表達(dá)數(shù)據(jù)。
GSEA的優(yōu)勢(shì)在于它可以使用現(xiàn)有工具輕松應(yīng)用,與傳統(tǒng)的基因表達(dá)分析相比,沒有額外的樣本量要求。GSEA的必要要求是與特定免疫亞群相關(guān)的基因標(biāo)記的組裝(圖3b)。在一項(xiàng)開創(chuàng)性研究中,從免疫和非免疫細(xì)胞的全血微陣列表達(dá)數(shù)據(jù)中定義了一組免疫特征基因34。最近,來(lái)自人免疫學(xué)項(xiàng)目的免疫學(xué)特征的基因集合(ImmuneSigDB)35被收錄到分子特征數(shù)據(jù)庫(kù)(MSigDB)36中。通過分析389項(xiàng)關(guān)于小鼠和人體免疫系統(tǒng)中細(xì)胞狀態(tài)和擾動(dòng)的已發(fā)表研究,產(chǎn)生了約5,000個(gè)注釋良好的基因的補(bǔ)充35。
解卷積方法使用表達(dá)特征矩陣從來(lái)自細(xì)胞混合物的表達(dá)數(shù)據(jù)推斷特定細(xì)胞比例(圖3c)?;谠撍惴?,開發(fā)了一種使用二次規(guī)劃進(jìn)行異質(zhì)組織去卷積的R包.37。這個(gè)名為DeconRNASeq的軟件包可以處理RNA-seq數(shù)據(jù),但它僅在少數(shù)細(xì)胞類型的混合物上得到驗(yàn)證。已經(jīng)開發(fā)了幾種其他方法,其使用各種技術(shù)來(lái)解決病態(tài)反問題(表1)。最近,一種用于從大塊腫瘤的微陣列數(shù)據(jù)推斷白細(xì)胞亞型的計(jì)算方法(稱為CIBERSORT)被引入38。 CIBERSORT使用22個(gè)白細(xì)胞亞群的信號(hào)表達(dá)矩陣并實(shí)現(xiàn)線性支持向量回歸38。盡管計(jì)算方法有各種成功的應(yīng)用,但仍有幾個(gè)問題需要改進(jìn)30。首先,需要具有基因表達(dá)譜的參考矩陣,所述基因表達(dá)譜來(lái)自血液樣品或優(yōu)選來(lái)自使用RNA-seq的腫瘤樣品的分選的免疫細(xì)胞亞群。其次,由于解卷積對(duì)噪聲敏感,因此必須開發(fā)和實(shí)現(xiàn)魯棒算法。第三,需要使用獨(dú)立方法驗(yàn)證方法,例如熒光激活細(xì)胞分選(FACS)或免疫組織化學(xué)。
與基于基因表達(dá)譜的去卷積方法一樣,細(xì)胞譜系特異性DNA甲基化模式可用于檢測(cè)和量化白細(xì)胞亞群39。為此目的,使用微陣列平臺(tái)(即,Illumina Infinium 27k和450k DNA甲基化陣列),使用來(lái)自少數(shù)甲基化CpG基因座的信息到全基因組基因座開發(fā)了許多方法和工具39-41。將這種方法應(yīng)用于亞硫酸氫鹽測(cè)序技術(shù)的數(shù)據(jù)非常簡(jiǎn)單。從表觀基因組關(guān)聯(lián)研究中可以明顯看出,表觀基因組在不同細(xì)胞類型中的變異很大42。


腫瘤抗原的鑒定
T細(xì)胞能夠識(shí)別與腫瘤細(xì)胞的MHC分子結(jié)合的腫瘤特異性抗原而排斥腫瘤。具有高腫瘤特異性的抗原 - 即由腫瘤細(xì)胞展示而不是由正常細(xì)胞展示 - 具有引發(fā)腫瘤特異性免疫應(yīng)答的潛力,從而將不良副作用的風(fēng)險(xiǎn)降至最低,因此對(duì)于諸如工程化T細(xì)胞和治療性疫苗的癌癥免疫療法具有重要意義。
三類抗原具有高腫瘤特異性:首先是病毒抗原,其源自在病毒感染的腫瘤細(xì)胞中表達(dá)的病毒基因;第二種是癌癥種系抗原(CGAs),是通常僅由滋養(yǎng)細(xì)胞和種系細(xì)胞表達(dá)但在腫瘤細(xì)胞中具有異常表達(dá)的蛋白質(zhì);第三種是新抗原,它們是由體細(xì)胞突變基因的表達(dá)產(chǎn)生的肽鏈。自從發(fā)現(xiàn)第一個(gè)CGA,黑色素瘤抗原1(MAGE1;也稱為MAGEA1)被鑒定以來(lái),已經(jīng)在幾種腫瘤類型中鑒定到表達(dá)的大量癌癥種系基因。迄今為止,Cancer-Testis數(shù)據(jù)庫(kù)包含了有關(guān)CGA,和其在腫瘤和正常組織中的表達(dá)以及誘導(dǎo)的免疫應(yīng)答的信息。利用可用的CGA列表,可直接在腫瘤和正常樣品的RNA-seq數(shù)據(jù)中提取它們的表達(dá)水平。
新抗原可被認(rèn)為具有嚴(yán)格的腫瘤特異性,因?yàn)樗鼈冊(cè)从趷盒约?xì)胞中的突變基因的表達(dá),但不存在于正?;蚪M中。為了引發(fā)免疫應(yīng)答,必須將突變的蛋白質(zhì)蛋白水解加工成短肽,然后與MHC分子結(jié)合,以呈遞給T細(xì)胞(圖4)。當(dāng)從匹配的腫瘤和正常樣品中獲得NGS數(shù)據(jù)時(shí),可以通過整合三個(gè)計(jì)算任務(wù)來(lái)計(jì)算新抗原(圖4):從匹配的腫瘤-正常樣品中鑒定突變蛋白,然后進(jìn)行HLA分型和然后預(yù)測(cè)新抗原-MHC的結(jié)合親和力。

組裝分析管道
在組裝癌癥免疫基因組學(xué)的計(jì)算流程時(shí),必須特別注意評(píng)估數(shù)據(jù)是否允許提取無(wú)偏見和有意義的信息。例如,閱讀長(zhǎng)度和覆蓋深度對(duì)來(lái)自測(cè)序數(shù)據(jù)的免疫庫(kù)和HLA等位基因的分析具有強(qiáng)烈影響。此外,還必須考慮用于生成數(shù)據(jù)的測(cè)序平臺(tái),以確定所選工具是否能夠區(qū)分平臺(tái)特異性測(cè)序錯(cuò)誤與真實(shí)變體。另一個(gè)需要考慮的問題是批次效應(yīng),它是由不同實(shí)驗(yàn)條件引起的變異的技術(shù)來(lái)源。 可以使用降維工具(例如主成分分析)識(shí)別這些假象,并隨后使用替代變量分析進(jìn)行校正。
直到最近,才報(bào)道了整合多個(gè)分析步驟的新抗原預(yù)測(cè)的計(jì)算解決方案(表1)。除NetTepi90外,目前還有其他解決方案,例如:NetCTLpan110,這是一種用于預(yù)測(cè)蛋白質(zhì)分裂,TAP轉(zhuǎn)運(yùn)和pMHC結(jié)合的泛特異性方法; EpiToolkit111,是一個(gè)基于Web的平臺(tái),用于靈活整合預(yù)先選擇的計(jì)算模塊,用于表位預(yù)測(cè)和優(yōu)先級(jí)排序; FRED 2(REF.112),它是HLA分型,表位預(yù)測(cè)和選擇的網(wǎng)絡(luò)資源,也允許定制管道的原型設(shè)計(jì);和pVAC-Seq113,它是一種新的抗原鑒定管道,可以考慮突變覆蓋率,變異等位基因頻率和突變基因的表達(dá)。隨著云計(jì)算解決方案可用性的增加,我們預(yù)計(jì)在不久的將來(lái),將開發(fā)利用這種計(jì)算基礎(chǔ)設(shè)施的癌癥免疫基因組學(xué)分析管道。

