A genomewide transcriptomic approach identifies a novel gene expression signature for the detection of lymph node metastasis in patients with early stage gastric cancer
全基因組轉(zhuǎn)錄組學(xué)方法確定了檢測(cè)早期胃癌患者淋巴結(jié)轉(zhuǎn)移的新基因表達(dá)特征
發(fā)表期刊:EBioMedicine
發(fā)表日期:2019 Mar
DOI:? 10.1016/j.ebiom.2019.01.057

一、背景
????????淋巴結(jié)轉(zhuǎn)移(LN)是影響胃癌(GC)患者預(yù)后不佳的主要因素之一。因此,在治療前準(zhǔn)確識(shí)別LN狀態(tài),特別是在早期階段(粘膜和粘膜下),是改善患者的治療策略和生存結(jié)果的關(guān)鍵。
????????近幾十年來(lái),一些基于基因表達(dá)的分類器已經(jīng)被開發(fā)出來(lái),作為診斷和預(yù)測(cè)工具用于各種類型的癌癥。例如,Oncotype DX是一種商業(yè)化的測(cè)試,包括對(duì)預(yù)測(cè)乳腺癌和結(jié)直腸癌復(fù)發(fā)風(fēng)險(xiǎn)的一組基因的分析。類似的基于基因表達(dá)的預(yù)后和預(yù)測(cè)分類法也被開發(fā)出來(lái)用于GC患者;然而,它們的臨床作用有限。
二、材料與方法
1.數(shù)據(jù)來(lái)源
1)TCGA數(shù)據(jù):RNA-seq數(shù)據(jù)測(cè)量了20531個(gè)基因的表達(dá)水平,并在基因水平RSEM文件中進(jìn)行了比例估計(jì),這些基因通過乘以10轉(zhuǎn)換為TPM(每百萬(wàn)的轉(zhuǎn)錄本)6,然后對(duì) log2 進(jìn)行轉(zhuǎn)換。ACRG (GSE62254)數(shù)據(jù)集是使用R中的生物導(dǎo)體包“GEOquery”直接從GEO數(shù)據(jù)庫(kù)以處理形式從GEO數(shù)據(jù)庫(kù)下載的。
2)為了進(jìn)行臨床驗(yàn)證,檢查了來(lái)自兩個(gè)獨(dú)立的T1和T2早期GCs患者隊(duì)列的248個(gè)組織標(biāo)本,它們被稱為臨床隊(duì)列-1(測(cè)試隊(duì)列)和臨床隊(duì)列-2(驗(yàn)證隊(duì)列);包括來(lái)自LN陽(yáng)性(LNP)和LN陰性(LNN)患者的50份和198份未經(jīng)預(yù)處理的標(biāo)本。
????????由于GC診斷和治療決策主要在內(nèi)鏡切除后決定,考慮到在內(nèi)鏡檢查期間這些病變可能被低估,還納入了T2病變。在對(duì)手術(shù)組織進(jìn)行病理學(xué)復(fù)查后診斷淋巴血管浸潤(rùn),并從各參與機(jī)構(gòu)收集血清癌胚抗原(CEA)和癌癥抗原(CA)19-9水平的數(shù)據(jù)。
2.實(shí)驗(yàn)流程
1)生物標(biāo)志物發(fā)現(xiàn):基于TCGA數(shù)據(jù)集中T1患者標(biāo)本的RNA-Seq數(shù)據(jù)對(duì)5個(gè)LNP和13個(gè)LNN GC患者之間差異表達(dá)的15個(gè)基因進(jìn)行了優(yōu)先排序;用這15個(gè)基因作為協(xié)變量建立了一個(gè)多變量邏輯回歸模型;數(shù)據(jù)驗(yàn)證。
2)臨床驗(yàn)證:分析了兩個(gè)大型的獨(dú)立患者隊(duì)列,以驗(yàn)證在發(fā)現(xiàn)階段確定的15個(gè)基因特征
3)RNA分離和定量反轉(zhuǎn)錄PCR
4)統(tǒng)計(jì)學(xué)分析:Wilcoxon's signed-rank檢驗(yàn)、Mann-Whitney U檢驗(yàn)和Kruskal-Wallis檢驗(yàn);從15個(gè)基因的多變量邏輯回歸模型中得出的風(fēng)險(xiǎn)分?jǐn)?shù)被用來(lái)繪制接受操作特征(ROC)曲線并計(jì)算曲線下的面積(AUCs)
三、實(shí)驗(yàn)結(jié)果
01、在全基因組范圍內(nèi)發(fā)現(xiàn)檢測(cè)早期胃癌淋巴結(jié)轉(zhuǎn)移的新型基因表達(dá)特征
????????為了確定能夠幫助診斷淋巴結(jié)轉(zhuǎn)移患者的基因,作者首先分析了18名早期T1癌癥患者的RNA-seq表達(dá)譜數(shù)據(jù),這些患者的LN轉(zhuǎn)移陽(yáng)性或陰性。在總共20531個(gè)基因中,有84個(gè)基因在5個(gè)淋巴結(jié)陽(yáng)性(LNP)和13個(gè)陰性(LNN)患者之間存在差異表達(dá)(圖1a)。為了確定一個(gè)強(qiáng)大的候選基因特征,通過過濾低表達(dá)的基因,將基因列表進(jìn)一步縮小到15個(gè)。使用多元Logistic回歸分析,發(fā)現(xiàn)這15個(gè)候選基因能夠成功區(qū)分訓(xùn)練集中的LNP和LNN GC患者(AUC = 1.000,圖1b)。
????????鑒于有多個(gè)由T2 GC患者組成的公共數(shù)據(jù)集,作者接下來(lái)研究了T1淋巴結(jié)轉(zhuǎn)移GC基因特征是否也能在這些額外的患者群中識(shí)別LN狀態(tài)。在TCGA隊(duì)列的96名T1和T2患者的擴(kuò)大集合(AUC =0.839,圖1c),以及在188名T2患者的ACRG隊(duì)列中(AUC =0.829,圖1d)中,基因能夠區(qū)分LNP和LNN患者。這些數(shù)據(jù)突出了新型15基因在識(shí)別早期胃癌患者LN轉(zhuǎn)移中的診斷潛力。

02、驗(yàn)證和建立用于檢測(cè)胃癌患者淋巴結(jié)狀態(tài)的15個(gè)基因特征
????????接下來(lái),通過qRT-PCR對(duì)臨床隊(duì)列-1(n = 101)中的24個(gè)LNP和77個(gè)LNN組織標(biāo)本評(píng)估了15個(gè)基因組合的診斷準(zhǔn)確性。雖然單個(gè)基因的預(yù)測(cè)能力有限,但各種基因的組合在識(shí)別GC患者的LN轉(zhuǎn)移方面表現(xiàn)出明顯的檢測(cè)能力。利用多元Logistic回歸分析,得到了15個(gè)基因特征的風(fēng)險(xiǎn)評(píng)分公式如下,風(fēng)險(xiǎn)評(píng)分=1.300-(0.233 × C5AR1)-(0.274× CD83)+(0.048 × ETV4)-(0.213 × FAM13A)+(0. 207 × FKBP10)-(0.227× GPRIN3)+(0.052 × LCK)+(0.124 × NR4A2)+(0.402 × PRSS21)+(0.035× RGPD1)-(0.196 × SLC2A3)-(0.212 × SLFN2)+(0.174 × TEM86B)-(0.118× TRPV4)-(0.075 × YBX2)。盡管每個(gè)單獨(dú)的基因的性能并不明顯,但在這個(gè)測(cè)試隊(duì)列中,使用這個(gè)公式為患者確定的LN轉(zhuǎn)移的風(fēng)險(xiǎn)分?jǐn)?shù)顯示了強(qiáng)大的診斷性能(AUC = 0.765,圖2a)。
????????值得注意的是,在識(shí)別LNP患者方面,15個(gè)基因特征與傳統(tǒng)的腫瘤標(biāo)志物CEA和CA19-9(圖2b)相比有明顯優(yōu)勢(shì)。為了進(jìn)一步驗(yàn)證這15個(gè)基因特征的診斷效率,作者接下來(lái)使用多元Logistic回歸分析,在一個(gè)由26名LNP和121名LNN T1 GC患者組成的獨(dú)立驗(yàn)證隊(duì)列中檢查其性能。與測(cè)試隊(duì)列的結(jié)果一致,15個(gè)基因特征再次能夠有力地區(qū)分LNP和LNN早期GC患者(AUC=0.742,圖2b)。
03、15個(gè)基因簽名在胃癌患者的LN轉(zhuǎn)移檢測(cè)中表現(xiàn)優(yōu)于傳統(tǒng)的診斷方法
????????通過多變量分析,作者證明了15個(gè)基因特征能夠成功地檢測(cè)出LN轉(zhuǎn)移,而不受術(shù)前臨床因素如年齡、性別、腫瘤標(biāo)志物和計(jì)算機(jī)斷層掃描確定的臨床LN狀態(tài)影響(Table 3)。為了進(jìn)一步評(píng)估這一特征的意義,接下來(lái)比較了15-基因特征與各種術(shù)前臨床因素(包括腫瘤標(biāo)志物和臨床LN狀態(tài))的診斷潛力。發(fā)現(xiàn)15-基因特征的診斷價(jià)值明顯優(yōu)于傳統(tǒng)的腫瘤標(biāo)志物,包括循環(huán)CEA水平和CA19-9(圖2b)。

????????此外,為了評(píng)估15-基因特征的性能,作者將其性能與驗(yàn)證隊(duì)列中的患者術(shù)前診斷性CT掃描確定的臨床N期進(jìn)行了比較。與CT成像數(shù)據(jù)相比,基因表達(dá)特征在識(shí)別LN轉(zhuǎn)移的存在方面表現(xiàn)出明顯優(yōu)越的準(zhǔn)確性(AUC = 0.742,圖2c),后者的AUC僅為0.595。
04、15個(gè)基因特征與其他臨床病理特征相結(jié)合,進(jìn)一步提高了胃癌患者LN轉(zhuǎn)移檢測(cè)的診斷準(zhǔn)確性
????????接下來(lái)探索將15-基因特征與目前使用的臨床病理因素(如年齡、性別、腫瘤標(biāo)志物和使用多變量邏輯回歸分析的臨床N期)結(jié)合起來(lái),是否會(huì)進(jìn)一步提高診斷準(zhǔn)確性。與單獨(dú)使用15-基因特征相比,將基因表達(dá)特征與臨床N期相結(jié)合,確實(shí)顯著提高了生物標(biāo)志物在識(shí)別LNP胃癌病例方面的鑒別準(zhǔn)確性(AUC=0.789)(圖2d)。

四、結(jié)論
????????作者開發(fā)了一個(gè)新的15-基因特征,有可能用于識(shí)別早期GC患者的LN轉(zhuǎn)移。在前瞻性臨床隊(duì)列中得到進(jìn)一步驗(yàn)證之前,這些標(biāo)志物為識(shí)別胃癌患者的LN轉(zhuǎn)移提供了很好的潛力。