一套數(shù)據(jù)建立預(yù)后模型也能發(fā)4分+?


文章簡介 ???

Development of an autophagy-related gene expression signature for prognosis prediction in prostate cancer patients

構(gòu)建與自噬相關(guān)signature來預(yù)測前列腺癌患者的預(yù)后狀態(tài)發(fā)表期刊:

J Transl Med? ?發(fā)表日期:2020 Apr 7影響因子:4.24DOI: 10.1186/s12967-020-02323-x

1. 流程圖,在后臺回復(fù)“20200706”獲取?

2. 研究背景?

自噬是一個(gè)維持細(xì)胞內(nèi)環(huán)境穩(wěn)定的重要過程,也稱為II型程序性細(xì)胞死亡,自噬過程發(fā)生異常與多種疾病密切相關(guān),如免疫紊亂、神經(jīng)型性疾病和癌癥。

一些研究報(bào)告表明,自噬在癌癥發(fā)展的不同階段可能對腫瘤進(jìn)展或腫瘤抑制發(fā)揮重要的作用。

前列腺癌(PCa)是泌尿系統(tǒng)常見的惡性腫瘤,在歐美地區(qū)男性相關(guān)癌癥中死亡率排名第二。盡管,大多數(shù)早期PCa患者預(yù)后良好,死亡率較低,然而大量PCa患者對雄激素治療(ADT)產(chǎn)生耐藥性,導(dǎo)致生存時(shí)間較短。

研究發(fā)生自噬與前列腺癌的多種生物學(xué)過程之間有密切關(guān)系,然而,眾多基因表達(dá)signature很少用來研究自噬與前列腺癌預(yù)后之間的關(guān)系。作者為了更了解腫瘤相關(guān)基因?qū)εR床結(jié)果的影響,基于癌癥基因組圖譜(TCGA)數(shù)據(jù)庫,構(gòu)建了一個(gè)基因signature,來預(yù)測患者的預(yù)后情況。

3. 材料和方法?

1.數(shù)據(jù)來源

特征基因集:234個(gè)自噬相關(guān)基因(ARGs),來源于人類自噬數(shù)據(jù)庫(HADb)

表達(dá)譜矩陣:來源于TCGA數(shù)據(jù),包括485個(gè)前列腺癌組織樣本和51個(gè)相鄰的非腫瘤組織樣本。

臨床生存信息:來源于cBioPortal數(shù)據(jù)庫,包含OS和DFS

2.生物信息分析

差異基因分析:R軟件包limma,閾值:|log2 (FC)|>?2 和FDR <?0.05.

富集分析:DAVID網(wǎng)站進(jìn)行GO富集分析,閾值:FDR <?0.05.,R軟件包ggplot2和GOplot進(jìn)行可視化

3.構(gòu)建預(yù)后模型

單因素cox回歸分析、多因素cox回歸分析建立預(yù)后模型,ROC曲線評估模型的預(yù)后性能

4. 主要結(jié)果展示?

1.腫瘤組織和正常組織樣本中識別差異ARGs

作者首先從TCGA數(shù)據(jù)集中提取出234個(gè)ARGs,設(shè)定閾值:|log2 (FC)|>?2,在正常組織和PCa組織中共篩選出13個(gè)ARGs(圖1A-C),其中包含5個(gè)上調(diào)基因(ATG9B、BIRC5、CAMKK2、CDKN2A和NKX2-3)和8個(gè)下調(diào)基因(DNAJB1、FAM215A、HSPB8、ITGB4、ITPR1、NRG1、NRG2和TP63)。


圖1.篩選與自噬相關(guān)的差異基因

2.差異ARGs進(jìn)行GO功能富集分析

使用DAVID網(wǎng)站對差異ARGs進(jìn)行GO功能富集分析,結(jié)果顯示這些基因在 autophagy、process utilizing autophagic mechanism和odontogenesis of dentin-containing tooth過程中顯著富集(圖2A-B)。

3.構(gòu)建預(yù)后風(fēng)險(xiǎn)模型

作者首先將正常組織樣本剔除丟,將485個(gè)帶有OS和DFS生存信息的癌癥樣本用于構(gòu)建預(yù)后模型。首先作者對ARGs進(jìn)行單因素cox風(fēng)險(xiǎn)分析,結(jié)果顯示有14個(gè)基因與患者的OS顯著相關(guān),然后作者對單基因顯著分析的基因進(jìn)行多因素cox回歸分析,結(jié)果顯示有5個(gè)基因(FAM215A,F(xiàn)DD,MYC,RHEB和ATG16L1)與患者的OS顯著相關(guān)。

最后作者基于多因素cox回歸分析建立了一個(gè)風(fēng)險(xiǎn)評分公式,

即 OS-risk score = 17.20896*FAM215A? +? 4.319028*FADD ?+? 0.674838*MYC ?+ 1.869633* ?RHEB + ?2.071004* ATG16L1。

并且基于這個(gè)公式對485個(gè)PCa患者進(jìn)行風(fēng)險(xiǎn)評分,并根據(jù)所有患者風(fēng)險(xiǎn)得分的中位數(shù)將患者分為高低風(fēng)險(xiǎn)兩組,KM生存曲線顯示低風(fēng)險(xiǎn)組患者的死亡率顯著低于高風(fēng)險(xiǎn)組(HR?=?6.391, 95% CI?=?1.581–25.840, P?<?0.001,圖3A) 。ROC曲線顯示模型AUC=0.84,說明風(fēng)險(xiǎn)模型對患者預(yù)后的預(yù)測具有高的準(zhǔn)確性(圖3B),TCGA數(shù)據(jù)集中患者的OS與風(fēng)險(xiǎn)得分、和基因表達(dá)量之間的關(guān)系如圖3C-D。


圖3. 構(gòu)建與OS相關(guān)的風(fēng)險(xiǎn)模型

接下來,作者分析模型中每個(gè)基因?qū)颊呱媲闆r的影響,并根據(jù)基因表達(dá)值的中值將患者分為高低風(fēng)險(xiǎn),結(jié)果顯示5個(gè)基因中有3個(gè)基因能將患者分為高低風(fēng)險(xiǎn)兩組(圖4),即FAM215A (HR?=?4.347, 95% CI?=?1.175–16.290, P?=?0.041)、FADD (HR?=?7.009, 95% CI?=?1.892–25.960, P?=?0.031)和MYC (HR?=?7.153, 95% CI?=?1.932–26.470, P?=?0.029),且高表達(dá)預(yù)后患者預(yù)后好。


圖4.風(fēng)險(xiǎn)模型基因表達(dá)情況與患者OS的關(guān)系

進(jìn)一步,作者利用TCGA數(shù)據(jù)集樣本攜帶的DFS信息,分析了ARGs與患者DFS的關(guān)系。在單因素cox比例分析中有53個(gè)ARGs與患者的DFS顯著相關(guān),在多因素cox回歸分析,有22個(gè)ARGs與患者的DFS顯著相關(guān)。然后基于多因素cox回歸分析建立了一個(gè)風(fēng)險(xiǎn)評分公式:

DFS -risk score =?0.97225* ?ULK2? + ???1.74297* ?NLRC4? + ???1.11799* ?MAPK1? + ???1.12182* ?ATG4D? + ???0.73348* ?MAPK3? + ?1.40252* ?ATG2A? + ???0.49364* ?ATG9B? + ???1.09886* ?FOXO1? + ???0.68955* ?PTEN? + ?1.80095* ?HDAC6? + ???0.99993* ?PRKN? + ?0.35846* ?HSPB8? + ???0.51552* ?P4HB? + ?1.56551* ?MAP2K7? + ???0.96348* ?MTOR? + ?1.65516* ?RHEB? + ?0.73934* ?TSC1? + ?0.27799* ?BIRC5? + ?1.43484* ?RGS19? + ???0.63037* ?RAB24? + ???0.28580* ?PTK6? + ???1.05312* ?NRG2.

并且基于這個(gè)公式對485個(gè)PCa患者進(jìn)行風(fēng)險(xiǎn)評分,并根據(jù)所有患者風(fēng)險(xiǎn)得分的中位數(shù)將患者分為高低風(fēng)險(xiǎn)兩組,KM生存曲線顯示低風(fēng)險(xiǎn)組患者的DFS顯著低于高風(fēng)險(xiǎn)組(HR = 7.407,95%CI = 4.850-11.320,P <0.001,圖5A) 。ROC曲線顯示模型AUC=0.85,說明風(fēng)險(xiǎn)模型對患者DFS的預(yù)測具有高的準(zhǔn)確性(圖5B),TCGA數(shù)據(jù)集中患者的DFS與風(fēng)險(xiǎn)得分、和基因表達(dá)量之間的關(guān)系如圖5C-D。

圖5. 構(gòu)建與DFS相關(guān)的風(fēng)險(xiǎn)模型

接下來,作者分析模型中每個(gè)基因?qū)颊逥FS的影響,并根據(jù)基因表達(dá)值的中值將患者分為高低風(fēng)險(xiǎn),結(jié)果顯示22個(gè)基因中有10個(gè)基因表達(dá)水平高患者預(yù)后好,且能將顯著的將患者分為高低風(fēng)險(xiǎn)兩組(圖6),

即ATG2A (HR?=?2.266, 95% CI?=?1.492–3.442, P?<?0.001), ATG4D (HR?=?1.665, 95% CI?=?1.096–2.530, P?=?0.017), ATG9B (HR?=?1.803, 95% CI?=?1.187–2.738, P?=?0.007), BIRC5 (HR?=?2.013, 95% CI?=?1.384–3.195, P?<?0.001), MAPK3 (HR?=?2.148, 95% CI?=?1.414–3.263, P?<?0.001), NLRC4 (HR?=?2.053, 95% CI?=?1.352–3.119, P?=?0.001), RAB24 (HR?=?2.811, 95% CI?=?1.851–4.270, P?<?0.001), RGS19 (HR?=?2.019, 95% CI?=?1.329–3.068, P?=?0.001), RHEB (HR?=?2.137, 95% CI?=?1.407–3.245, P?<?0.001), ULK2 (HR?=?1.579, 95% CI?=?1.039–2.399, P?=?0.033), 和 TSC1 (HR?=?1.622, 95% CI?=?1.067–2.464, P?=?0.024) 。


圖6.風(fēng)險(xiǎn)模型基因表達(dá)情況與患者DFS的關(guān)系(高表達(dá)患者預(yù)后好)

有5個(gè)基因表達(dá)水平高患者預(yù)后差,且能將顯著的將患者分為高低風(fēng)險(xiǎn)兩組(圖7),即 FOXO1 (HR?=?2.087, 95% CI?=?1.373–3.172, P?<?0.001), HSPB8 (HR?=?1.673, 95% CI?=?1.101–2.541, P?=?0.017), MTOR (HR?=?1.897, 95% CI?=?1.247–2.885, P?=?0.002), NRG2 (HR?=?1.944, 95% CI?=?1.280–2.955, P?=?0.002) 和PRKN (HR?=?2.308, 95% CI?=?1.518–3.508, P?<?0.001)。


圖7.風(fēng)險(xiǎn)模型基因表達(dá)情況與患者DFS的關(guān)系(高表達(dá)患者預(yù)后差)

4.風(fēng)險(xiǎn)模型對不同類型臨床患者的預(yù)測性能

最后作者分析風(fēng)險(xiǎn)模型對不同臨床類型的患者的預(yù)后情況進(jìn)行預(yù)測,結(jié)果顯示:OS相關(guān)的基因風(fēng)險(xiǎn)模型中,T3-4患者的風(fēng)險(xiǎn)得分比T1-2要高且兩組之間存在顯著差異(P?=?0.008), Gleason得分大于7的患者的風(fēng)險(xiǎn)得分比小于7患者的風(fēng)險(xiǎn)的高且兩組之間存在顯著差異(P?=?0.015),而在不同階段的年齡和不同N分期患者的風(fēng)險(xiǎn)得分沒有出現(xiàn)差異(圖8)。


圖8.OS相關(guān)預(yù)后模型對不同臨床類型患者的預(yù)測性能

DFS相關(guān)的基因風(fēng)險(xiǎn)模型中,T3-4患者的風(fēng)險(xiǎn)得分比T1-2要高且兩組之間存在顯著差異(P<0.001), N1患者的風(fēng)險(xiǎn)得分比N2要高且兩組之間存在顯著差異(P<0.001),Gleason得分大于7的患者的風(fēng)險(xiǎn)得分比小于7患者的風(fēng)險(xiǎn)得分高且兩組之間存在顯著差異(P<0.001),而在不同階段的年齡患者的風(fēng)險(xiǎn)得分沒有出現(xiàn)差異(圖9)。


圖9.OS相關(guān)預(yù)后模型對不同臨床類型患者的預(yù)測性能

好了,以上就是我對這篇文獻(xiàn)的思考,希望對你們有一些幫助。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容