NER基因特征為晚期 HGSOC 患者制定個性化治療策略(IF6+)

Analysis of Omics Data Reveals Nucleotide Excision Repair-Related Genes Signature in Highly-Grade Serous Ovarian Cancer to Predict Prognosis

組學(xué)數(shù)據(jù)分析顯示高級漿液性卵巢癌的核苷酸切除修復(fù)相關(guān)基因特征可預(yù)測預(yù)后

發(fā)表期刊:Front Cell Dev Biol

發(fā)表日期:2022 Jun 13

DOI:? 10.3389/fcell.2022.874588

期刊相關(guān)信息

一、背景

????????在所有的卵巢癌中,高級別漿液性卵巢癌(HGSOC)它占了卵巢癌死亡人數(shù)的70%-80%。其致癌模式、分子遺傳特征和起源都與低級別漿液性卵巢癌不同。由于缺乏有效的卵巢癌早期篩查方法,幾乎90%的漿液性卵巢癌患者在初診時被診斷為III-IV期,而HGSOC晚期患者的10年生存率僅為15%。

????????DNA損傷反應(yīng)和修復(fù)途徑在卵巢癌的發(fā)生和發(fā)展中起著至關(guān)重要的調(diào)節(jié)作用,DNA修復(fù)機(jī)制主要包含各種途徑,如錯配修復(fù)、堿基切除修復(fù)、核苷酸切除修復(fù)(NER)、同源重組和非同源末端連接。重要的是,HGSOC大多伴隨著與NER途徑密切相關(guān)的P53突變。

????????近年來,大量研究報道了NER相關(guān)基因,如ERCC1,XPC和GTF2H5,可用作腫瘤患者治療反應(yīng)或預(yù)后的生物標(biāo)志物。然而,盡管NER在卵巢癌領(lǐng)域的關(guān)注度增加,但仍缺乏對HGSOC晚期患者NER相關(guān)基因的全面分析,以評估預(yù)后并有效指導(dǎo)治療策略。

二、材料與方法

1.數(shù)據(jù)來源

1) 從TCGA獲取378個卵巢癌組織,從GTEx獲取88個正常卵巢組織的RNA-seq數(shù)據(jù)的每千堿基轉(zhuǎn)錄片段(FPKM);最終有326個晚期HGSOC樣本的RNA-seq數(shù)據(jù)和臨床數(shù)據(jù)被納入分析中。

2)4套GEO數(shù)據(jù):GSE13876(N = 415)、GSE49997(N = 204)、GSE17260(N = 110)、GSE63885(N = 101);將三個數(shù)據(jù)集[GSE49997(N = 166)、GSE17260(N = 110)和GSE63885(N = 70)]的346個符合標(biāo)準(zhǔn)的樣本整合為一個聯(lián)合驗(yàn)證集

3)根據(jù)以前的研究,TCGA-GTEx和4套GEO 數(shù)據(jù)集中與核苷酸切除修復(fù) (NER) 相關(guān)的31個共同基因。

2.實(shí)驗(yàn)流程

研究設(shè)計和分析的流程圖

三、實(shí)驗(yàn)結(jié)果

01、31個NER相關(guān)基因的表達(dá)情況

????????為了更好地了解NER相關(guān)基因在腫瘤發(fā)生和發(fā)展中的重要性,作者首先研究了合并的TCGA-GTEx數(shù)據(jù)集中不同組織樣本中的NER相關(guān)基因的表達(dá)水平。TCGA-GTEx隊列包括326名晚期HGSOC患者和88名健康捐贈者的卵巢。在所有數(shù)據(jù)集的8466個共同基因中選擇了31個NER相關(guān)的候選基因進(jìn)行進(jìn)一步分析(圖1A)。然后,這31個基因的mRNA表達(dá)水平通過熱圖展示給HGSOC和相應(yīng)的正常對照組(圖1B)。總的來說,與正常對照組相比,HGSOC組織中13個NER相關(guān)基因的表達(dá)水平明顯增加,15個基因明顯下調(diào)(圖1C),3個基因(包括POLR2B、ERCC4和POLR2A)的表達(dá)水平?jīng)]有顯著差異。

圖1 TCGA HGSOC隊列和GTEx正常卵巢隊列中腫瘤樣本和正常樣本之間NER相關(guān)基因的表達(dá)水平

????????31個NER相關(guān)基因之間的相互作用關(guān)系由PPI網(wǎng)絡(luò)顯示,圖2中統(tǒng)計了每個基因的相互作用數(shù)量。31個基因之間的相互關(guān)系具有高度的緊密性和高度的復(fù)雜性(圖2A)。除CUL3和CUL5外,其他29個基因似乎是相互作用網(wǎng)絡(luò)的樞紐基因,因?yàn)樗鼈兣c一半以上的基因有相互作用(圖2B)。作者還進(jìn)行了相關(guān)性分析,觀察到HGSOC中的一些NER相關(guān)基因之間存在不同程度的正負(fù)共線性關(guān)系(圖2C)。31個NER相關(guān)基因的相關(guān)性變化可能反映了相應(yīng)轉(zhuǎn)錄功能蛋白之間的拮抗或協(xié)同作用的內(nèi)在特點(diǎn)。

圖2 31個NER相關(guān)基因之間的相互作用和關(guān)聯(lián)性

02、NER相關(guān)基因的共識聚類確定了具有不同預(yù)后結(jié)果的兩個HGSOC亞型

????????接下來,選擇TCGA HGSOC樣本進(jìn)行后續(xù)的共識聚類分析。根據(jù)31個NER相關(guān)基因的表達(dá)相似性,當(dāng)聚類穩(wěn)定性數(shù)據(jù)集從k=2-9增加時,k=2可能是最佳選擇(圖3A-C),每組的樣本數(shù)分布大致平衡,當(dāng)k = 2時,兩組之間的干擾最?。▓D3C)。因此,通過共識聚類分析,TCGA HGSOC樣本被分為兩組(184個樣本在第一組,142個樣本在第二組)。此外,主成分分析(PCA)被用來比較兩個亞型之間轉(zhuǎn)錄譜的差異,結(jié)果顯示出明顯的區(qū)別(圖3D)。此外,發(fā)現(xiàn)亞型1中的晚期HGSOC患者的OS明顯低于亞型2中的患者,這表明31個NER相關(guān)基因可以在預(yù)后層面上對晚期HGSOC患者進(jìn)行分類(圖3E)。然后分析了亞型與臨床病理特征之間的關(guān)聯(lián)。然而,在年齡、等級、分期、治療反應(yīng)和殘余腫瘤方面,兩個亞型之間沒有發(fā)現(xiàn)明顯的差異。

圖3????共識聚類和TCGA HGSOC患者在不同兩個聚類中的總生存率

03、基于NER相關(guān)基因的預(yù)后價值和風(fēng)險特征的鑒定

????????為了進(jìn)一步探討31個NER相關(guān)基因的預(yù)后價值,作者根據(jù)TCGA中基因的mRNA表達(dá)水平進(jìn)行了單變量Cox回歸分析。結(jié)果顯示,13個NER相關(guān)基因中的7個與OS有潛在關(guān)聯(lián)。在這七個基因中,只有DDB2和POLR2D被認(rèn)為是HR<1的保護(hù)性基因,而RPA2、CCNH、XPC、ERCC2和ERCC4被認(rèn)為是HR>1的風(fēng)險基因(圖4A)。

????????這些基因之間的共線性關(guān)系可能會影響傳統(tǒng)Cox回歸分析的準(zhǔn)確性(圖2C)。因此,作者對這七個可能與預(yù)后有關(guān)的基因進(jìn)行了LASSO Cox回歸方法,最終確定了預(yù)后最強(qiáng)的NER相關(guān)基因。LASSO結(jié)果表明,所有七個基因都被選為構(gòu)建預(yù)后風(fēng)險特征(圖4B,C),所選基因的系數(shù)顯示在圖4D。然后,根據(jù)系數(shù)計算風(fēng)險分?jǐn)?shù),以風(fēng)險分?jǐn)?shù)中位數(shù)為臨界值,326名HGSOC患者被平均分為高風(fēng)險組和低風(fēng)險組。圖4E-G顯示了基于7個基因特征的風(fēng)險評分、OS狀態(tài)和mRNA表達(dá)譜的分布情況。K-M生存圖顯示,高風(fēng)險組晚期HGSOC患者的OS明顯比低風(fēng)險組差(圖4H)。高危組的5年OS為14.1%,低危組為27.0%。風(fēng)險特征的預(yù)測能力顯示出良好的預(yù)測效率,AUC值等于0.693(圖4I)。接下來,本研究還調(diào)查了風(fēng)險組與臨床病理特征之間的關(guān)聯(lián)(圖4J)。結(jié)果顯示,除了治療反應(yīng),高風(fēng)險組和低風(fēng)險組在年齡、等級、分期和殘余腫瘤方面沒有明顯差異。

圖4 構(gòu)建基于七個NER相關(guān)基因特征的風(fēng)險模型

????????此外,人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)庫被用來驗(yàn)證7個選定基因在漿液性卵巢癌組織和正常卵巢組織中的細(xì)胞亞定位和表達(dá)模式(圖5A-G)。HPA分析顯示,在蛋白水平上,DDB2、POLR2D、CCNH和RPA2在HGSOC組織和正常對照組中的表達(dá)與mRNA水平變化相似,主要位于細(xì)胞核中。然而,XPC和ERCC2在漿液性卵巢組織和正常卵巢組織的蛋白水平上沒有顯示出明顯的區(qū)別(圖5C,E)。HPA數(shù)據(jù)和TCGA RNA-seq數(shù)據(jù)之間的異質(zhì)性可能是由于轉(zhuǎn)錄后調(diào)控的差異??偟膩碚f,這些結(jié)果進(jìn)一步驗(yàn)證了NER相關(guān)基因的調(diào)控在漿液性卵巢癌中是高度紊亂的。

圖5 通過IHC染色的7個NER相關(guān)基因的蛋白表達(dá)水平以及對預(yù)后特征的驗(yàn)證

04、驗(yàn)證風(fēng)險特征以預(yù)測HGSOC晚期患者的OS

????????為了證實(shí)基于分類器的NER相關(guān)基因在不同隊列中具有相似的預(yù)后價值,作者分別評估了GSE13876(n = 415)和合并的GEO數(shù)據(jù)集(n = 346)中的樣本。根據(jù)TCGA HGSOC隊列的中位風(fēng)險評分作為分界值,在GSE13876中,192名患者被歸類為低風(fēng)險,223名為高風(fēng)險;在合并的GEO數(shù)據(jù)集中,255名患者被歸類為低風(fēng)險,91名為高風(fēng)險。在GSE13876中,高危組相應(yīng)的5年OS為24.1%,低危組為35.0%(圖5H)。同樣,在合并的GEO驗(yàn)證集中,高風(fēng)險組的5年OS為35.3%,低風(fēng)險組為67.8%(圖5I)。兩個驗(yàn)證集的風(fēng)險評分、OS狀態(tài)和mRNA表達(dá)譜的分布如圖5J,K。如圖6A-F所示,對于FIGO IIIC期的患者、CR/PR的患者、最佳細(xì)胞還原手術(shù)的患者或非最佳細(xì)胞還原手術(shù)的患者,高風(fēng)險組與低風(fēng)險組相比OS率更差。然而,由于樣本量的限制,F(xiàn)IGO IV期患者或SD/PD患者的高風(fēng)險組和低風(fēng)險組之間的OS沒有明顯差異。

圖6 TCGA隊列中按臨床病理因素分層的高風(fēng)險組和低風(fēng)險組之間的生存差異

05、Nomogram結(jié)合NER相關(guān)的風(fēng)險特征和臨床相關(guān)的特征來預(yù)測患者的OS

????????為了研究由mRNA表達(dá)構(gòu)建的風(fēng)險特征是否比其他臨床相關(guān)特征的預(yù)測效果更好,如年齡、階段、等級、治療反應(yīng)和殘余腫瘤等各種變量被列為潛在的預(yù)后因素。在TCGA HGSOC隊列中,單變量和多變量分析的結(jié)果顯示,治療反應(yīng)和風(fēng)險特征與OS明顯相關(guān)(圖7A,B)。由于年齡對OS的潛在影響,開發(fā)了一個結(jié)合年齡、治療反應(yīng)和風(fēng)險特征的nomogram來預(yù)測HGSOC晚期患者的3年或5年生存率(圖7C)。nomogram的校準(zhǔn)圖顯示了原始隊列中nomogram預(yù)測和3年或5年OS的實(shí)際觀察之間的可接受性和一致性(圖7D)。NER相關(guān)的風(fēng)險特征可以為這些晚期HGSOC患者的預(yù)后提供最有用和準(zhǔn)確的信息。

圖7 預(yù)測晚期HGSOC患者糜爛風(fēng)險的7種基因特征的nomogram開發(fā)

06、高危組和低危組的基因集富集分析

????????為了更好地理解基于風(fēng)險特征的NER相關(guān)基因的意義,作者進(jìn)行了GSEA分析研究了TCGA隊列中高危組和低危組的信號通路。耐人尋味的是,參與以下生物過程/信號通路的基因在高危組中表現(xiàn)出活躍的表達(dá):mTOR信號通路,磷酸肌醇代謝,磷脂酰肌醇信號系統(tǒng),MAPK信號通路,和VEGF信號通路。相反,在高危組中觀察到兩個下調(diào)的生物過程/信號通路。DNA復(fù)制和剪接體(補(bǔ)充圖S2)。上述結(jié)果表明,基于7個NER相關(guān)基因確定的風(fēng)險特征與HGSOC的惡性程度密切相關(guān)。

補(bǔ)充圖S2? ????7 -NER相關(guān)基因特征定義的風(fēng)險亞組之間的不同信號通路和細(xì)胞過程。

四、結(jié)論

????????作者分析了HGSOC和正常樣本之間顯著差異的NER相關(guān)基因,這些基因可能在HGSOC的進(jìn)展中發(fā)揮重要作用。作者構(gòu)建了一個強(qiáng)大的風(fēng)險特征,與HGSOC的臨床結(jié)果顯著相關(guān),并在兩個不同的GEO驗(yàn)證集中得到驗(yàn)證。此外,還開發(fā)了一個包含風(fēng)險特征和臨床相關(guān)風(fēng)險因素的7個基因nomogram,這可能有助于對晚期HGSOC患者的預(yù)后進(jìn)行個體化預(yù)測。最后,對這些基因的進(jìn)一步研究可能會對NER修復(fù)途徑和HGSOC預(yù)后之間的潛在關(guān)系提供新的見解。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容