從差異基因中確定靶標(biāo) - 過表達(dá)

?從差異基因中確定靶標(biāo) - 過表達(dá)

????目前轉(zhuǎn)錄組測序?qū)嶒?yàn),已經(jīng)是非常常用的技術(shù)。幾乎成為尋找差異分子(如mRNA/lncRNA/circRNA/miRNA)最重要的手段,同時(shí)該實(shí)驗(yàn)多是整個(gè)課題的開始,因此該實(shí)驗(yàn)的好壞,直接影響課題的進(jìn)度以及課題的質(zhì)量。

????由于測序儀極為昂貴加上數(shù)據(jù)分析需要較強(qiáng)的計(jì)算機(jī)編程能力,如需懂linux,R,perl,Python等。絕大多數(shù)的老師還是會(huì)選擇找公司做這個(gè)實(shí)驗(yàn)。那么實(shí)驗(yàn)做的好還是壞,數(shù)據(jù)分析的好用還是不好用,就看公司了。與其,憑感覺選擇公司,不如多了解,公司到底能提供哪些實(shí)驗(yàn)及分析服務(wù)。

????本著解決客戶一切問題的原則(轉(zhuǎn)錄組測序相關(guān))。我們上海生因生物科技有限公司,建立了全方面的數(shù)據(jù)分析體系。包括測序數(shù)據(jù)本身各種分析,還包括分子挑選,機(jī)制構(gòu)建等多種個(gè)性化分析。

????我們會(huì)遇到這樣的場景:我用藥物處理,建立了疾病模型,然后拿著樣品做RNAseq,找到了幾百上千個(gè)差異基因,那么這么多基因該如何選擇呢?我們過表達(dá)了一個(gè)分子如lncRNA,mRNA,miRNA,將樣品拿去做RNAseq,也會(huì)找到幾百,上千個(gè)差異基因。那么哪些基因是該分子的靶標(biāo)呢?

????既然已經(jīng)發(fā)生了差異表達(dá),那么這些基因基本都有可能是重要的基因,可是還得挑??戳舜罅康臋C(jī)制研究文獻(xiàn)會(huì)發(fā)現(xiàn),這個(gè)靶標(biāo)基因應(yīng)該有這樣的特征:1)在疾病中有差異表達(dá),2)該基因會(huì)影響疾病的進(jìn)程,比如影響腫瘤的增殖凋亡過程。

????我們可以將差異基因分別過表達(dá),敲低,看細(xì)胞表型的變化。這個(gè)方法雖好,但不現(xiàn)實(shí),幾百個(gè)基因的過表達(dá)實(shí)驗(yàn)將是一筆不小的費(fèi)用。

? ? 在TCGA/GEO中有各種腫瘤的表達(dá)譜數(shù)據(jù)如mRNA, lncRNA, miRNA等。我們可以依據(jù)該基因的表達(dá)高低對(duì)樣品重新分組,然后計(jì)算兩組的差異基因。如果差異基因顯著富集到周期、凋亡等腫瘤相關(guān)的通路。我們可以認(rèn)為該基因是影響腫瘤進(jìn)程的。可以作為我們機(jī)制中的靶標(biāo)基因。

? ? 好的,本文,我們選擇了一個(gè)數(shù)據(jù),作者研究腫瘤,過表達(dá)lncRNA,做了RNAseq,找到了差異基因。我們使用TCGA數(shù)據(jù)進(jìn)一步分析這些差異基因中進(jìn)一步篩選哪些更有可能是他的靶標(biāo)。

??差異基因共有兩百多個(gè),以下是數(shù)據(jù)列表截圖:

????在TCGA數(shù)據(jù)中下載相應(yīng)癌(胃癌)基因表達(dá)數(shù)據(jù),分別提取待選基因的表達(dá)量,根據(jù)其表達(dá)量的大小,取高表達(dá)的1/3與低表達(dá)的1/3,將TCGA數(shù)據(jù)分成高低表達(dá)兩組,繼而進(jìn)行差異分析。

1. 差異表達(dá)分析

?以基因候選基因E2F1為例:我們將其分成高低組后,做差異分析,可以得到如下差異基因列表:

得到上調(diào)基因489個(gè),下調(diào)基因982個(gè)。

2. 差異基因GO功能富集分析

??我們對(duì)得到的差異基因進(jìn)行GO功能富集分析發(fā)現(xiàn),涉及到細(xì)胞周期相關(guān)的生物學(xué)過程,如下表:

3. 差異基因KEGG功能富集分析

我們對(duì)得到的差異基因進(jìn)行Pathway功能富集分析發(fā)現(xiàn),涉及到細(xì)胞周期相關(guān)的通路,如下表:

胃癌中E2F1基因過表達(dá)后,顯著影響周期相關(guān)的生物學(xué)過程,和通路。說明該基因跟腫瘤的增殖密切相關(guān),可以作為候選靶基因基因。

4.?多基因通路富集分析

同理,我們對(duì)其他基因也做了如上的處理,得到其他基因影響的通路,以周期通路顯著性p值由小到大排序得到如下表:

從表中可以發(fā)現(xiàn)兩百個(gè)基因中,以下54個(gè)基因均對(duì)能影響胃癌的增殖過程:

????CDCA5, FEN1, KIF2C, TPX2, ATAD2, MCM2, RRM2, PLK1, RACGAP1, KIF18B, ZWINT, KPNA2, MELK, ARHGAP11A, FANCI, AURKA, CCNB1, KIF20A, BUB1B, LMNB1, CDC6, TOP2A, PRR11, PTTG1, CEP55, CDCA3, NCAPG2, H2AFZ, E2F1, MCM7, MKI67, PKMYT1, CHAF1A, INCENP, TOMM40, PBK, HMGB2, RRM1, KPNB1, EBP, PPM1G, ENO1, PTBP1, IQGAP3, SRRT, HNRNPA2B1, DDX39A, SMC1A, HMGB1, NCL, LPP, ACAT2, DNMT1, HDGF

????這樣我們就將靶標(biāo)基因縮小到很小一部分。后續(xù)可以根據(jù)這些基因在TCGA中的差異程度,預(yù)后等進(jìn)一步篩選。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容