?從差異基因中確定靶標(biāo) - 過表達(dá)
????目前轉(zhuǎn)錄組測序?qū)嶒?yàn),已經(jīng)是非常常用的技術(shù)。幾乎成為尋找差異分子(如mRNA/lncRNA/circRNA/miRNA)最重要的手段,同時(shí)該實(shí)驗(yàn)多是整個(gè)課題的開始,因此該實(shí)驗(yàn)的好壞,直接影響課題的進(jìn)度以及課題的質(zhì)量。
????由于測序儀極為昂貴加上數(shù)據(jù)分析需要較強(qiáng)的計(jì)算機(jī)編程能力,如需懂linux,R,perl,Python等。絕大多數(shù)的老師還是會(huì)選擇找公司做這個(gè)實(shí)驗(yàn)。那么實(shí)驗(yàn)做的好還是壞,數(shù)據(jù)分析的好用還是不好用,就看公司了。與其,憑感覺選擇公司,不如多了解,公司到底能提供哪些實(shí)驗(yàn)及分析服務(wù)。
????本著解決客戶一切問題的原則(轉(zhuǎn)錄組測序相關(guān))。我們上海生因生物科技有限公司,建立了全方面的數(shù)據(jù)分析體系。包括測序數(shù)據(jù)本身各種分析,還包括分子挑選,機(jī)制構(gòu)建等多種個(gè)性化分析。
????我們會(huì)遇到這樣的場景:我用藥物處理,建立了疾病模型,然后拿著樣品做RNAseq,找到了幾百上千個(gè)差異基因,那么這么多基因該如何選擇呢?我們過表達(dá)了一個(gè)分子如lncRNA,mRNA,miRNA,將樣品拿去做RNAseq,也會(huì)找到幾百,上千個(gè)差異基因。那么哪些基因是該分子的靶標(biāo)呢?
????既然已經(jīng)發(fā)生了差異表達(dá),那么這些基因基本都有可能是重要的基因,可是還得挑??戳舜罅康臋C(jī)制研究文獻(xiàn)會(huì)發(fā)現(xiàn),這個(gè)靶標(biāo)基因應(yīng)該有這樣的特征:1)在疾病中有差異表達(dá),2)該基因會(huì)影響疾病的進(jìn)程,比如影響腫瘤的增殖凋亡過程。
????我們可以將差異基因分別過表達(dá),敲低,看細(xì)胞表型的變化。這個(gè)方法雖好,但不現(xiàn)實(shí),幾百個(gè)基因的過表達(dá)實(shí)驗(yàn)將是一筆不小的費(fèi)用。
? ? 在TCGA/GEO中有各種腫瘤的表達(dá)譜數(shù)據(jù)如mRNA, lncRNA, miRNA等。我們可以依據(jù)該基因的表達(dá)高低對(duì)樣品重新分組,然后計(jì)算兩組的差異基因。如果差異基因顯著富集到周期、凋亡等腫瘤相關(guān)的通路。我們可以認(rèn)為該基因是影響腫瘤進(jìn)程的。可以作為我們機(jī)制中的靶標(biāo)基因。
? ? 好的,本文,我們選擇了一個(gè)數(shù)據(jù),作者研究腫瘤,過表達(dá)lncRNA,做了RNAseq,找到了差異基因。我們使用TCGA數(shù)據(jù)進(jìn)一步分析這些差異基因中進(jìn)一步篩選哪些更有可能是他的靶標(biāo)。
??差異基因共有兩百多個(gè),以下是數(shù)據(jù)列表截圖:
????在TCGA數(shù)據(jù)中下載相應(yīng)癌(胃癌)基因表達(dá)數(shù)據(jù),分別提取待選基因的表達(dá)量,根據(jù)其表達(dá)量的大小,取高表達(dá)的1/3與低表達(dá)的1/3,將TCGA數(shù)據(jù)分成高低表達(dá)兩組,繼而進(jìn)行差異分析。
1. 差異表達(dá)分析
?以基因候選基因E2F1為例:我們將其分成高低組后,做差異分析,可以得到如下差異基因列表:
得到上調(diào)基因489個(gè),下調(diào)基因982個(gè)。
2. 差異基因GO功能富集分析
??我們對(duì)得到的差異基因進(jìn)行GO功能富集分析發(fā)現(xiàn),涉及到細(xì)胞周期相關(guān)的生物學(xué)過程,如下表:
3. 差異基因KEGG功能富集分析
我們對(duì)得到的差異基因進(jìn)行Pathway功能富集分析發(fā)現(xiàn),涉及到細(xì)胞周期相關(guān)的通路,如下表:
胃癌中E2F1基因過表達(dá)后,顯著影響周期相關(guān)的生物學(xué)過程,和通路。說明該基因跟腫瘤的增殖密切相關(guān),可以作為候選靶基因基因。
4.?多基因通路富集分析
同理,我們對(duì)其他基因也做了如上的處理,得到其他基因影響的通路,以周期通路顯著性p值由小到大排序得到如下表:
從表中可以發(fā)現(xiàn)兩百個(gè)基因中,以下54個(gè)基因均對(duì)能影響胃癌的增殖過程:
????CDCA5, FEN1, KIF2C, TPX2, ATAD2, MCM2, RRM2, PLK1, RACGAP1, KIF18B, ZWINT, KPNA2, MELK, ARHGAP11A, FANCI, AURKA, CCNB1, KIF20A, BUB1B, LMNB1, CDC6, TOP2A, PRR11, PTTG1, CEP55, CDCA3, NCAPG2, H2AFZ, E2F1, MCM7, MKI67, PKMYT1, CHAF1A, INCENP, TOMM40, PBK, HMGB2, RRM1, KPNB1, EBP, PPM1G, ENO1, PTBP1, IQGAP3, SRRT, HNRNPA2B1, DDX39A, SMC1A, HMGB1, NCL, LPP, ACAT2, DNMT1, HDGF
????這樣我們就將靶標(biāo)基因縮小到很小一部分。后續(xù)可以根據(jù)這些基因在TCGA中的差異程度,預(yù)后等進(jìn)一步篩選。