m6a甲基化相關(guān)基因boxplot并顯示p值

m6A甲基化是目前研究的一個(gè)熱點(diǎn),前面給大家介紹過(guò)?m6A甲基化數(shù)據(jù)分析流程。我們知道m(xù)6A甲基化需要三類不同的基因來(lái)參與。 腺嘌呤(A)可以被編碼器(Writer)METTL3、METTL14和WTAP及其他組分組成的甲基轉(zhuǎn)移酶復(fù)合體甲基化,甲基化的腺嘌呤可以被讀碼器(Reader, 目前發(fā)現(xiàn)m6A讀碼器主要有五個(gè),定位于細(xì)胞核內(nèi)的YTHDC1以及定位在細(xì)胞質(zhì)中的YTHDF1、YTHDF2、YTHDF3、YTHDC2)所識(shí)別,同時(shí)m6A可以被擦除器(Eraser )FTO和ALKBH5這兩個(gè)去甲基化酶催化去甲基化。

m6A甲基化也參與到各種腫瘤的發(fā)生和發(fā)展的過(guò)程中,因此在腫瘤中我們一般也可以看到與m6A甲基化相關(guān)的基因表達(dá)失調(diào)。今天我們就來(lái)展示一下與m6A甲基化相關(guān)的基因在腫瘤樣本和癌旁正常對(duì)照組織中的表達(dá)情況,并顯示t檢驗(yàn)的p值是否顯著。

我們先來(lái)看下得到的結(jié)果是怎么樣的。下圖展示的是16個(gè)與m6A甲基化相關(guān)的基因,在膽管癌(TCGA-CHOL)的腫瘤樣本和癌旁正常對(duì)照中的表達(dá)情況。

這里p值采用t檢驗(yàn)計(jì)算,星號(hào)與p值之間的對(duì)應(yīng)關(guān)系如下。具體轉(zhuǎn)換的方法前面也講到過(guò)?【R語(yǔ)言】P值轉(zhuǎn)換成***

ns(not significant): p > 0.05,
*: p <= 0.05,
**: p <= 0.01,
***: p <= 0.001,
****: p <= 0.0001

下面我們來(lái)給大家捋一捋具體的思路

1.從TCGA數(shù)據(jù)庫(kù)下載特定腫瘤的RNAseq數(shù)據(jù),合并得到表達(dá)矩陣

關(guān)于這一部分前面有詳細(xì)的視頻講解

?如何合并TCGA表達(dá)譜數(shù)據(jù)

2.搜集m6A甲基化相關(guān)的基因,根據(jù)需要做基因的ID轉(zhuǎn)換

這里我已經(jīng)幫大家從一些相關(guān)的研究中搜集了m6A甲基化相關(guān)的16個(gè)基因,當(dāng)然大家也可以根據(jù)自己的需要增,刪相關(guān)基因。我們講的主要是方法,代碼都是一樣的跑,多幾個(gè)基因少幾個(gè)基因都無(wú)所謂。甚至你還可以換成其他的任何基因列表都是可以的。

"METTL3","METTL14","METTL16","WTAP","VIRMA","RBM15","ZC3H13","YTHDF1","YTHDF2","YTHDF3","YTHDC1","YTHDC2","HNRNPA2B1","HNRNPC","FTO","ALKBH5"

這里需要注意的是TCGA中g(shù)ene的ID一般是ensembl gene ID,而我們從paper中搜集的gene一般是gene名字,所以這里就需要做一個(gè)gene ID轉(zhuǎn)換。這個(gè)我在前面也講過(guò)

?【R語(yǔ)言】基因ID轉(zhuǎn)換

3.提取m6A基因相關(guān)的表達(dá)矩陣

這個(gè)其實(shí)就是R里面最常見的數(shù)據(jù)框取下標(biāo)操作了。這里所有分析都是基于R來(lái)做的,所以了解一些R的基礎(chǔ)知識(shí)還是很有必要的。
具體可以參考

?R語(yǔ)言入門-工欲善其事必先利其器

m6A基因相關(guān)的表達(dá)矩陣如下

4.添加樣本的類型信息,如腫瘤,癌旁正常對(duì)照

前面也用視頻給大家詳細(xì)介紹過(guò)如何從TCGA數(shù)據(jù)下載臨床信息

?如何從TCGA數(shù)據(jù)庫(kù)下載RNAseq數(shù)據(jù)以及臨床信息(一)

5.繪制boxplot并做統(tǒng)計(jì)檢驗(yàn),將p值顯示在boxplot圖上

這里我們直接用ggboxplot繪圖,并做統(tǒng)計(jì)檢驗(yàn),顯示p值

完整代碼可以參考

?m6a甲基化相關(guān)基因boxplot并顯示p值

對(duì)TCGA數(shù)據(jù)庫(kù)還不了解的小伙伴,我們也有相關(guān)的視頻課程詳細(xì)介紹TCGA數(shù)據(jù)庫(kù)挖掘

?TCGA數(shù)據(jù)庫(kù)介紹及數(shù)據(jù)挖掘

參考資料:

1.m6A甲基化數(shù)據(jù)分析流程

2.【R語(yǔ)言】P值轉(zhuǎn)換成***

3.如何合并TCGA表達(dá)譜數(shù)據(jù)

4.【R語(yǔ)言】基因ID轉(zhuǎn)換

5.加載R包org.Hs.eg.db出錯(cuò),避坑指南!

6.R語(yǔ)言入門-工欲善其事必先利其器

7.如何從TCGA數(shù)據(jù)庫(kù)下載RNAseq數(shù)據(jù)以及臨床信息(一)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容