TCGA|GEO可視化分析第1篇---相關(guān)性分析

導(dǎo)讀:今天有小伙伴問我,篩選完差異基因后,想看自己關(guān)注的基因和其他基因的關(guān)系,應(yīng)該怎么做?那當(dāng)然要先做一下相關(guān)性分析了!好,下面讓我給大家娓娓道來......

正文:


step1:我們先讀取下所需要的數(shù)據(jù)

library(openxlsx)

setwd("E:\\Bioinfo_analysis\\scripts\\corr\\corr_batch")#設(shè)置工作路徑

fr<-read.xlsx('infile.xlsx',rowNames = T,colNames = T)

View(fr)#查看下數(shù)據(jù)類型,列名基因名,行名為樣本名

列名基因名,行名為樣本名


Step2:下載安裝包

library("ggstatsplot")#加載包的時(shí)候失敗了,因?yàn)橹皼]有安裝這個(gè)包

library("BiocManager")?

BiocManager::install("ggstatsplot")#安裝ggstatsplot

要安裝很多依賴包,泡杯咖啡,靜靜的等著它,差不多花了30分鐘才把所有的包安裝完,下面開始進(jìn)行相關(guān)性分析,假如我們關(guān)注的基因是COX1和ATP6。

Step3:繪圖

ggscatterstats(data = fr,

???????????????y = COX1,

???????????????x = ATP6,

???????????????centrality.para = "mean",

???????????????margins = "both",

???????????????xfill = "red",

???????????????yfill = "blue",

???????????????marginal.type = "histogram",

???????????????title = "Relationship"

???????????????)


圖出來的還是很快的,大概5秒鐘。圖中每個(gè)點(diǎn)代表一個(gè)樣本,兩條虛線分別代表兩個(gè)基因在樣本中的平均表達(dá)量??匆幌陆Y(jié)果,P<0.001,r=0.46,說明COX1, ATP6存在正相關(guān)關(guān)系,P值過關(guān)了,不過相關(guān)系數(shù)r有點(diǎn)低,還沒有超過0.5。

到這里結(jié)束了么,不。我的小伙伴又問了,我想看一下COX1和其他所有基因的相關(guān)性怎么辦?你手動(dòng)一個(gè)個(gè)畫唄。。。。哈哈哈,開個(gè)玩笑,這里我們可以用ggcorrplot繪圖!

corr.result<-cor(fr,method = 'pearson')#先計(jì)算相關(guān)性系數(shù)

corr.p<-ggcorrplot::cor_pmat(fr)#再計(jì)算P值

#開始繪圖

ggcorrplot(

??corr = corr.result,

??type = 'full'

)


如果你想看哪些基因間是顯著性相關(guān),怎么辦,往下看:

ggcorrplot(

??corr = corr.result,

??type = 'full',

??p.mat = corr.p,#P-Value

??sig.level = 0.05#P-Value大于0.05的在圖中標(biāo)記出來

)


圖中標(biāo)記?號的即為P值大于0.05的,反之為P值小于0.05。

今天就給大家介紹到這里,有什么疑問或者建議,可以下方留言探討哦!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容