復現(xiàn)《nature communications》圖表(二):R語言一鍵畫表達量箱線圖并添加顯著性

我們接著重現(xiàn)NC這篇文章的Figure2,這篇文章里有很多這樣的箱線圖,這也是這個重現(xiàn)系列重點要講的內(nèi)容。原文作者提供了這部分代碼,對于所有圖提供了詳細的數(shù)據(jù),可以參考作圖。

圖片

這里重現(xiàn)的重點在于批量畫圖,利用循環(huán),可以一勞永逸,一次性畫圖多個圖,省時省力!

1、數(shù)據(jù)整理

畫圖數(shù)據(jù)需要兩個文件,一個是表達量數(shù)據(jù),列為樣本,行為基因。另外一個是注釋信息,是關于樣本分組的。

表達數(shù)據(jù):

圖片

樣本信息:

圖片

2、作圖詳細過程

第一步加載需要的R包:


library(RColorBrewer)
library(ggpubr)
library(ggplot2)
library(cowplot)

第二部加載數(shù)據(jù)并進行處理:這里增添一個小細節(jié),也是小編初學R遇到的問題。假設有一個幾千行的表達矩陣,我只想挑選幾十個基因的表達數(shù)據(jù),用Excel的搜索工具顯然不現(xiàn)實。用R解決就很簡單,首先創(chuàng)建一個需要基因(行名)的向量,然后用它去提取行名為向量的數(shù)據(jù)即可!

setwd("D:/生物信息學")
Exp <- read.csv("Exp.csv",header=T,row.names=1)#讀入源文件
gene <- c("CD28","CD3D","CD8A","LCK",
          "GATA3","EOMES","IL23A","CXCL8",
          "IL1R2","IL1R1","MMP8","MMP9")#這里我們只選擇這幾個基因做數(shù)據(jù)
gene <- as.vector(gene)
Exp <- log2(Exp+1) #因為是FPKM數(shù)據(jù),標準化一下
Exp_plot <- Exp[,gene]#提取需要作圖得基因表達信息

第三步加載樣本信息:

#加載樣本信息
info <- read.csv("info.csv",header=T)
Exp_plot<- Exp_plot[info$Sample,]
Exp_plot$sam=info$Type
Exp_plot$sam <- factor(Exp_plot$sam,levels=c("Asymptomatic","Mild","Severe","Critical"))

第四步設置分組的顏色:就如同用prism做圖一樣,不同組用不同顏色表示。

col <-c("#5CB85C","#337AB7","#F0AD4E","#D9534F")

第五步進行循環(huán):詳細的代碼解釋也注釋出來了。


plist2<-list()#創(chuàng)建一個空列表,用來存儲循環(huán)的產(chǎn)出
for (i in 1:length(gene)){
  bar_tmp<-Exp_plot[,c(gene[i],"sam")]#循環(huán)提取每個基因表達信息
  colnames(bar_tmp)<-c("Expression","sam")#統(tǒng)一命名
  my_comparisons1 <- list(c("Asymptomatic", "Mild")) #設置比較組
  my_comparisons2 <- list(c("Asymptomatic", "Severe"))#設置比較組
  my_comparisons3 <- list(c("Asymptomatic", "Critical"))#設置比較組
  my_comparisons4 <- list(c("Mild", "Severe"))#設置比較組
  my_comparisons5 <- list(c("Mild", "Critical"))#設置比較組
  my_comparisons6 <- list(c("Severe", "Critical"))#設置比較組
  pb1<-ggboxplot(bar_tmp,#ggboxplot畫箱線圖
                 x="sam",#x軸為組別
                 y="Expression",#y軸為表達量
                 color="sam",#用樣本分組填充
                 fill=NULL,
                 add = "jitter",#添加散點
                 bxp.errorbar.width = 0.6,
                 width = 0.4,
                 size=0.01,
                 font.label = list(size=30), 
                 palette = col)+theme(panel.background =element_blank())
  pb1<-pb1+theme(axis.line=element_line(colour="black"))+theme(axis.title.x = element_blank())#坐標軸修飾
  pb1<-pb1+theme(axis.title.y = element_blank())+theme(axis.text.x = element_text(size = 15,angle = 45,vjust = 1,hjust = 1))#橫坐標文字設置
  pb1<-pb1+theme(axis.text.y = element_text(size = 15))+ggtitle(gene[i])+theme(plot.title = element_text(hjust = 0.5,size=15,face="bold"))#標題設置
  pb1<-pb1+theme(legend.position = "NA")#(因為有組圖,橫坐標分組了,所以不需要設置legend)
  pb1<-pb1+stat_compare_means(method="t.test",hide.ns = F,
                              comparisons =c(my_comparisons1,my_comparisons2,my_comparisons3,my_comparisons4,my_comparisons5,my_comparisons6),
                              label="p.signif")#顯著性檢驗用t檢驗,添加不同比較組。詳情可以查看stat_compare_means函數(shù)幫助信息
  plist2[[i]]<-pb1 #將畫好的圖儲存于plist2列表,并不斷賦值循環(huán)直到結(jié)束
}

第六步排列圖片,我們選擇了12個基因,所以會有12張圖,對其進行排列。

plot_grid(plist2[[1]],plist2[[2]],plist2[[3]],
                plist2[[4]],plist2[[5]],plist2[[6]],
                plist2[[7]],plist2[[8]],plist2[[9]],
                plist2[[10]],plist2[[11]],plist2[[12]],ncol=4)#ncol=4表示圖片排為幾列

最后畫出來的圖片如下:

圖片

效果和原文一摸一樣啊,剩下的進行排版修飾即可!學會這個技術(shù)可以一勞永逸了,不同一張一張畫圖,一次性出這么多圖??梢杂米约旱臄?shù)據(jù)試試手!

如果想要詳細的數(shù)據(jù),可以在公眾號留言或者聯(lián)系作者,說明來意。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容