R 數(shù)據(jù)可視化 01 | 聚類熱圖

一. 示例數(shù)據(jù)準備

下載:鏈接:https://pan.baidu.com/s/1_b8swSkWDqIHZi6UwKaspA
提取碼:pll7

文件說明

示例數(shù)據(jù),其中數(shù)據(jù)均為虛擬數(shù)據(jù),與實際生物學過程無關

文件名:dataset_heatmap.txt

列分別為基因,cell1的5個重復樣本,cell2的5個重復樣本

行代表每個基因在所有樣本的FPKM值

二. 環(huán)境需求

Rstudio:
如果系統(tǒng)中沒有 Rstudio,先下載安裝:https://www.rstudio.com/products/rstudio/download/#download

heatmaps 包:

如果沒有安裝該R包,執(zhí)行以下代碼:

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("heatmaps")

三. 繪制聚類熱圖

1. 聚類熱圖繪制
# 執(zhí)行前設置====================================
# 清空暫存數(shù)據(jù)
rm(list=ls())
# 載入R包
library(pheatmap)
# 設置工作目錄
setwd("E:/R/WorkSpace/baimoc/visualization")

# 整理數(shù)據(jù)集====================================
# 載入數(shù)據(jù)
dataset <- read.table('resource/dataset_heatmap.txt',header = TRUE, row.names = 1)
# 截取表達矩陣的一部分數(shù)據(jù)來繪制熱圖
exp_ds = dataset[c(1:60),c(1:10)]
# 構(gòu)建樣本分類數(shù)據(jù)
cell_list=c(rep('cell_1',5),
            rep('cell_2',5))
annotation_c <- data.frame(cell_list)
rownames(annotation_c) <- colnames(exp_ds)

# 繪制熱圖=====================================
pheatmap(exp_ds, #表達數(shù)據(jù)
         cluster_rows = T,#行聚類
         cluster_cols = T,#列聚類
         annotation_col =annotation_c, #樣本分類數(shù)據(jù)
         annotation_legend=TRUE, # 顯示樣本分類
         show_rownames = T,# 顯示行名
         show_colnames = T,# 顯示列名
         scale = "row", #對行標準化
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100) # 熱圖基準顏色
)

2. 無分類信息熱圖
# 將繪制熱圖部分替換為下列代碼
# 繪制熱圖=====================================
pheatmap(exp_ds, 
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100)
)
3. 無聚類熱圖
# 將繪制熱圖部分替換為下列代碼
pheatmap(exp_ds, #表達數(shù)據(jù)
         cluster_rows = F,
         cluster_cols = F,
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100)
)
4. 分割聚類樹熱圖
# 繪制熱圖=====================================
pheatmap(exp_ds, 
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100),
         cutree_cols = 2,
         cutree_rows = 20
)
5. 多分組聚類熱圖
# 清空暫存數(shù)據(jù)
rm(list=ls())
# 載入R包
library(pheatmap)
# 設置工作目錄
setwd("E:/R/WorkSpace/baimoc/visualization")

# 整理數(shù)據(jù)集====================================
# 參數(shù)'./resource/dataset.txt',表示載入E:/R/WorkSpace/baimoc/visualization/resource/dataset_heatmap.txt
dataset <- read.table('resource/dataset_heatmap.txt',header = TRUE, row.names = 1)
# 截取表達矩陣的一部分數(shù)據(jù)來繪制熱圖
exp_ds = dataset[c(1:60),c(1:10)]
# 構(gòu)建樣本分類數(shù)據(jù)
cell_type=c(rep('cell_1',5),
            rep('cell_2',5))
sample_calss=c(rep('normal',5),
               rep('cancer',5))
sample_type=c(rep('control',5),
               rep('case',5))
level = c(1:10)

annotation_c <- data.frame(cell_type, sample_calss, sample_type, level)
rownames(annotation_c) <- colnames(exp_ds)

gene_class=c(rep('good',30),
             rep('bad',30))
gene_type=c(rep('fat',20),
            rep('blood',20),
            rep('Immunology',20))
annotation_r <- data.frame(gene_class, gene_type)
rownames(annotation_r) <- rownames(exp_ds)
# 繪制熱圖=====================================
pheatmap(exp_ds, #表達數(shù)據(jù)
         cluster_rows = T,#行聚類
         cluster_cols = T,#列聚類
         annotation_col =annotation_c, #樣本分類數(shù)據(jù)
         annotation_row = annotation_r,
         annotation_legend=TRUE, # 顯示樣本分類
         show_rownames = T,# 顯示行名
         show_colnames = T,# 顯示列名
         scale = "row", #對行標準化
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100), # 熱圖基準顏色
)
6. 分組調(diào)色
# 清空暫存數(shù)據(jù)
rm(list=ls())
# 載入R包
library(pheatmap)
# 設置工作目錄
setwd("E:/R/WorkSpace/baimoc/visualization")

# 整理數(shù)據(jù)集====================================
# 參數(shù)'./resource/dataset.txt',表示載入E:/R/WorkSpace/baimoc/visualization/resource/dataset_heatmap.txt
dataset <- read.table('resource/dataset_heatmap.txt',header = TRUE, row.names = 1)
# 截取表達矩陣的一部分數(shù)據(jù)來繪制熱圖
exp_ds = dataset[c(1:60),c(1:10)]
# 構(gòu)建樣本分類數(shù)據(jù)
sample_calss=c(rep('Normal',5),
               rep('Cancer',5))

annotation_c <- data.frame(sample_calss)
rownames(annotation_c) <- colnames(exp_ds)

gene_type=c(rep('Fat',20),
            rep('Blood',20),
            rep('Immunology',20))
annotation_r <- data.frame(gene_type)
rownames(annotation_r) <- rownames(exp_ds)

annotation_colors = list(sample_calss=c(Normal='#F8EFBA', Cancer='#FD7272'),
                         gene_type=c(Fat='#f1f2f6', Blood='#ced6e0', Immunology='#57606f'))
# 繪制熱圖=====================================
pheatmap(exp_ds, #表達數(shù)據(jù)
         cluster_rows = T,#行聚類
         cluster_cols = T,#列聚類
         annotation_col =annotation_c, #樣本分類數(shù)據(jù)
         annotation_row = annotation_r,
         annotation_colors = annotation_colors,
         annotation_legend=TRUE, # 顯示樣本分類
         show_rownames = T,# 顯示行名
         show_colnames = T,# 顯示列名
         scale = "row", #對行標準化
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100), # 熱圖基準顏色
)
7. 顯示文本
# 繪制熱圖=====================================
pheatmap(exp_ds, 
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100),
         display_numbers = T, # 顯示數(shù)值
         fontsize_number = 8, # 設置字體大小
         number_color = '#4a4a4a', #設置顏色
         number_format = '%.2f' # 設置顯示格式
)
8. 去除描邊
pheatmap(exp_ds, #表達數(shù)據(jù)
         show_rownames = T,# 顯示行名
         show_colnames = T,# 顯示列名
         scale = "row", #對行標準化
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100), # 熱圖基準顏色
         border_color = 'NA',
)
9. 字體相關
pheatmap(exp_ds, #表達數(shù)據(jù)
         show_rownames = T,# 顯示行名
         show_colnames = T,# 顯示列名
         scale = "row", #對行標準化
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100), # 熱圖基準顏色
         fontsize = 10, # 全局字體大小,會被后邊設置所覆蓋
         fontsize_row = 8, # 行字體大小
         fontsize_col = 12, # 列字體大小
         angle_col = 45, # 設置列偏轉(zhuǎn)角度,可選 270, 0, 45, 90, 315,
         gaps_row = T
)
10. 調(diào)整聚類樹高
pheatmap(exp_ds, 
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100),
         treeheight_row = 50,
         treeheight_col = 30
)
11. 聚類方法選擇
pheatmap(exp_ds, 
         show_rownames = T,
         show_colnames = T,
         scale = "row", 
         color =colorRampPalette(c("#8854d0", "#ffffff","#fa8231"))(100),
         clustering_distance_rows = 'euclidean', # 計算聚類間距的算法,可選'correlation', 'euclidean', 'maximum', 'manhattan', 'canberra', 'binary', 'minkowski'
         clustering_method = 'complete', # 聚類方法, 可選'ward', 'ward.D', 'ward.D2', 'single', 'complete', 'average', 'mcquitty', 'median' or 'centroid'
)

四. 保存為圖片

  • 這里可導出像素圖和PDF,也可拷貝到PS調(diào)整

  • 選擇合適的文件格式,調(diào)整合適長寬,印刷或投稿選PDF,TIFF,EPS就好

  • 文件默認存儲在剛剛設置的工作目錄里

五. 詳細參數(shù)設置說明

1. 設置工作目錄
setwd("E:/R/WorkSpace/baimoc/visualization")

在R的執(zhí)行過程中,為了方便,需要指定一個獲取文件和輸出文件所在的目錄,這樣就不需要每次設置全路徑,只需要指定相對目錄

setwd("E:/R/WorkSpace/baimoc/visualization")的意思就是設置工作目錄為E:/R/WorkSpace/baimoc/visualization

2. 載入數(shù)據(jù)
dataset <- read.table('resource/dataset_heatmap.txt',header = TRUE, row.names = 1)

因為工作目錄已經(jīng)設置,如果要獲取E:/R/WorkSpace/baimoc/visualization/resource/dataset_heatmap.txt文件,那么就只需要設置相對路徑resource/dataset_heatmap.txt

對于header = TRUE, row.names = 1代表讀取文件表頭,設置第一列為行名

3. 獲取數(shù)據(jù)子集
# 截取表達矩陣的一部分數(shù)據(jù)來繪制熱圖
exp_ds = dataset[c(1:60),c(1:10)]

原始數(shù)據(jù):

如果獲取前兩個基因和cell1與cell2的前兩個樣本,只需要執(zhí)行

exp_ds = dataset[c(1:5),c(1:3,6:8)]
4. 樣本分類數(shù)據(jù)
# 構(gòu)建樣本分類數(shù)據(jù)
cell_list=c(rep('cell_1',5),
            rep('cell_2',5))
annotation_c <- data.frame(cell_list)
rownames(annotation_c) <- colnames(exp_ds)

這段代碼目的是構(gòu)建分類名與原始數(shù)據(jù)的列名的對應關系

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容