前情回顧:
Network在單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析中的應(yīng)用
?;鶊D在單細(xì)胞數(shù)據(jù)探索中的應(yīng)用
熱圖在單細(xì)胞數(shù)據(jù)分析中的應(yīng)用
R-南丁格爾玫瑰圖: 人民日?qǐng)?bào)都在用的細(xì)胞分群占比圖
三元相圖怎么看怎么畫(附R代碼示例)
在數(shù)據(jù)科學(xué)中,我們主要目標(biāo)是描述元素的對(duì)象和屬性及其之間的關(guān)系。在單細(xì)胞數(shù)據(jù)科學(xué)中,上游是在描述元素,如細(xì)胞的特性或基因的表達(dá)量,下游往往是描述細(xì)胞之間或基因之間的關(guān)系,如,配受體。關(guān)系型數(shù)據(jù),即兩個(gè)或以上變量之間的關(guān)系,其可視化是一門技術(shù)與藝術(shù)的科學(xué)。之前我們介紹的網(wǎng)絡(luò)圖,桑基圖,熱圖其實(shí)也都是關(guān)系型數(shù)據(jù)可視化的例子,今天,我們?cè)俳榻B一種常用的關(guān)系型數(shù)據(jù)可視化的工具:圈圖,或circos圖。
在這之前,我們先來(lái)思考一個(gè)相對(duì)宏觀的問題:如何選擇可視化工具呢?首先需要對(duì)我們的數(shù)據(jù)進(jìn)行分類,不同的數(shù)據(jù)結(jié)構(gòu)可以選擇不同的可視化工具,以達(dá)成自己想說(shuō)明的具體問題。

不要被這個(gè)導(dǎo)圖嚇到,它至少告訴我們數(shù)據(jù)類型是有限的,可視化的方法也是有限的,而不是無(wú)限的。好處是,避免了拿到數(shù)據(jù)手足無(wú)措的尷尬。關(guān)系型數(shù)據(jù)的可視化主要的技術(shù)有,和弦圖,網(wǎng)絡(luò)圖,?;鶊D,以及它們的變形,如下:

當(dāng)我們需要對(duì)"關(guān)系"進(jìn)一步細(xì)化的時(shí)候,可以用顏色,面積,粗細(xì)等屬性來(lái)映射不同的數(shù)據(jù)意義。下面來(lái)講我們今天的圈圖,請(qǐng)注意,這里的圈圖是廣義上的,是包含了和弦圖(Chord diagram)的,和弦圖往往往往出現(xiàn)在圈圖的中心,如下圖的ABC:

圖D當(dāng)然是圈圖,而其中沒有和弦圖,在這個(gè)意義上,圈圖是一種用來(lái)描述復(fù)雜關(guān)系的組合圖。由于圈層可以有多個(gè),每個(gè)圈層都可以按分類安排一種簡(jiǎn)單圖,如柱形圖,折線圖,環(huán)形圖等。來(lái)說(shuō)說(shuō)圈圖中的和弦圖先。
和弦圖用于探索實(shí)體組之間的關(guān)系,實(shí)體之間的連接用于顯示它們共享某些共同點(diǎn),這使和弦圖非常適合比較數(shù)據(jù)集內(nèi)或不同數(shù)據(jù)組之間的相似性。下圖很好地反映出,如何將一個(gè)二維表映射成一個(gè)和弦圖:

- 細(xì)胞來(lái)源
那么,我們首先想到的應(yīng)用是多樣本聚類后,看每個(gè)群中不同細(xì)胞的樣本來(lái)源,我們?cè)谠?jīng)用?;鶊D實(shí)現(xiàn)過這個(gè)功能,幾乎,所有的?;鶊D都可以繪制成和弦圖:

如果這里每個(gè)亞群都注釋好細(xì)胞類型,又是不同部位的PMBC的話,是不是可以反映出細(xì)胞的去向與募集情況呢?
- 受配圖對(duì)
然后,不同細(xì)胞類型之間的特異的受體和配體對(duì)關(guān)系,如NicheNet所繪制的那樣:

外在的六種顏色是六個(gè)細(xì)胞類型,不同細(xì)胞類型之間的受配體對(duì)用相同的顏色映射。
- V-J基因關(guān)系
我們知道,在單細(xì)胞免疫組庫(kù)的數(shù)據(jù)分析中,V基因和J基因也有著對(duì)應(yīng)關(guān)系,這時(shí)候可以用和弦圖來(lái)反映V-J 之間的關(guān)系:

- metadata 圈圖
在圈圖中關(guān)鍵是定義每一圈層的意義,在我們熟悉的Seurat對(duì)象中,metadata里的信息每一列都是一個(gè)獨(dú)立的屬性,所以我們可以把metadata信息繪制在圈圖之中。
#install.packages('circlize')
library(circlize)
library(Seurat)
library(ggraph,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
.libPaths()
library(tidyverse)
library(cowplot)
library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
unclass("Seurat")
class("Seurat")
head(pbmc3k.final@meta.data)
orig.ident nCount_RNA nFeature_RNA seurat_annotations percent.mt RNA_snn_res.0.5 seurat_clusters
AAACATACAACCAC pbmc3k 2419 779 Memory CD4 T 3.0177759 1 1
AAACATTGAGCTAC pbmc3k 4903 1352 B 3.7935958 3 3
AAACATTGATCAGC pbmc3k 3147 1129 Memory CD4 T 0.8897363 1 1
AAACCGTGCTTCCG pbmc3k 2639 960 CD14+ Mono 1.7430845 2 2
AAACCGTGTATGCG pbmc3k 980 521 NK 1.2244898 6 6
AAACGCACTGGTAC pbmc3k 2163 781 Memory CD4 T 1.6643551 1 1
繪制圈圖:
pbmc3k.final@meta.data -> df
circos.par("track.height" = 0.1)
circos.initialize(df$seurat_annotations, x = df$nFeature_RNA)
circos.track(df$seurat_annotations, y = df$nCount_RNA,
panel.fun = function(x, y) {
circos.text(CELL_META$xcenter,
CELL_META$cell.ylim[1.3] + mm_y(2),
CELL_META$sector.index)
circos.axis(labels.cex = 0.6)
})
col = rep(c("#FF0000"), length(levels(Idents(pbmc3k.final))))
circos.trackPoints(df$seurat_annotations, df$nFeature_RNA, df$nCount_RNA, col=col,pch = 16, cex = 0.5)
circos.text(1200, 1600, "lab", sector.index = "NK")
bgcol = rep(c( "#CCCCCC"), length(levels(Idents(pbmc3k.final))))
circos.trackHist(df$seurat_annotations, df$nFeature_RNA, bin.size = 20, bg.col = bgcol, col = NA)
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$nCount_RNA,
panel.fun = function(x, y) {
ind = sample(length(x), 10)
x2 = x[ind]
y2 = y[ind]
od = order(x2)
circos.lines(x2[od], y2[od])
})
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$percent.mt,
panel.fun = function(x, y) {
ind = sample(length(x), 10)
x2 = x[ind]
y2 = y[ind]
od = order(x2)
circos.lines(x2[od], y2[od])
})
circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
xlim = CELL_META$xlim
ylim = CELL_META$ylim
breaks = seq(xlim[1], xlim[2], by = 100)
n_breaks = length(breaks)
circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
breaks[-1], rep(ylim[2], n_breaks - 1),
col = rand_color(n_breaks), border = NA)
})
circos.link("B", c(400, 800), "NK", c(800,1000), col = "red",
border = "blue", h = 0.2)
circos.link("CD14+ Mono", 400, "FCGR3A+ Mono", c(400,1200), col = "green", border = "black", lwd = 2, lty = 2)
##################
circos.clear()
dev.off()

通過以上的例子,我們可以感受到,圈圖也好,和弦圖也好,其實(shí)都是一個(gè)框架,有了這個(gè)框架我們就可以在這個(gè)上面填充信息。如果說(shuō)通過數(shù)據(jù)類型來(lái)尋找繪圖結(jié)構(gòu)是買毛坯房,那么,給每個(gè)繪圖元素映射生物學(xué)意義就是在裝修這個(gè)房屋。
不知道,這篇文章有沒有啟發(fā)到你呢?

https://jokergoo.github.io/circlize_book/book/circos-heatmap.html
https://xgaoo.github.io/ClusterMap/ClusterMap.html
https://yimingyu.shinyapps.io/shinycircos/
https://www.data-to-viz.com/graph/chord.html
http://circos.ca/
https://www.bioconductor.org/packages/release/BiocViews.html#___SingleCell
https://www.r-graph-gallery.com/310-custom-hierarchical-edge-bundling.html
https://davemcg.github.io/post/lets-plot-scrna-dotplots/
https://pxy.shatterspikeneopets.online/dotplot-seurat.html
https://jokergoo.github.io/circlize_book/book/introduction.html#principle-of-design
https://divingintogeneticsandgenomics.rbind.io/post/enhancement-of-scrnaseq-heatmap-using-complexheatmap/
https://gdevailly.netlify.app/post/plotting-big-matrices-in-r/
http://www.itdecent.cn/p/0dbdd6733b34