circos圖在單細(xì)胞數(shù)據(jù)分析中的應(yīng)用

前情回顧:

Network在單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析中的應(yīng)用
?;鶊D在單細(xì)胞數(shù)據(jù)探索中的應(yīng)用
熱圖在單細(xì)胞數(shù)據(jù)分析中的應(yīng)用
R-南丁格爾玫瑰圖: 人民日?qǐng)?bào)都在用的細(xì)胞分群占比圖
三元相圖怎么看怎么畫(附R代碼示例)

在數(shù)據(jù)科學(xué)中,我們主要目標(biāo)是描述元素的對(duì)象和屬性及其之間的關(guān)系。在單細(xì)胞數(shù)據(jù)科學(xué)中,上游是在描述元素,如細(xì)胞的特性或基因的表達(dá)量,下游往往是描述細(xì)胞之間或基因之間的關(guān)系,如,配受體。關(guān)系型數(shù)據(jù),即兩個(gè)或以上變量之間的關(guān)系,其可視化是一門技術(shù)與藝術(shù)的科學(xué)。之前我們介紹的網(wǎng)絡(luò)圖,桑基圖,熱圖其實(shí)也都是關(guān)系型數(shù)據(jù)可視化的例子,今天,我們?cè)俳榻B一種常用的關(guān)系型數(shù)據(jù)可視化的工具:圈圖,或circos圖。

在這之前,我們先來(lái)思考一個(gè)相對(duì)宏觀的問題:如何選擇可視化工具呢?首先需要對(duì)我們的數(shù)據(jù)進(jìn)行分類,不同的數(shù)據(jù)結(jié)構(gòu)可以選擇不同的可視化工具,以達(dá)成自己想說(shuō)明的具體問題。

不要被這個(gè)導(dǎo)圖嚇到,它至少告訴我們數(shù)據(jù)類型是有限的,可視化的方法也是有限的,而不是無(wú)限的。好處是,避免了拿到數(shù)據(jù)手足無(wú)措的尷尬。關(guān)系型數(shù)據(jù)的可視化主要的技術(shù)有,和弦圖,網(wǎng)絡(luò)圖,?;鶊D,以及它們的變形,如下:

當(dāng)我們需要對(duì)"關(guān)系"進(jìn)一步細(xì)化的時(shí)候,可以用顏色,面積,粗細(xì)等屬性來(lái)映射不同的數(shù)據(jù)意義。下面來(lái)講我們今天的圈圖,請(qǐng)注意,這里的圈圖是廣義上的,是包含了和弦圖(Chord diagram)的,和弦圖往往往往出現(xiàn)在圈圖的中心,如下圖的ABC:

圖D當(dāng)然是圈圖,而其中沒有和弦圖,在這個(gè)意義上,圈圖是一種用來(lái)描述復(fù)雜關(guān)系的組合圖。由于圈層可以有多個(gè),每個(gè)圈層都可以按分類安排一種簡(jiǎn)單圖,如柱形圖,折線圖,環(huán)形圖等。來(lái)說(shuō)說(shuō)圈圖中的和弦圖先。

和弦圖用于探索實(shí)體組之間的關(guān)系,實(shí)體之間的連接用于顯示它們共享某些共同點(diǎn),這使和弦圖非常適合比較數(shù)據(jù)集內(nèi)或不同數(shù)據(jù)組之間的相似性。下圖很好地反映出,如何將一個(gè)二維表映射成一個(gè)和弦圖:

  • 細(xì)胞來(lái)源

那么,我們首先想到的應(yīng)用是多樣本聚類后,看每個(gè)群中不同細(xì)胞的樣本來(lái)源,我們?cè)谠?jīng)用?;鶊D實(shí)現(xiàn)過這個(gè)功能,幾乎,所有的?;鶊D都可以繪制成和弦圖:

如果這里每個(gè)亞群都注釋好細(xì)胞類型,又是不同部位的PMBC的話,是不是可以反映出細(xì)胞的去向與募集情況呢?

  • 受配圖對(duì)

然后,不同細(xì)胞類型之間的特異的受體和配體對(duì)關(guān)系,如NicheNet所繪制的那樣:

外在的六種顏色是六個(gè)細(xì)胞類型,不同細(xì)胞類型之間的受配體對(duì)用相同的顏色映射。

  • V-J基因關(guān)系

我們知道,在單細(xì)胞免疫組庫(kù)的數(shù)據(jù)分析中,V基因和J基因也有著對(duì)應(yīng)關(guān)系,這時(shí)候可以用和弦圖來(lái)反映V-J 之間的關(guān)系:

  • metadata 圈圖

在圈圖中關(guān)鍵是定義每一圈層的意義,在我們熟悉的Seurat對(duì)象中,metadata里的信息每一列都是一個(gè)獨(dú)立的屬性,所以我們可以把metadata信息繪制在圈圖之中。

#install.packages('circlize')
library(circlize)
library(Seurat)
library(ggraph,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')       
.libPaths()
library(tidyverse)
library(cowplot)
library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
unclass("Seurat")
class("Seurat")


 head(pbmc3k.final@meta.data)
               orig.ident nCount_RNA nFeature_RNA seurat_annotations percent.mt RNA_snn_res.0.5 seurat_clusters
AAACATACAACCAC     pbmc3k       2419          779       Memory CD4 T  3.0177759               1               1
AAACATTGAGCTAC     pbmc3k       4903         1352                  B  3.7935958               3               3
AAACATTGATCAGC     pbmc3k       3147         1129       Memory CD4 T  0.8897363               1               1
AAACCGTGCTTCCG     pbmc3k       2639          960         CD14+ Mono  1.7430845               2               2
AAACCGTGTATGCG     pbmc3k        980          521                 NK  1.2244898               6               6
AAACGCACTGGTAC     pbmc3k       2163          781       Memory CD4 T  1.6643551               1               1

繪制圈圖:

pbmc3k.final@meta.data -> df
circos.par("track.height" = 0.1)
circos.initialize(df$seurat_annotations, x = df$nFeature_RNA)
circos.track(df$seurat_annotations, y = df$nCount_RNA,
             panel.fun = function(x, y) {
                 circos.text(CELL_META$xcenter, 
                             CELL_META$cell.ylim[1.3] + mm_y(2), 
                             CELL_META$sector.index)
                 circos.axis(labels.cex = 0.6)
             })


col = rep(c("#FF0000"), length(levels(Idents(pbmc3k.final))))
circos.trackPoints(df$seurat_annotations, df$nFeature_RNA, df$nCount_RNA, col=col,pch = 16, cex = 0.5)
circos.text(1200, 1600, "lab", sector.index = "NK")


bgcol = rep(c( "#CCCCCC"), length(levels(Idents(pbmc3k.final))))
circos.trackHist(df$seurat_annotations, df$nFeature_RNA, bin.size = 20, bg.col = bgcol, col = NA)


circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$nCount_RNA,
             panel.fun = function(x, y) {
                 ind = sample(length(x), 10)
                 x2 = x[ind]
                 y2 = y[ind]
                 od = order(x2)
                 circos.lines(x2[od], y2[od])
             })
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$percent.mt,
             panel.fun = function(x, y) {
                 ind = sample(length(x), 10)
                 x2 = x[ind]
                 y2 = y[ind]
                 od = order(x2)
                 circos.lines(x2[od], y2[od])
             })


circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
    xlim = CELL_META$xlim
    ylim = CELL_META$ylim
    breaks = seq(xlim[1], xlim[2], by = 100)
    n_breaks = length(breaks)
    circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
                breaks[-1], rep(ylim[2], n_breaks - 1),
                col = rand_color(n_breaks), border = NA)
})


circos.link("B", c(400, 800), "NK", c(800,1000), col = "red",
            border = "blue", h = 0.2)
circos.link("CD14+ Mono", 400, "FCGR3A+ Mono", c(400,1200), col = "green", border = "black", lwd = 2, lty = 2)


##################
circos.clear()
dev.off()

通過以上的例子,我們可以感受到,圈圖也好,和弦圖也好,其實(shí)都是一個(gè)框架,有了這個(gè)框架我們就可以在這個(gè)上面填充信息。如果說(shuō)通過數(shù)據(jù)類型來(lái)尋找繪圖結(jié)構(gòu)是買毛坯房,那么,給每個(gè)繪圖元素映射生物學(xué)意義就是在裝修這個(gè)房屋。

不知道,這篇文章有沒有啟發(fā)到你呢?

封面:紐約時(shí)報(bào)的基因組圈圖

https://jokergoo.github.io/circlize_book/book/circos-heatmap.html
https://xgaoo.github.io/ClusterMap/ClusterMap.html
https://yimingyu.shinyapps.io/shinycircos/
https://www.data-to-viz.com/graph/chord.html
http://circos.ca/
https://www.bioconductor.org/packages/release/BiocViews.html#___SingleCell
https://www.r-graph-gallery.com/310-custom-hierarchical-edge-bundling.html
https://davemcg.github.io/post/lets-plot-scrna-dotplots/
https://pxy.shatterspikeneopets.online/dotplot-seurat.html
https://jokergoo.github.io/circlize_book/book/introduction.html#principle-of-design
https://divingintogeneticsandgenomics.rbind.io/post/enhancement-of-scrnaseq-heatmap-using-complexheatmap/
https://gdevailly.netlify.app/post/plotting-big-matrices-in-r/
http://www.itdecent.cn/p/0dbdd6733b34

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容