單細(xì)胞轉(zhuǎn)錄組之使用CellChat對單個(gè)數(shù)據(jù)集進(jìn)行細(xì)胞間通訊分析

細(xì)胞通訊分析可以提供細(xì)胞亞群互調(diào)控的信息,細(xì)胞間的調(diào)控主要是通過受體配體結(jié)合來實(shí)現(xiàn)信號(hào)傳遞的。

這里使用CellChat對單個(gè)單細(xì)胞數(shù)據(jù)集進(jìn)行細(xì)胞間通訊分析

1.CellChat對象的創(chuàng)建、處理及初始化

創(chuàng)建CellChat對象需要兩個(gè)文件:1.細(xì)胞的基因表達(dá)數(shù)據(jù),可以直接是Seurat 或者 SingleCellExperiment 對象;2.用戶分配的細(xì)胞標(biāo)簽(即基于標(biāo)簽的模式)或單細(xì)胞數(shù)據(jù)的低維表示(即無標(biāo)簽?zāi)J剑?。對于后者,CellChat 通過根據(jù)低維空間或偽時(shí)間軌跡空間中的細(xì)胞距離構(gòu)建共享的鄰近圖自動(dòng)對細(xì)胞進(jìn)行分組。

1.1 使用Seurat對象創(chuàng)建CellChat對象

#加載包
library(CellChat)
library(ggplot2)
library(ggalluvial)
library(svglite)
library(Seurat)
library(SeuratData)
options(stringsAsFactors = FALSE)
#加載之前跑完Seurat標(biāo)準(zhǔn)流程的數(shù)據(jù)
load(file = 'sce-monocyte.Rdata')

cellchat<-createCellChat(sce)

str(cellchat)

 [1] "Formal class 'CellChat' [package \"CellChat\"] with 14 slots"                                                        
 [2] "  ..@ data.raw      : num[0 , 0 ] "                                                                                  
 [3] "  ..@ data          :Formal class 'dgCMatrix' [package \"Matrix\"] with 6 slots"                                     
 [4] "  .. .. ..@ i       : int [1:615321] 11 26 33 43 52 57 73 98 130 142 ..."                                            
 [5] "  .. .. ..@ p       : int [1:643] 0 960 1510 2568 3990 4867 6408 7776 8793 9810 ..."                                 
 [6] "  .. .. ..@ Dim     : int [1:2] 13714 642"                                                                           
 [7] "  .. .. ..@ Dimnames:List of 2"                                                                                      
 [8] "  .. .. .. ..$ : chr [1:13714] \"AL627309.1\" \"AP006222.2\" \"RP11-206L10.2\" \"RP11-206L10.9\" ..."                
 [9] "  .. .. .. ..$ : chr [1:642] \"AAACCGTGCTTCCG-1\" \"AAACGCTGTTTCTG-1\" \"AAAGAGACGCGAGA-1\" \"AAAGCAGATATCGG-1\" ..."
[10] "  .. .. ..@ x       : num [1:615321] 3.56 1.57 2.52 1.57 1.57 ..."                                                   
[11] "  .. .. ..@ factors : list()"                                                                                        
[12] "  ..@ data.signaling: num[0 , 0 ] "                                                                                  
[13] "  ..@ data.scale    : num[0 , 0 ] "                                                                                  
[14] "  ..@ data.project  : num[0 , 0 ] "                                                                                  
[15] "  ..@ net           : list()"                                                                                        
[16] "  ..@ netP          : list()"                                                                                        
[17] "  ..@ meta          :'data.frame':\t642 obs. of  7 variables:"                                                       
[18] "  .. ..$ orig.ident     : Factor w/ 1 level \"pbmc3k\": 1 1 1 1 1 1 1 1 1 1 ..."                                     
[19] "  .. ..$ nCount_RNA     : num [1:642] 2639 1103 3033 4584 2683 ..."                                                  
[20] "  .. ..$ nFeature_RNA   : int [1:642] 960 550 1058 1422 877 1541 1368 1017 1017 822 ..."                             
[21] "  .. ..$ percent.mt     : num [1:642] 1.74 2.9 1.42 1.4 2.5 ..."                                                     
[22] "  .. ..$ RNA_snn_res.0.5: Factor w/ 9 levels \"0\",\"1\",\"2\",\"3\",..: 2 6 2 2 2 6 6 2 2 2 ..."                    
[23] "  .. ..$ seurat_clusters: Factor w/ 9 levels \"0\",\"1\",\"2\",\"3\",..: 2 6 2 2 2 6 6 2 2 2 ..."                    
[24] "  .. ..$ ident          : Factor w/ 2 levels \"CD14+ Mono\",\"FCGR3A+ Mono\": 1 2 1 1 1 2 2 1 1 1 ..."               
[25] "  ..@ idents        : Factor w/ 2 levels \"CD14+ Mono\",\"FCGR3A+ Mono\": 1 2 1 1 1 2 2 1 1 1 ..."                   
[26] "  ..@ DB            : list()"                                                                                        
[27] "  ..@ LR            : list()"                                                                                        
[28] "  ..@ var.features  : list()"                                                                                        
[29] "  ..@ dr            : list()"                                                                                        
[30] "  ..@ options       :List of 1"                                                                                      
[31] "  .. ..$ mode: chr \"single\""                                               

1.2 使用表達(dá)矩陣創(chuàng)建CellChat對象

# 加載scRNA-seq 數(shù)據(jù)矩陣及其meta數(shù)據(jù)
load(url("https://ndownloader.figshare.com/files/25950872")) # 該數(shù)據(jù)集包含兩組: 正常組和疾病組
data.input = data_humanSkin$data # 標(biāo)準(zhǔn)化過的矩陣
meta = data_humanSkin$meta 
cell.use = rownames(meta)[meta$condition == "LS"] # 從疾病組中提取細(xì)胞名

# 整理數(shù)據(jù):將疾病組單細(xì)胞數(shù)據(jù)提取出來
data.input = data.input[, cell.use]
meta = meta[cell.use, ]
# meta = data.frame(labels = meta$labels[cell.use], row.names = colnames(data.input)) # 手動(dòng)創(chuàng)建包含細(xì)胞labels的數(shù)據(jù)框
unique(meta$labels) # check the cell labels

cellchat <- createCellChat(object = data.input, meta = meta, group.by = "labels")
#從表達(dá)矩陣創(chuàng)建CellChat對象
#添加亞群信息
cellchat <- addMeta(cellchat, meta = meta)
cellchat <- setIdent(cellchat, ident.use = "labels") 
levels(cellchat@idents) 
groupSize <- as.numeric(table(cellchat@idents)) # 每個(gè)亞群細(xì)胞數(shù)

1.3 設(shè)置配體受體交互數(shù)據(jù)庫

CellChatDB 是一個(gè)手動(dòng)整理的文獻(xiàn)支持的配體受體在人和小鼠中的交互數(shù)據(jù)庫。小鼠中的CellChatDB包含2021個(gè)經(jīng)驗(yàn)證的分子相互作用,包括60%的自分泌/旁分泌信號(hào)相互作用、21%的細(xì)胞外基質(zhì)(ECM)受體相互作用和19%的細(xì)胞-細(xì)胞接觸相互作用。人的CellChatDB包含1939個(gè)經(jīng)驗(yàn)證的分子相互作用,包括61.8%的自分泌/旁分泌信號(hào)相互作用、21.7%的細(xì)胞外基質(zhì)(ECM)受體相互作用和16.5%的細(xì)胞-細(xì)胞接觸相互作用。

CellChatDB <- CellChatDB.human 
# 如果是小鼠數(shù)據(jù),使用CellChatDB.mouse
showDatabaseCategory(CellChatDB)
#查看下數(shù)據(jù)庫結(jié)構(gòu)
dplyr::glimpse(CellChatDB$interaction)

Rows: 1,939
Columns: 11
$ interaction_name   <chr> "TGFB1_TGFBR1_TGFBR2", "TG…
$ pathway_name       <chr> "TGFb", "TGFb", "TGFb", "T…
$ ligand             <chr> "TGFB1", "TGFB2", "TGFB3",…
$ receptor           <chr> "TGFbR1_R2", "TGFbR1_R2", …
$ agonist            <chr> "TGFb agonist", "TGFb agon…
$ antagonist         <chr> "TGFb antagonist", "TGFb a…
$ co_A_receptor      <chr> "", "", "", "", "", "", ""…
$ co_I_receptor      <chr> "TGFb inhibition receptor"…
$ evidence           <chr> "KEGG: hsa04350", "KEGG: h…
$ annotation         <chr> "Secreted Signaling", "Sec…
$ interaction_name_2 <chr> "TGFB1 - (TGFBR1+TGFBR2)",…


# 使用數(shù)據(jù)庫中的自分泌/旁分泌信號(hào)相互作用部分進(jìn)行后續(xù)分析,可根據(jù)試驗(yàn)方案、目的選擇
CellChatDB.use <- subsetDB(CellChatDB, search = "Secreted Signaling") 
# 使用數(shù)據(jù)庫所有內(nèi)容進(jìn)行分析
# CellChatDB.use <- CellChatDB 

# 在cellchat對象中設(shè)置使用的數(shù)據(jù)庫
cellchat@DB <- CellChatDB.use

1.4 表達(dá)數(shù)據(jù)的預(yù)處理

為了推斷細(xì)胞的通訊狀態(tài),首先識(shí)別一個(gè)細(xì)胞組中過度表達(dá)的配體或受體,然后識(shí)別過度表達(dá)的配體受體相互作用。

還可以將基因表達(dá)數(shù)據(jù)投影到蛋白質(zhì)-蛋白質(zhì)相互作用 (PPI) 網(wǎng)絡(luò)上。投影過程根據(jù)實(shí)驗(yàn)驗(yàn)證的蛋白質(zhì)-蛋白質(zhì)網(wǎng)絡(luò)中定義的基因表達(dá)值來平滑基因的表達(dá)值。此功能在分析具有淺測序深度的單細(xì)胞數(shù)據(jù)時(shí)很有用,因?yàn)橥队翱蓽p少信號(hào)基因的dropput效應(yīng),特別是對于配體/受體的可能的零表達(dá)。用戶可以通過在computeCommunProb()中設(shè)置raw.use = TRUE跳過此步驟。

cellchat <- subsetData(cellchat) 
# subset the expression data of signaling genes for saving computation cost

#設(shè)置并行運(yùn)算
future::plan("multicore", workers = 40) 
#識(shí)別細(xì)胞組中過度表達(dá)的配體或受體
cellchat <- identifyOverExpressedGenes(cellchat)
#識(shí)別過度表達(dá)的配體受體相互作用
cellchat <- identifyOverExpressedInteractions(cellchat)
#將基因表達(dá)數(shù)據(jù)投射到PPI網(wǎng)絡(luò)上
cellchat <- projectData(cellchat, PPI.human)

2.細(xì)胞通信網(wǎng)絡(luò)推斷

CellChat 通過將基因表達(dá)與先前已知的信號(hào)配體、受體及其同因子之間的相互作用知識(shí)相結(jié)合,利用大量作用規(guī)律,對細(xì)胞-細(xì)胞通信的概率進(jìn)行模擬。為每個(gè)相互作用分配一個(gè)概率值并進(jìn)行置換檢驗(yàn),來推斷具有生物學(xué)意義的細(xì)胞-細(xì)胞通信。

推斷的配體受體對的數(shù)量顯然取決于計(jì)算每個(gè)細(xì)胞組平均基因表達(dá)的方法。默認(rèn)情況下,CellChat 使用一種統(tǒng)計(jì)學(xué)上強(qiáng)大的均值方法,稱為"trimean",與其他方法相比,它產(chǎn)生的相互作用更少。然而,我們發(fā)現(xiàn) CellChat 在預(yù)測更強(qiáng)的交互方面表現(xiàn)良好,這非常有助于縮小交互范圍,以便進(jìn)一步進(jìn)行實(shí)驗(yàn)驗(yàn)證。在computeCommunProb中,我們提供了一個(gè)選項(xiàng),用于使用其他方法,如5%和10%截?cái)嗑?,來?jì)算平均基因表達(dá)。值得注意的是,"trimean"大約是25%的截?cái)嗥骄?,這意味著如果一組表達(dá)細(xì)胞的百分比低于25%,則平均基因表達(dá)為零。要使用 10% 截?cái)嗟钠骄?,用戶可以設(shè)置type = "truncatedMean"和對trim = 0.1。

在分析未分類的單細(xì)胞轉(zhuǎn)錄組時(shí),假設(shè)豐富的細(xì)胞群傾向于發(fā)送比稀有細(xì)胞群更強(qiáng)的信號(hào),CellChat 還可以在概率計(jì)算中考慮每個(gè)細(xì)胞組中細(xì)胞比例的影響。用戶可以設(shè)置population.size = TRUE

2.1 計(jì)算通信概率并推斷cellchat網(wǎng)絡(luò)

cellchat <- computeCommunProb(cellchat, raw.use = TRUE)
# 如果在某些細(xì)胞群中只有少數(shù)細(xì)胞,則過濾掉細(xì)胞間的通信
cellchat <- filterCommunication(cellchat, min.cells = 10)

2.2 提取推斷的cellchat網(wǎng)絡(luò)作為數(shù)據(jù)框架

我們提供一個(gè)函數(shù)subsetCommunication,以輕松訪問推斷感興趣的細(xì)胞-細(xì)胞通信。例如

  • df.net <- subsetCommunication(cellchat)返回一個(gè)數(shù)據(jù)框架,該數(shù)據(jù)框架由配體/受體級(jí)別的所有推斷細(xì)胞通信組成。設(shè)置slot.name = "netP"可以在信號(hào)通路級(jí)別訪問推斷的通信

  • df.net <- subsetCommunication(cellchat, sources.use = c(1,2), targets.use = c(4,5))將推斷的細(xì)胞-細(xì)胞通信從細(xì)胞組1和2發(fā)送到細(xì)胞組4和5。

  • df.net <- subsetCommunication(cellchat, signaling = c("WNT", "TGFb"))通過向WNT和TGFb發(fā)出信號(hào)來調(diào)節(jié)推斷的細(xì)胞通信。

2.3 在信號(hào)通路級(jí)別推斷細(xì)胞-細(xì)胞通信

CellChat 通過總結(jié)與每個(gè)信號(hào)通路相關(guān)的所有配體-受體相互作用的通訊概率,來計(jì)算信號(hào)通路級(jí)別上的通訊概率。

每個(gè)配體受體對和每個(gè)信號(hào)通路的推斷細(xì)胞間通信網(wǎng)絡(luò)分別存儲(chǔ)在插槽"net"和"netP"中。

cellchat <- computeCommunProbPathway(cellchat)

2.4 計(jì)算整合的細(xì)胞通信網(wǎng)絡(luò)

通過計(jì)算鏈接數(shù)或匯總通信概率來計(jì)算通信網(wǎng)絡(luò)

cellchat <- aggregateNet(cellchat)

可視化整合的細(xì)胞通信網(wǎng)絡(luò)。 使用圓圖顯示任意兩個(gè)細(xì)胞組之間的相互作用次數(shù)或總交互強(qiáng)度(比重)。

groupSize <- as.numeric(table(cellchat@idents))
par(mfrow = c(1,2), xpd=TRUE)

netVisual_circle(cellchat@net$count, vertex.weight = groupSize, weight.scale = T, label.edge= F, title.name = "Number of interactions")

netVisual_circle(cellchat@net$weight, vertex.weight = groupSize, weight.scale = T, label.edge= F, title.name = "Interaction weights/strength")

由于細(xì)胞通信網(wǎng)絡(luò)較為復(fù)雜,我們可以檢查每個(gè)細(xì)胞組發(fā)送的信號(hào)。在這里,我們還控制參數(shù)edge.weight.max,以便我們可以比較不同網(wǎng)絡(luò)之間的邊緣權(quán)重。

mat <- cellchat@net$weight
par(mfrow = c(3,4), xpd=TRUE)
for (i in 1:nrow(mat)) {
  mat2 <- matrix(0, nrow = nrow(mat), ncol = ncol(mat), dimnames = dimnames(mat))
  mat2[i, ] <- mat[i, ]
  netVisual_circle(mat2, vertex.weight = groupSize, weight.scale = T, edge.weight.max = max(mat), title.name = rownames(mat)[i])
}

3. 細(xì)胞通信網(wǎng)絡(luò)的可視化

CellChat提供了幾種可視化細(xì)胞通信網(wǎng)絡(luò)的方法,包括分層圖、圓圖、和弦圖和氣泡圖。還提供了一個(gè)易于使用的工具,用于提取和可視化推斷網(wǎng)絡(luò)的高階信息。例如,它允許對細(xì)胞群的主要信號(hào)輸入和輸出以及這些群和信號(hào)如何協(xié)調(diào)功能進(jìn)行現(xiàn)成預(yù)測。CellChat可以通過結(jié)合通訊網(wǎng)絡(luò)分析、模式識(shí)別和多重學(xué)習(xí)方法,使用綜合方法對推斷出的細(xì)胞-細(xì)胞通信網(wǎng)絡(luò)進(jìn)行定量表征和比較。

3.1 使用層次結(jié)構(gòu)圖、圓圖或和弦圖可視化每個(gè)信號(hào)通路

層次結(jié)構(gòu)圖: 用戶應(yīng)定義vertex.receiver,這是一個(gè)數(shù)字矢量,將細(xì)胞群的索引作為層次圖左側(cè)的目標(biāo)。此分層圖由兩個(gè)部分組成:左部分顯示自分泌和旁分泌向某些感興趣的細(xì)胞組(即定義的)發(fā)出信號(hào),右部分顯示自分泌和旁分泌向數(shù)據(jù)集中剩余的細(xì)胞組發(fā)出信號(hào)。因此,層級(jí)圖提供了一種信息性和直觀的方式來可視化自分泌和旁分泌信號(hào)之間的細(xì)胞群之間的感興趣通信。例如,在研究成纖維細(xì)胞和免疫細(xì)胞之間的細(xì)胞-細(xì)胞通信時(shí),用戶可以定義為所有成纖維細(xì)胞組。

和弦圖: CellChat 提供兩種功能netVisual_chord_cell和netVisual_chord_gene,并可視化具有不同目的和不同級(jí)別的細(xì)胞通信。netVisual_chord_cell用于可視化不同細(xì)胞群之間的細(xì)胞-細(xì)胞通信(和弦圖中的每個(gè)部分是細(xì)胞組),netVisual_chord_gene用于可視化由多個(gè)配體受體或信號(hào)通路調(diào)節(jié)的細(xì)胞-細(xì)胞通信(和弦圖中的每個(gè)部分都是配體、受體或信號(hào)通路)。

邊緣顏色/權(quán)重、節(jié)點(diǎn)顏色/大小/形狀的解釋: 在所有可視化圖中,邊緣顏色與發(fā)送者源一致,邊緣權(quán)重與交互強(qiáng)度成正比。較厚的邊緣線表示信號(hào)更強(qiáng)。在層次結(jié)構(gòu)圖和圓圖中,圓的大小與每個(gè)細(xì)胞組中的細(xì)胞數(shù)量成正比。在層次圖中,實(shí)心和開放的圓分別代表源和目標(biāo)。在和弦圖中,內(nèi)條顏色表示從相應(yīng)的外條接收信號(hào)的目標(biāo)。內(nèi)條大小與目標(biāo)接收的信號(hào)強(qiáng)度成正比。這種內(nèi)條有助于解釋復(fù)雜的和弦圖。請注意,有一些內(nèi)條沒有與任何一些細(xì)胞組鏈接,請忽略它,因?yàn)檫@是一個(gè)本包尚未解決的問題。

不同層次的細(xì)胞通信可視化: 可以使用netVisual_aggregate可視化信號(hào)通路的推斷通信網(wǎng)絡(luò),并使用netVisual_individual可視化與該信號(hào)通路相關(guān)的單個(gè)L-R對的推斷通信網(wǎng)絡(luò)。

以輸入一個(gè)信號(hào)通路為例。所有顯示重要通信的信號(hào)通路均可通過cellchat@netP$pathways獲取。

pathways.show <- c("CXCL") 

netVisual_aggregate(cellchat, signaling = pathways.show)
# 和弦圖
par(mfrow=c(1,1))
netVisual_chord_cell(cellchat, signaling = pathways.show, title.name = paste0(pathways.show, " signaling network"))
# 熱圖
par(mfrow=c(1,1))
netVisual_heatmap(cellchat, signaling = pathways.show, color.heatmap = "Reds")

3.2 計(jì)算每個(gè)配體受體對整體信號(hào)通路的貢獻(xiàn),并可視化由單個(gè)配體受體對調(diào)節(jié)的細(xì)胞通信

netAnalysis_contribution(cellchat, signaling = pathways.show)

還可以可視化由單個(gè)配體受體對調(diào)節(jié)的細(xì)胞-細(xì)胞通信。函數(shù)extractEnrichedLR來提取給定信號(hào)通路的所有重要相互作用(L-R對)和相關(guān)信號(hào)基因。

pairLR.CXCL <- extractEnrichedLR(cellchat, signaling = pathways.show, geneLR.return = FALSE)
LR.show <- pairLR.CXCL[1,] # show one ligand-receptor pair

netVisual_individual(cellchat, signaling = pathways.show,  pairLR.use = LR.show)
#同樣可以用熱圖(netVisual_heatmap)和和弦圖(netVisual_chord_cell)展示

3.3 自動(dòng)保存所有推斷網(wǎng)絡(luò)的模塊以進(jìn)行快速探索

可以使用‘for … loop’自動(dòng)保存所有推斷網(wǎng)絡(luò)快速探索使用。netVisual,netVisual支持svg、png和pdf格式的輸出。

# 所有顯著的信號(hào)通路
pathways.show.all <- cellchat@netP$pathways
# 檢查細(xì)胞排序,選擇合適的受配體
levels(cellchat@idents)
vertex.receiver = seq(1,4)
for (i in 1:length(pathways.show.all)) {
  # Visualize communication network associated with both signaling pathway and individual L-R pairs
  netVisual(cellchat, signaling = pathways.show.all[i], vertex.receiver = vertex.receiver, layout = "hierarchy")
  # Compute and visualize the contribution of each ligand-receptor pair to the overall signaling pathway
  gg <- netAnalysis_contribution(cellchat, signaling = pathways.show.all[i])
  ggsave(filename=paste0(pathways.show.all[i], "_L-R_contribution.pdf"), plot=gg, width = 3, height = 2, units = 'in', dpi = 300)
}

3.4 可視化由多個(gè)配體受體或信號(hào)通路調(diào)節(jié)的細(xì)胞通信

氣泡圖
可以使用netVisual_bubble顯示從某些細(xì)胞組到其他細(xì)胞組的所有重要相互作用(L-R對)。

# 顯示從某些細(xì)胞組到其他細(xì)胞組的所有顯著的相互作用(L-R 對)
netVisual_bubble(cellchat, sources.use = 4, targets.use = c(5:11), remove.isolate = FALSE)
#去掉sources.use = 4, targets.use = c(5:11)展示的是所有組的相互通訊
# 顯示從某細(xì)胞組到其他細(xì)胞組的某個(gè)通路的相互作用(L-R 對)
netVisual_bubble(cellchat, sources.use = 4, targets.use = c(5:11), signaling = c("CCL","CXCL"), remove.isolate = FALSE)

和弦圖
顯示從某些細(xì)胞組到其他細(xì)胞組的所有相互作用(L-R對或信號(hào)通路)。兩個(gè)特殊情況:一個(gè)顯示從一個(gè)細(xì)胞組發(fā)送的所有交互,另一個(gè)顯示一個(gè)細(xì)胞組接收的所有交互;顯示用戶輸入的交互或用戶定義的某些信號(hào)通路

#顯示從某些細(xì)胞組到其他細(xì)胞組的所有顯著的相互作用(L-R 對)
netVisual_chord_gene(cellchat, sources.use = 4, targets.use = c(5:11), lab.cex = 0.5,legend.pos.y = 30)
#同氣泡圖一樣,和弦圖也可以通過調(diào)整sources.use 、targets.use及signaling展示不同的通路,如果基因名稱重疊,可以通過降低small.gap值來調(diào)整參數(shù)。

3.5 使用小提琴/點(diǎn)圖繪制信號(hào)基因表達(dá)分布

可以利用Seurat 包裝的函數(shù)plotGeneExpression繪制與L-R對或信號(hào)通路相關(guān)的信號(hào)基因的基因表達(dá)分布圖。

plotGeneExpression(cellchat, signaling = "CXCL")

默認(rèn)情況下,可以通過plotGeneExpression只顯示與推斷的重要通信相關(guān)的信號(hào)基因的表達(dá),或者,用戶可以使用extractEnrichedLR提取與推斷的L-R對或信號(hào)通路相關(guān)的信號(hào)基因,然后使用Seurat包繪制基因表達(dá)圖。

plotGeneExpression(cellchat, signaling = "CXCL", enriched.only = FALSE)

4. 細(xì)胞通信網(wǎng)絡(luò)系統(tǒng)分析

為了便于對復(fù)雜的細(xì)胞間通信網(wǎng)絡(luò)進(jìn)行解釋,CellChat 通過從圖形理論、模式識(shí)別和多重學(xué)習(xí)中抽象的方法對網(wǎng)絡(luò)進(jìn)行量化。

  • 它可以使用網(wǎng)絡(luò)分析的集中度措施確定給定信號(hào)網(wǎng)絡(luò)中的主要信號(hào)源和目標(biāo)以及調(diào)節(jié)者和影響者
  • 它可以通過利用模式識(shí)別方法預(yù)測特定細(xì)胞類型的關(guān)鍵傳入和傳出信號(hào),以及不同細(xì)胞類型之間的協(xié)調(diào)響應(yīng)。
  • 它可以通過定義相似度測量方法和從功能和拓?fù)浣嵌冗M(jìn)行多重學(xué)習(xí)來分組信號(hào)通路。
  • 它可以通過對多個(gè)網(wǎng)絡(luò)的聯(lián)合多重學(xué)習(xí)來描繪保存上下文特定的信號(hào)通路。

4.1 識(shí)別細(xì)胞組的信號(hào)角色(例如,占主導(dǎo)地位的發(fā)送器、接收器)以及主要貢獻(xiàn)信號(hào)

CellChat 允許通過計(jì)算每個(gè)細(xì)胞組的多個(gè)網(wǎng)絡(luò)中心測量,隨時(shí)識(shí)別細(xì)胞間通信網(wǎng)絡(luò)中占主導(dǎo)地位的發(fā)送者、接收者、調(diào)解者和影響者。具體來說,我們在加權(quán)導(dǎo)向網(wǎng)絡(luò)中采用了措施,包括度外、度內(nèi)、介于兩者之間流動(dòng)和信息集中度,分別識(shí)別細(xì)胞間通信的主要發(fā)送者、接收者、調(diào)解者和影響者。在以權(quán)重為計(jì)算通信概率的加權(quán)定向網(wǎng)絡(luò)中,將外向度計(jì)算為來自細(xì)胞組的傳出信號(hào)的通信概率之和,并計(jì)算為傳入信號(hào)對單元組通信概率的總和的度內(nèi),可用于分別識(shí)別信號(hào)網(wǎng)絡(luò)的主要單元件發(fā)送器和接收器。有關(guān)信息中心之間流動(dòng)的定義,請查看參考文獻(xiàn)1參考文獻(xiàn)2。

計(jì)算和可視化網(wǎng)絡(luò)中心分?jǐn)?shù)

cellchat <- netAnalysis_computeCentrality(cellchat, slot.name = "netP") # “netP”:推斷出的信號(hào)通路的細(xì)胞間通信網(wǎng)絡(luò)
#使用熱圖可視化計(jì)算的中心性得分,以便及早識(shí)別細(xì)胞群的主要信號(hào)作用
netAnalysis_signalingRole_network(cellchat, signaling = pathways.show, width = 8, height = 2.5, font.size = 10)

在 2D 空間中可視化占主導(dǎo)地位的發(fā)送器(源)和接收器(目標(biāo))

使用散點(diǎn)圖在 2D 空間中可視化占主導(dǎo)地位的發(fā)射器(源)和接收器(目標(biāo))。

x軸和y軸分別為與每個(gè)單元組相關(guān)的總傳出或傳入通信概率。點(diǎn)的大小與每個(gè)單元組關(guān)聯(lián)的推斷鏈接(包括傳出鏈接和傳入鏈接)的數(shù)量成正比。點(diǎn)的顏色表示不同的細(xì)胞群。如果定義了“組”,點(diǎn)形狀表示單元格組的不同類別。

# 聚合細(xì)胞-細(xì)胞通信網(wǎng)絡(luò)中所有信號(hào)通路的信號(hào)作用分析
gg1 <- netAnalysis_signalingRole_scatter(cellchat)

# 感興趣的細(xì)胞-細(xì)胞通信網(wǎng)絡(luò)的信號(hào)作用分析
gg2 <- netAnalysis_signalingRole_scatter(cellchat, signaling = c("CXCL", "CCL"))

gg1 + gg2

識(shí)別對某些細(xì)胞組的傳出或傳入信號(hào)貢獻(xiàn)最大的信號(hào)

#識(shí)別所有信號(hào)對某些細(xì)胞組的傳出或傳入的貢獻(xiàn)
ht1 <- netAnalysis_signalingRole_heatmap(cellchat, pattern = "outgoing")
ht2 <- netAnalysis_signalingRole_heatmap(cellchat, pattern = "incoming")
ht1 + ht2
# #識(shí)別所有信號(hào)對某些細(xì)胞組的傳出或傳入的貢獻(xiàn)
ht <- netAnalysis_signalingRole_heatmap(cellchat, signaling = c("CXCL", "CCL"))

4.2 確定全局通信模式,探索多個(gè)細(xì)胞類型和信號(hào)通路如何協(xié)調(diào)在一起

除了探索單個(gè)通路的詳細(xì)通信外,一個(gè)重要問題是多個(gè)細(xì)胞組和信號(hào)通路如何協(xié)調(diào)功能。CellChat 采用模式識(shí)別方法識(shí)別全局通信模式。

隨著模式數(shù)量的增加,可能會(huì)有多余的模式,因此很難解釋通信模式。我們選擇了五種模式作為默認(rèn)模式。一般來說,它具有生物學(xué)意義,模式數(shù)量要大于2。此外,我們還提供了一個(gè)函數(shù)selectK來推斷模式的數(shù)量,該數(shù)基于 NMF R 包中已實(shí)施的兩個(gè)指標(biāo)Cophenetic和Silhouette。這兩個(gè)指標(biāo)都根據(jù)共識(shí)矩陣的分層聚類來衡量特定數(shù)量模式的穩(wěn)定性。對于一系列模式,適當(dāng)?shù)哪J綌?shù)量是Cophenetic 和 Silhouette值開始突然下降的模式。

識(shí)別和可視化分泌細(xì)胞的傳出通信模式

傳出模式揭示了發(fā)送者細(xì)胞(即作為信號(hào)源的細(xì)胞)如何相互協(xié)調(diào),以及它們?nèi)绾闻c某些信號(hào)通路協(xié)調(diào)以驅(qū)動(dòng)通信。

為了直觀地顯示潛在模式與細(xì)胞群和配體受體對或信號(hào)通路的關(guān)聯(lián),我們使用了河流(沖積)圖。我們首先將每行 W 和 H 的每列標(biāo)準(zhǔn)化為 [0,1],然后在 W 和 H 中設(shè)置為零,如果它們小于 0.5。這種閾值允許發(fā)現(xiàn)與每個(gè)推斷模式相關(guān)的最豐富的細(xì)胞組和信號(hào)通路,即每個(gè)細(xì)胞組或信號(hào)通路僅與一個(gè)推斷模式相關(guān)聯(lián)。這些閾值矩陣 W 和 H 用作創(chuàng)建沖積圖的輸入。

為了將細(xì)胞群與其豐富的信號(hào)通路直接聯(lián)系起來,如果 W 和 H 中的元素少于 1/R(R 是潛在模式數(shù)),則我們將它們中的元素設(shè)置為零。通過使用不太嚴(yán)格的閾值,可以獲得與每個(gè)細(xì)胞組相關(guān)的更豐富的信號(hào)通路。我們使用每個(gè)細(xì)胞組對通過乘以 W 乘以 H 計(jì)算的每個(gè)信號(hào)通路的貢獻(xiàn)分?jǐn)?shù),構(gòu)建了一個(gè)點(diǎn)圖,其中點(diǎn)大小與貢獻(xiàn)分?jǐn)?shù)成正比,以顯示細(xì)胞組與其豐富信號(hào)通路之間的關(guān)聯(lián)。用戶還可以降低參數(shù)cutoff,以顯示每個(gè)細(xì)胞組關(guān)聯(lián)的更豐富的信號(hào)通路。

#加載需要的包
library(NMF)
library(ggalluvial)

運(yùn)行selectK推斷模式的數(shù)量

#我們根據(jù)在NMF R包中實(shí)現(xiàn)的兩個(gè)指標(biāo)推斷出模式的數(shù)量,這兩個(gè)指標(biāo)包括Cophenetic和Silhouette。這兩個(gè)度量標(biāo)準(zhǔn)都是基于共識(shí)矩陣的層次聚類來衡量特定數(shù)量的模式的穩(wěn)定性。對于一個(gè)模式數(shù)量范圍,一個(gè)合適的模式數(shù)量是Cophenetic和Silhouette值開始突然下降的那個(gè)。
selectK(cellchat, pattern = "outgoing")

當(dāng)傳出模式數(shù)為 3 時(shí),Cophenetic 和Silhouette值都開始突然下降。

nPatterns = 3
cellchat <- identifyCommunicationPatterns(cellchat, pattern = "outgoing", k = nPatterns)

河流圖

netAnalysis_river(cellchat, pattern = "outgoing")

點(diǎn)圖

netAnalysis_dot(cellchat, pattern = "outgoing")

識(shí)別和可視化目標(biāo)細(xì)胞的傳入通信模式
傳入模式顯示目標(biāo)細(xì)胞(即信號(hào)接收器中的細(xì)胞)如何相互協(xié)調(diào),以及它們?nèi)绾闻c某些信號(hào)通路協(xié)調(diào)以響應(yīng)傳入的信號(hào)。

selectK(cellchat, pattern = "incoming")

當(dāng)傳入模式的數(shù)量為 4 時(shí),Cophenetic 值開始下降。

nPatterns = 4
cellchat <- identifyCommunicationPatterns(cellchat, pattern = "incoming", k = nPatterns)

河流圖

netAnalysis_river(cellchat, pattern = "incoming")

點(diǎn)圖

netAnalysis_dot(cellchat, pattern = "incoming")

4.3 信號(hào)網(wǎng)絡(luò)的多重和分類學(xué)習(xí)分析

CellChat 能夠量化所有重要信號(hào)通路之間的相似性,然后根據(jù)其CellChat 網(wǎng)絡(luò)的相似性對其進(jìn)行分組。分組可以基于功能或結(jié)構(gòu)相似性進(jìn)行。

功能相似性:功能相似度高表示主要發(fā)送器和接收器相似,可解釋為兩個(gè)信號(hào)通路或兩個(gè)配體受體對具有相似的作用。功能相似性分析要求兩個(gè)數(shù)據(jù)集之間的細(xì)胞群組成相同。

結(jié)構(gòu)相似性:結(jié)構(gòu)相似性用于比較其信號(hào)網(wǎng)絡(luò)結(jié)構(gòu),而不考慮發(fā)送器和接收器的相似性。

根據(jù)信號(hào)組的功能相似性識(shí)別信號(hào)組

cellchat <- computeNetSimilarity(cellchat, type = "functional")
cellchat <- netEmbedding(cellchat, type = "functional")
#Error in runUMAP(Similarity, min_dist = min_dist, n_neighbors = n_neighbors,  : 
  Cannot find UMAP, please install through pip (e.g. pip install umap-learn or reticulate::py_install(packages = 'umap-learn')).

#解決方案:
library(reticulate)
py_available()
reticulate::py_install(packages = 'umap-learn')
#之后再運(yùn)行,如若還是報(bào)錯(cuò),重啟R
cellchat <- netEmbedding(cellchat, type = "functional")

cellchat <- netClustering(cellchat, type = "functional")

netVisual_embedding(cellchat, type = "functional", label.size = 3.5)

# netVisual_embeddingZoomIn(cellchat, type = "functional", nCol = 2)

基于結(jié)構(gòu)相似性識(shí)別信號(hào)組

cellchat <- computeNetSimilarity(cellchat, type = "structural")
cellchat <- netEmbedding(cellchat, type = "structural")

cellchat <- netClustering(cellchat, type = "structural")

netVisual_embedding(cellchat, type = "structural", label.size = 3.5)
netVisual_embeddingZoomIn(cellchat, type = "structural", nCol = 2)

5. 保存CellChat對象

以便后續(xù)使用

saveRDS(cellchat, file = "cellchat_humanSkin_LS.rds")

參考來源

CellChat-github

CellChat三部曲1:使用CellChat對單個(gè)數(shù)據(jù)集進(jìn)行細(xì)胞間通訊分析

運(yùn)行cellchat分析時(shí)遇到的一些問題

致謝
I thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

THE END

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容