當紅辣子雞-空間轉錄組與單細胞轉錄組的整合分析(下篇)

作者:堯小飛
審稿:童蒙
編輯:amethyst

SPOTlight

SPOTlight 的目標是提供一種工具,能夠對包含細胞混合物的每個捕獲位置中存在的細胞類型和細胞類型比例進行解卷積,最初是為 10X 的 Visium - 空間轉錄組學技術開發(fā)的,它可用于返回混合物的所有技術細胞。SPOTlight 基于通過NMFreg模型為每種細胞類型查找主要的topic profile signatures,并找到最適合想要解卷積的點的組合。其分析流程如下圖所示:


軟件的安裝

該軟件為GitHub上面開源,可以從GitHub上下載SPOTlight(https://github.com/MarcElosua/SPOTlight)然后本地安裝,或者直接通過網址安裝,具體安裝命令如下:

install.packages("devtools")
devtools::install_github("https://github.com/MarcElosua/SPOTlight")
#如果網速不快的話,可以先下載,然后本地安裝

SPOTlight的使用

01 包的導入

library(RCTD)
library(Matrix)
library(Hmisc)
library(annotools)
library(data.table)
library(presto)
library(Seurat)
library(SeuratWrappers)
require(dplyr)
library(data.table)
library(SeuratData)
library(gt)
library(SPOTlight)
library(igraph)
library(RColorBrewer)

02 數(shù)據的準備

這里的單細胞轉錄組數(shù)據為已經鑒定好細胞類型的單細胞數(shù)據的seurat對象,一般為Seurat4.0以上版本,細胞類型的列名為cell_annotation,一般細胞類型可以通過命令:sc@meta.data$cell_annotation進行查看,如果細胞類型中有未知細胞類型比如none,則需要刪掉這部分細胞,不然會影響解卷積分析結果。然后對單細胞的進行marker基因分析,這里用的是RunPrestoAll函數(shù),這個函數(shù)效率較高,與FindAllMarkers函數(shù)的功能一樣,但是效率差不多是快10倍以上。

set.seed(123)
###單細胞轉錄組數(shù)據準備
sc<-readRDS('seurat.celltype.rds')#一般為鑒定好細胞類型的seurat對象,并且sc@meta.data矩陣中含有列名為cell_annotation列
Idents(sc)<-gsub(' |/|-','_',sc@meta.data[as.vector(names(Idents(sc))),'cell_annotation'])
sc<-subset(sc,idents=as.vector(setdiff(as.vector(unique(Idents(sc))),c('none')))) ####刪掉未知細胞類型
cluster_markers_all<-RunPrestoAll(sc,only.pos = TRUE,slot = "data",verbose = TRUE)
###空間轉錄組數(shù)據的準備
rds_file='spatial.rds'
spatial <- readRDS(rds_file)
DefaultAssay(spatial) <- "RNA"

03 空間轉錄組的解卷積

解卷積函數(shù)參數(shù)較多,這里必選參數(shù)為se_sc 、counts_spatial、clust_vr、cluster_markers,主要為輸入的Seurat對象、空間轉錄組原始表達矩陣counts、細胞類型注釋信息列名、marker基因。其他參數(shù)可以根據需要進行調整,一般不需要調整。

###解卷積分析
spotlight_ls <- spotlight_deconvolution(
  se_sc = sc,
  counts_spatial = spatial@assays$RNA@counts,
  clust_vr = "cell_annotation", # Variable in sc_seu containing the cell-type annotation
  cluster_markers = cluster_markers_all, # Dataframe with the marker genes
  cl_n = 100, # number of cells per cell type to use
  hvg = 3000, # Number of HVG to use
  ntop = NULL, # How many of the marker genes to use (by default all)
  transf = "uv", # Perform unit-variance scaling per cell and spot prior to factorzation and NLS
  method = "nsNMF", # Factorization method
  min_cont = 0 # Remove those cells contributing to a spot below a certain threshold 
  )
###一般2500多個spots差不多不到10min左右

04 結果展示和說明

prefix='TEST'
nmf_mod <- spotlight_ls[[1]]
decon_mtrx <- spotlight_ls[[2]]
#topic結果展示 Next we can take a look at the how the individual topic profiles of each cell within each cell-type behave.Here we expect that all the cells from the same cell type show a similar topic profile distribution, if not there might be a bit more substructure in that cluster and we may only be capturing one or the other.
h <- NMF::coef(nmf_mod[[1]])
rownames(h) <- paste("Topic", 1:nrow(h), sep = "_")
topic_profile_plts <- SPOTlight::dot_plot_profiles_fun(
  h = h,
  train_cell_clust = nmf_mod[[2]])
pdf(paste(prefix,'topic.celltype.pdf',sep='_'),w=10,h=7)
p<-topic_profile_plts[[2]] + ggplot2::theme(
  axis.text.x = ggplot2::element_text(angle = 90), 
  axis.text = ggplot2::element_text(size = 12))
print(p)
dev.off()
pdf(paste(prefix,'topic.celltype.every.pdf',sep='_'),w=45,h=12)
p<-topic_profile_plts[[1]] + theme(axis.text.x = element_text(angle = 90),axis.text = element_text(size = 12))
print(p)
dev.off()

這里主要是退topic結果進行展示:



其實這里的topic相當于通過NMF進行聚類,將相似的細胞聚類在一起,一個topic相當于一個聚類,上圖展示了每個Topic對象的細胞類型,如果細胞類型與topic能夠一一對象,這樣的結果就最好不過,如果不對應,可能細胞分的不夠細。

上圖展示了每個topic對應細胞類型,一般理想情況下,一個topic對應一種細胞類型,當然也不是完全對應,可能有部分細胞處于其他topic。上圖展示了B細胞類型在不同topic中的分布情況,從結果可以看出,大部分細胞屬于B細胞。

下面對每個topic的基因進行展示webshot包,而且這里為便于基因篩選,這里輸出了動態(tài)網頁表格,這里需要具體結果過程如下:

library("webshot")#webshot::install_phantomjs() devtools::install_github("wch/webshot")
basis_spotlight <- data.frame(NMF::basis(nmf_mod[[1]]))
colnames(basis_spotlight) <- unique(stringr::str_wrap(nmf_mod[[2]], width = 30))
dtable<-basis_spotlight %>%
  dplyr::arrange(desc(Macrophage)) %>%
  round(., 5) %>% 
  DT::datatable(., filter = "top",caption = paste('Table 1: The most important genes for each topic .',prefix,sep=' ')) 

html <- paste(prefix,'dtable.html',sep='_')
saveWidget(dtable, html)

上述結果輸出了html文件,可以打個html文件,然后對表觀進行篩選,具體的結果如下圖所示:

上述動態(tài)表格是可以篩選,或者排序,這里值的大小沒有實際的意義,值越大代表對細胞類型的貢獻度越大。

# This is the equivalent to setting min_cont to 0.04
decon_mtrx_sub <- decon_mtrx[, colnames(decon_mtrx) != "res_ss"]
decon_mtrx_sub[decon_mtrx_sub < 0.08] <- 0
decon_mtrx <- cbind(decon_mtrx_sub, "res_ss" = decon_mtrx[, "res_ss"])
rownames(decon_mtrx) <- colnames(anterior)

decon_df <- decon_mtrx %>%
  data.frame() %>%
  tibble::rownames_to_column("barcodes")

anterior@meta.data <- anterior@meta.data %>%
  tibble::rownames_to_column("barcodes") %>%
  dplyr::left_join(decon_df, by = "barcodes") %>%
  tibble::column_to_rownames("barcodes")
cell_types_all <- colnames(decon_mtrx)[which(colnames(decon_mtrx) != "res_ss")]

SPOTlight::spatial_scatterpie(se_obj = anterior,
                              cell_types_all = cell_types_all,
                              img_path = "sample_data/spatial/tissue_lowres_image.png",
                              pie_scale = 0.4)

上圖展示了解卷積的每個spots中細胞類型比例的餅圖(每個餅代表一個spots,餅圖中不同顏色代表不同的細胞類型),可以通過上圖看出,大部分的spots并不是一種細胞類型,是由多種細胞類型混合而成,因此解卷積的方法進行空間轉錄組的方法是是否合適。當然也可以展示單獨某個細胞類型的結果,如下圖所示:

SPOTlight::spatial_scatterpie(se_obj = anterior,
                              cell_types_all = cell_types_all,
                              img_path = "sample_data/spatial/tissue_lowres_image.png",
                              cell_types_interest = "L6b",
                              pie_scale = 0.8)


上圖展示了含有L6b細胞類型的結果,也就是說只要spots中含有L6b細胞類型,其結果都將在上圖進行展示。

總結

單細胞轉錄組與空間轉錄組學的整合可以產生組織中細胞亞群的高分辨率圖譜??臻g轉錄組的技術正在迅速發(fā)展,但沒有一種單一的空間轉錄組學技術適合所有應用。根據所提出的生物學問題,可以設計實驗方法以將任何空間轉錄組學方法與單細胞轉錄組相結合。除了開發(fā)增強方法之外,仔細選擇用于整合此類數(shù)據的算法也至關重要,因為尚不存在能夠以單細胞分辨率、單細胞轉錄組深度和全轉錄組覆蓋空間解析組織的空間轉錄組學方法。這種綜合方法開始在空間上繪制發(fā)育和疾病中的特定細胞亞群,并闡明這些細胞群協(xié)同塑造組織表型的機制。

這里介紹了兩種解卷積的方法進行單細胞轉錄組和空間轉錄組整合分析,當然,能夠用于解卷積的方法還有多種方法比如SpatialDWLS、stereoscope等等,以后可能也有更多的方法,不同的方法有不同的優(yōu)缺點,比如這里的RCTD方法有點在于可以很好的跨平臺和細胞亞群定位等等,老師可以根據自己的研究需求,挑選合適的方法。就個人而言,比較喜歡SPOTlight的展示方法,該結果展示,能夠直接的展示每個spots中不同類型的細胞比例情況,結果較為清晰明確。比如下圖所示,圖A展示了單細胞的細胞類型,圖B展示了空間轉錄組中每個spots中不同細胞類型的比例,該圖就較為明顯的看出主要細胞類型分布,當然RCTD結果也可以用此方法進行展示,不過需要對腳本或者可視化函數(shù)進行較大的修改。



針對不同的方法,在SpatialDWLS中進行了比較,下次再對此文獻進行解讀,老師可以自己去看一下SpatialDWLS的文獻,通過不同的方法比較,發(fā)現(xiàn)RCTD和SpatialDWLS方法都不錯。具體結果如下:


圖A為SpatialDWLS整體流程,圖B/C/D為不同方法的比較,從結果來說,SpatialDWLS、RCTD、SPOTlight結果準確性不錯,SPOTlight可能運行效率低一些,其他的相差不大。

展望

隨著空間轉錄組和單細胞的轉錄組的技術發(fā)展,今后二者將會越來越普及,將成為科研界常用的工具。比如單細胞轉錄組技術,在前幾年,我們還想著10x的單細胞平臺有多方便和便宜,隨著這幾年的技術發(fā)展,特別是今年的海量單細胞技術的推出,一次性使用可以同時檢測70多萬的細胞,這將大大改變科研的方式,使得今后的單細胞圖譜更為精確,單細胞研究越來越準確。

空間轉錄組也是同樣的,現(xiàn)在價格偏貴,這會大大的限制其應用,而且空間轉錄組具體能夠給我們帶來什么樣的結果?這些結果對解決生物學問題具體有什么樣的幫助?這都需要我們考慮的問題,就目前而言,空間轉錄組提供了一個空間信息,因此應用較大的可能是空間的細胞通訊和發(fā)育軌跡,這是純分析角度來說,具體其他研究問題,可能會帶來更精確的結果。

目前空間轉錄組還存在較多的問題,將來可能隨著技術的發(fā)展,目前存在的問題都會一一的解決。比如目前空間轉錄組的spots是混合細胞,遠遠達不到單細胞水平,這是將在較長一個時間內沒法達到的水平,因此這會一定角度的限制了空間轉錄組的結果的準確性,這也是為什么目前需要將空間轉錄組與單細胞轉錄組結合分析的緣故,雖然可能有部分技術能到亞細胞級別,但技術不成熟,屬于實驗室中技術,沒法進行推廣;另外,目前10xVisum空間轉錄組的玻片較小,6.5x6.5mm,如果切片較大的樣品,將遠遠不能覆蓋完整的組織樣品,不過最近華大基因推出的空間轉錄組的玻片到cm級別,這也是其優(yōu)勢之一;此外空間轉錄的算法和工具并不成熟,目前雖然有很多的空間轉錄組的工具,但是目前的工具都還處于初始階段,沒有一個完全成熟的工具;再者空間轉錄組目前的成本偏貴,這是一個較為重要的限制因素。

總而言之,空間轉錄組技術目前存在一定的局限,但是隨著技術的發(fā)展,其分辨率、算法工具、成本將都會有較大的提升,空間轉錄組技術將會給科研界帶來新的視角,為人類的臨床、藥物開發(fā)、伴隨診斷、生物標志物開發(fā)提供強有力的支持(https://pages.10xgenomics.com/visium-clinical-translation-network.html)。

參考文獻:

[1] Longo S K , Guo M G , Ji A L , et al. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics[J]. Nature Reviews Genetics.
[2] V Marx. Method of the Year: spatially resolved transcriptomics[J]. Nature Methods, 2021, 18(1):9-14.
[3] Asp M , Bergenstrhle J , Lundeberg J . Spatially Resolved Transcriptomes—Next Generation Tools for Tissue Exploration[J]. BioEssays, 2020, 42(10).
[4] Cable D M , Murray E , Zou L S , et al. Robust decomposition of cell type mixtures in spatial transcriptomics[J]. Nature Biotechnology, 2021:1-10.
[5] Dong R , Yuan G C . SpatialDWLS: accurate deconvolution of spatial transcriptomic data[J]. Genome Biology, 2021.

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容