hello,又是一周,周二了,最近事情很多,所以祝大家生活快樂,我們來繼續(xù)看一下10X單細胞空間聯(lián)合分析的內(nèi)容,參考文獻在Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution,于2022年5月16日在線發(fā)表于國際知名學術(shù)期刊Nature Methods,文中系統(tǒng)性評估了16種空間轉(zhuǎn)錄組和單細胞轉(zhuǎn)錄組數(shù)據(jù)整合算法在預測基因或細胞類型空間分布方面的性能。
大家也可以參考我之前的一篇文章10X單細胞空間聯(lián)合分析方法匯總及算法總結(jié)

細胞在組織器官內(nèi)所處的空間位置對于它發(fā)揮特異性功能至關(guān)重要。近年來,研究者開發(fā)了多種空間轉(zhuǎn)錄組技術(shù)可以在保留細胞精確空間定位的同時,檢測細胞內(nèi)全轉(zhuǎn)錄組的表達,以此來研究在發(fā)育或疾病發(fā)生發(fā)展過程中起關(guān)鍵性作用的細胞亞群及其分子機制。然而,現(xiàn)有的空間轉(zhuǎn)錄組學技術(shù)存在兩個不足:1.基于測序的空間轉(zhuǎn)錄組技術(shù)無法實現(xiàn)真正意義上的單細胞分辨率;2.基于成像空間轉(zhuǎn)錄組的技術(shù)能檢測到的基因通量有限。為了突破技術(shù)的局限性,生物信息學家設(shè)計了多種算法整合空間轉(zhuǎn)錄組與單細胞轉(zhuǎn)錄組數(shù)據(jù),預測細胞類型的空間分布和/或單個細胞的完整轉(zhuǎn)錄組信息。這些算法大大加深了我們對空間轉(zhuǎn)錄組學數(shù)據(jù)及相關(guān)生物學和病理過程的理解。然而,由于不同算法的工作原理和適用范圍存在顯著差異,使得研究者很難選擇最佳算法用來預測細胞類型和基因表達的空間分布。
瞿昆教授課題組長期致力于開發(fā)生物大數(shù)據(jù)分析算法和軟件。在此項研究中,課題組收集了45對同一組織來源的空間轉(zhuǎn)錄組與單細胞轉(zhuǎn)錄組數(shù)據(jù)集,和32個模擬數(shù)據(jù)集,并設(shè)計了多種指標,從準確性、魯棒性、計算資源耗時等多維度系統(tǒng)性評估了16種整合算法的性能。

結(jié)果顯示,Cell2location、SpatialDWLS和RCTD算法能更加準確的預測細胞類型的空間分布;Tangram、gimVI和SpaGE算法是預測基因表達空間分布的最佳算法。Tangram、Seurat和LIGER計算效率相對較高,適合處理大規(guī)模數(shù)據(jù)集。該研究工作總結(jié)了每種算法的屬性、性能和適用性,總結(jié)了高效算法的優(yōu)勢,為研究人員進一步提升算法性能提供了參考;并在github上提供了整合空間轉(zhuǎn)錄組和單細胞轉(zhuǎn)錄組數(shù)據(jù)的分析流程,以幫助研究人員為處理自己的數(shù)據(jù)選擇最佳的分析工具。
單細胞空間聯(lián)合的方法(這些整合方法使研究人員能夠預測未檢測到的轉(zhuǎn)錄本的空間分布)
| 聯(lián)合方法 | 特點 |
|---|---|
| gimVI | employs a deep generative model to infer the likely spatial distribution of undetected transcripts |
| SpaGE | uses the domain adaptation algorithm PRECISE and k-nearest-neighbor regression to predict the spatial distribution of undetected transcripts |
| Tangram | uses non-convex optimization and a deep learning framework to learn a spatial alignment for scRNA-seq data |
| Seurat | applies canonical correlation analysis to embed spatial and scRNA-seq data into a common latent space, and projects cells from scRNA-seq data to the spots of the spatial transcriptomics data |
| LIGER | uses both integrative non-negative matrix factorization and shared factor neighborhood graphs to predict gene expression levels in space |
| novoSpaRc and SpaOTsc | use optimal transport methods to construct spatial metrics of cells on the basis of scRNA-seq data |
| stPlus | ombines the auto-encoder and weighted k-nearest-neighbor methods to predict spatial gene expression |
此外,Seurat、Tangram、novoSpaRc 和 SpaOTsc 能夠?qū)?scRNA-seq 數(shù)據(jù)中的細胞分配到組織切片中的空間位置;這對于提高使用空間轉(zhuǎn)錄組學方法(如 ST 或 10X Visium)生成的空間轉(zhuǎn)錄組學數(shù)據(jù)的分辨率非常有用。
| 聯(lián)合方法 | 特點 |
|---|---|
| Cell2location | uses the gene expression signature of the cell subpopulations in scRNA-seq data to estimate the abundance of each cell type at each spot |
| RCTD | applies cell type profiles learned from scRNA-seq data and supervised learning to decompose cell type mixtures |
| SpatialDWLS | adopts the weighted-least-squares approach to infer cell type composition |
| Stereoscope | leverages the model-based probabilistic method and scRNA-seq data to deconvolve the cell mixtures in spatial data |
| SPOTlight | applies the seeded non-negative matrix factorization for the deconvolution of spots |
| DSTG | deconvolutes spatial transcriptomics data using graph-based convolutional networks |
| STRIDE | uses the topic profiles trained from scRNA-seq data to decompose cell types from spatial mixtures |
| DestVI | adopts the variational inference and latent variable models to delineate cell type proportions |
這些整合方法使研究人員能夠預測組織切片中spot的細胞類型組成
這些整合方法的出現(xiàn)無疑加深了對空間轉(zhuǎn)錄組學數(shù)據(jù)及相關(guān)生物學和病理過程的理解。然而,沒有獨立研究全面比較這些整合方法在預測轉(zhuǎn)錄物空間分布或組織切片中斑點的細胞類型去卷積方面的性能。在這里,使用多個指標系統(tǒng)地對 16 種集成方法的性能進行基準測試,這些方法可以預測未檢測到的轉(zhuǎn)錄物的空間分布,或組織切片中斑點的細胞類型組成,基于對包含空間轉(zhuǎn)錄組學數(shù)據(jù)的 45 個配對數(shù)據(jù)集的處理和 scRNA-seq 數(shù)據(jù)和 32 個模擬數(shù)據(jù)集。評估了每種整合方法在預測轉(zhuǎn)錄本空間分布方面的準確性,包括從原始數(shù)據(jù)集中下采樣的稀疏空間轉(zhuǎn)錄組學數(shù)據(jù)。還根據(jù)數(shù)據(jù)集的模擬評估了組織切片中斑點的細胞類型去卷積的整合方法的準確性,其中每個斑點可以包含多個不同類型的細胞。最后,評估了每種集成方法消耗的計算資源。研究結(jié)果可以幫助研究人員為他們的數(shù)據(jù)集選擇合適的集成方法,并且他們提出了一些有趣的問題,即各種處理和數(shù)據(jù)集特定屬性如何影響這些工具在空間轉(zhuǎn)錄組學研究中的集成性能。

生活很好,有你更好