單細(xì)胞36計(jì)之1瞞天過(guò)海---糾結(jié)的細(xì)胞分群

36計(jì)名稱(chēng)與內(nèi)容無(wú)關(guān),僅為統(tǒng)計(jì)順序。

1、第一計(jì) 瞞天過(guò)海
防備周全時(shí),更容易麻痹大意;習(xí)以為常的事,也常會(huì)失去警戒。秘密常潛藏在公開(kāi)的事物里,并非存在于公開(kāi)暴露的事物之外。公開(kāi)暴露的事物發(fā)展到極端,就形成了最隱秘的潛藏狀態(tài)。

我的細(xì)胞到底分多少個(gè)群是合適的?

這是一個(gè)廣泛而經(jīng)典問(wèn)題。就單細(xì)胞技術(shù)而言,我們常說(shuō)每個(gè)細(xì)胞都是不同的,也就是說(shuō)你總可以分到最細(xì)以單細(xì)胞為單位,但是這樣就失去高通量的意義了。在低通量下,我們可以著眼于單個(gè)細(xì)胞,現(xiàn)在成千上萬(wàn)的細(xì)胞,一個(gè)一個(gè)看是不切實(shí)際的。那么,我的細(xì)胞到底分多少個(gè)群是合適的?

這個(gè)問(wèn)題表現(xiàn)在Seurat中就是:Finding optimal cluster resolution in Seurat 3? 我們知道,不同的resolution參數(shù)會(huì)帶來(lái)不同的分群結(jié)果。先看一下github上面的回答:

While Seurat doesn't have tools for comparing cluster resolutions, there is a tool called clustree designed for this task and works on Seurat v3 objects natively. It's available on CRAN and can be installed with a simple install.packages('clustree')

clustree我們之前講過(guò),可以全局地查看不同分群結(jié)果:

#先執(zhí)行不同resolution 下的分群
library(Seurat)
pbmc_small <- FindClusters(
  object = pbmc_small,
  resolution = c(seq(.4,1.6,.2))
)
clustree(pbmc_small@meta.data, prefix = "RNA_snn_res.")

image

在clustree的圖中我們看到不同resolution的取值情況下分群的關(guān)系。既然我們最終是以群為單位來(lái)分析的,我們肯定是希望每個(gè)群是比較的。如圖可以看到在倒數(shù)第二層級(jí)有個(gè)亞群來(lái)自不同的分群,這有可能是:

  • 分群過(guò)度,把原來(lái)分群的中應(yīng)有的異質(zhì)性也提煉出來(lái)單獨(dú)作為一群了
  • 上一層級(jí)分群不足,還包含了不該有的異質(zhì)性。

這里就帶來(lái)靈魂拷問(wèn)了,就拿B細(xì)胞來(lái)說(shuō)吧,它本身也是有異質(zhì)性的啊,那么他的異質(zhì)性是如何的呢?我們知道,某一類(lèi)細(xì)胞內(nèi)的異質(zhì)性一般是要小于細(xì)胞群之間的異質(zhì)性的。所以,拿到這個(gè)圖我們就可以根據(jù)自己帶著生物學(xué)意義的期望來(lái)做一個(gè)判斷了。

其實(shí),我們也知道分群終究是非監(jiān)督的,只是數(shù)據(jù)驅(qū)動(dòng)的,并不摻雜著數(shù)據(jù)(表達(dá)譜)以外的生物學(xué)意義。如果拋開(kāi)這些生物學(xué)意義,其實(shí)是有一些辦法來(lái)評(píng)價(jià)分群結(jié)果的:

image

這些方法也是在做群內(nèi)和群之間的比較,得出類(lèi)似群純度的度量單位來(lái)評(píng)價(jià)分群結(jié)果。在不久前張澤民老師團(tuán)隊(duì)的一篇文章中提到過(guò)一種方法:ROGUE: an entropy-based universal metric for assessing the purity of single cell population。

image

該方法已被封裝為一個(gè)R包: https://github.com/PaulingLiu/ROGUE

我們看到已經(jīng)有不少的方法來(lái)做分群的評(píng)估了,還有:IKAP—Identifying K mAjor cell Population groups in single-cell RNA-sequencing analysis :

image

以上這些方法大同小異,核心的問(wèn)題是,或者研究者真正關(guān)心的是:

哪種分群結(jié)果的生物解釋性高?

正所謂:分析總會(huì)有結(jié)果,看你敢用不敢用。

原文:Seurat Weekly NO.1 || 到底分多少個(gè)群是合適的?!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容