36計(jì)名稱(chēng)與內(nèi)容無(wú)關(guān),僅為統(tǒng)計(jì)順序。
1、第一計(jì) 瞞天過(guò)海
防備周全時(shí),更容易麻痹大意;習(xí)以為常的事,也常會(huì)失去警戒。秘密常潛藏在公開(kāi)的事物里,并非存在于公開(kāi)暴露的事物之外。公開(kāi)暴露的事物發(fā)展到極端,就形成了最隱秘的潛藏狀態(tài)。
我的細(xì)胞到底分多少個(gè)群是合適的?
這是一個(gè)廣泛而經(jīng)典問(wèn)題。就單細(xì)胞技術(shù)而言,我們常說(shuō)每個(gè)細(xì)胞都是不同的,也就是說(shuō)你總可以分到最細(xì)以單細(xì)胞為單位,但是這樣就失去高通量的意義了。在低通量下,我們可以著眼于單個(gè)細(xì)胞,現(xiàn)在成千上萬(wàn)的細(xì)胞,一個(gè)一個(gè)看是不切實(shí)際的。那么,我的細(xì)胞到底分多少個(gè)群是合適的?
這個(gè)問(wèn)題表現(xiàn)在Seurat中就是:Finding optimal cluster resolution in Seurat 3? 我們知道,不同的resolution參數(shù)會(huì)帶來(lái)不同的分群結(jié)果。先看一下github上面的回答:
While Seurat doesn't have tools for comparing cluster resolutions, there is a tool called clustree designed for this task and works on
Seuratv3 objects natively. It's available on CRAN and can be installed with a simpleinstall.packages('clustree')
clustree我們之前講過(guò),可以全局地查看不同分群結(jié)果:
#先執(zhí)行不同resolution 下的分群
library(Seurat)
pbmc_small <- FindClusters(
object = pbmc_small,
resolution = c(seq(.4,1.6,.2))
)
clustree(pbmc_small@meta.data, prefix = "RNA_snn_res.")

在clustree的圖中我們看到不同resolution的取值情況下分群的關(guān)系。既然我們最終是以群為單位來(lái)分析的,我們肯定是希望每個(gè)群是比較純的。如圖可以看到在倒數(shù)第二層級(jí)有個(gè)亞群來(lái)自不同的分群,這有可能是:
- 分群過(guò)度,把原來(lái)分群的中應(yīng)有的異質(zhì)性也提煉出來(lái)單獨(dú)作為一群了
- 上一層級(jí)分群不足,還包含了不該有的異質(zhì)性。
這里就帶來(lái)靈魂拷問(wèn)了,就拿B細(xì)胞來(lái)說(shuō)吧,它本身也是有異質(zhì)性的啊,那么他的異質(zhì)性是如何的呢?我們知道,某一類(lèi)細(xì)胞內(nèi)的異質(zhì)性一般是要小于細(xì)胞群之間的異質(zhì)性的。所以,拿到這個(gè)圖我們就可以根據(jù)自己帶著生物學(xué)意義的期望來(lái)做一個(gè)判斷了。
其實(shí),我們也知道分群終究是非監(jiān)督的,只是數(shù)據(jù)驅(qū)動(dòng)的,并不摻雜著數(shù)據(jù)(表達(dá)譜)以外的生物學(xué)意義。如果拋開(kāi)這些生物學(xué)意義,其實(shí)是有一些辦法來(lái)評(píng)價(jià)分群結(jié)果的:

這些方法也是在做群內(nèi)和群之間的比較,得出類(lèi)似群純度的度量單位來(lái)評(píng)價(jià)分群結(jié)果。在不久前張澤民老師團(tuán)隊(duì)的一篇文章中提到過(guò)一種方法:ROGUE: an entropy-based universal metric for assessing the purity of single cell population。

該方法已被封裝為一個(gè)R包: https://github.com/PaulingLiu/ROGUE
我們看到已經(jīng)有不少的方法來(lái)做分群的評(píng)估了,還有:IKAP—Identifying K mAjor cell Population groups in single-cell RNA-sequencing analysis :

以上這些方法大同小異,核心的問(wèn)題是,或者研究者真正關(guān)心的是:
哪種分群結(jié)果的生物解釋性高?
正所謂:分析總會(huì)有結(jié)果,看你敢用不敢用。