書(shū)接上回(跟著Cell學(xué)單細(xì)胞轉(zhuǎn)錄組分析(四):單細(xì)胞轉(zhuǎn)錄組測(cè)序UMAP降維聚類(lèi))。完成數(shù)據(jù)降維和細(xì)胞聚類(lèi)后,最主要的環(huán)節(jié)和工作就是確定各個(gè)細(xì)胞群,明確是什么類(lèi)型的細(xì)胞,正群的細(xì)胞定群很關(guān)鍵,涉及到整個(gè)研究,所以這一步寧愿多費(fèi)時(shí)間,也不要出錯(cuò)。當(dāng)然,這也不是一蹴而就的,需要反復(fù)的確認(rèn)。
要確定各個(gè)群是什么細(xì)胞,首先需要了解細(xì)胞群的marker基因,因?yàn)椴煌?lèi)型的細(xì)胞突出 表達(dá)的基因也是不同的。這里使用FindAllMarkers鑒定各個(gè)細(xì)胞群的高表達(dá)基因。
DefaultAssay(scedata) <- "RNA"
all.markers <- FindAllMarkers(scedata,
only.pos = TRUE,
min.pct = 0.25,
logfc.threshold = 0.75)
significant.markers <- all.markers [all.markers $p_val_adj < 0.2, ]
write.csv(significant.markers, file = "significant.markers.csv")#保存
Seurat提供了幾種函數(shù)例如FeaturePlot()、DotPlot()和DoHeatmap(),按照文章中的mrker基因,做一下可視化。
markers <- c("ACKR1","RAMP2","SELE","VWF","PECAM1",
"LUM","COL3A1","DCN","COL1A1","CFD",
"KRT14","KRT5","S100A2","CSTA","SPRR1B",
"CD69","CD52","CXCR4","PTPRC","HCST")
DotPlot(scedata,features = markers)+coord_flip()
點(diǎn)圖:
UMAP圖:
FeaturePlot(scedata,features = c("ACKR1","LUM","KRT14","CD69"))
熱圖:
alldata <- ScaleData(scedata,
features = markers,
assay = "RNA")
DoHeatmap(alldata,
features = markers,
group.by = "seurat_clusters",
assay = "RNA")
很顯然,這些都是默認(rèn)出圖,距離發(fā)文章還是有一定距離的,后期我們會(huì)專(zhuān)門(mén)講解個(gè)性化的修飾,爭(zhēng)取可視化更好。
接下來(lái)就是細(xì)胞定群了,對(duì)各個(gè)細(xì)胞群命名。細(xì)胞定群有很多方法,目前也有很多工具,但是依照小編的經(jīng)驗(yàn),自動(dòng)定群等一般結(jié)果不是完全正確,況且操作復(fù)雜,為了保證正確性,最使用的辦法還是查詢(xún)文獻(xiàn)定群。定群后,對(duì)細(xì)胞群重命名。
scedata <- subset(scedata, idents = c("21"), invert = TRUE)#去掉低質(zhì)量細(xì)胞群
new.cluster.ids <- c("0"="Fibroblast",
"1"="Endothelial",
"2"="Endothelial",
"3"="Endothelial",
"4"="Immune",
"5"="Immune",
"6"="Endothelial",
"7"="Fibroblast",
"8"="Other",
"9"="Immune",
"10"="Epithelial",
"11"="Endothelial",
"12"="Fibroblast",
"13"="Immune",
"14"="Other",
"15"="Immune",
"16"="Fibroblast",
"17"="Endothelial",
"18"="Fibroblast",
"19"="Epithelial",
"20"="Endothelial",
"22"="Immune",
"23"="Immune",
"24"="Immune",
"25"="Epithelial",
"26"="Immune",
"27"="Immune",
"28"="Immune",
"29"="Other")
scedata <- RenameIdents(scedata, new.cluster.ids)
scedata$celltype <- scedata@active.ident
DimPlot(scedata, group.by = "celltype")
save(scedata, file = "scedata.RData")
最后將命名的文件保存,可視化細(xì)胞群!在進(jìn)行下一步工作之前,之后的內(nèi)容將會(huì)是對(duì)目前這些圖形結(jié)果的修飾和個(gè)性化可視化!