單細(xì)胞數(shù)據(jù)挖掘(7)-QC之double droplet及細(xì)胞周期判斷(生信技能樹視頻筆記)

本筆記來源于B站@生信技能樹-jimmy;學(xué)習(xí)視頻鏈接: 「生信技能樹」單細(xì)胞數(shù)據(jù)挖掘

  1. Empty and double droplets
load("../../scRNA.Rdata")
library(Seurat)
# 1.1 empty droplet
# BiocManager::install("DropletUtils")
library(DropletUtils)
e.out <- emptyDrops(GetAssayData(scRNA,slot="counts",assay="RNA"))
# Error in testEmptyDrops(m, lower = lower, ...) : 
# no counts available to estimate the ambient profile

## https://support.bioconductor.org/p/123554/#123562
# 如上回答所說,empty droplet往往在第一步就已經(jīng)過濾掉了,而一般上傳到GEO的也都是過濾掉空液滴的。

# 1.2 double droplet
# https://osca.bioconductor.org/doublet-detection.html
# BiocManager::install("scran")
head(scRNA@meta.data)
library(scran)
# GetAssayData(scRNA,slot="counts",assay="RNA")[1:8,1:4]
?doubletCluster #檢查有無double droplet聚在一起的類
db.test <- doubletCluster(GetAssayData(scRNA,slot="counts",assay="RNA"),
                          clusters=scRNA@meta.data$seurat_clusters)
head(db.test)
table(scRNA@meta.data$seurat_clusters)

library(scater)
chosen.doublet <- rownames(db.test)[isOutlier(db.test$N, 
                                              type="lower", log=TRUE)]
chosen.doublet #結(jié)果顯示沒有:character(0)

# 還有其它多種方法

2.周期判斷

# 在挑選hvg gene那一步里,可能會找到一些細(xì)胞周期相關(guān)基因;
# 它們會導(dǎo)致細(xì)胞聚類發(fā)生一定的偏移,即相同類型的細(xì)胞在聚類時(shí)會因?yàn)榧?xì)胞周期的不同而分開。
# 因此有必要查看是否有細(xì)胞周期相關(guān)基因的存在;若有,則剔除

# 細(xì)胞周期有關(guān)基因
?cc.genes
head(c(cc.genes$s.genes,cc.genes$g2m.genes))
length(c(cc.genes$s.genes,cc.genes$g2m.genes))  
# [1] "MCM5" "PCNA" "TYMS" "FEN1" "MCM2" "MCM4"
# 97

# 查看我們選擇的高變基因中有哪些細(xì)胞周期相關(guān)基因,并打分
CaseMatch(c(cc.genes$s.genes,cc.genes$g2m.genes),VariableFeatures(scRNA))
SingleCell7_1.jpeg
# 在scRNA@meta.data中添加S.Score、G2M.Score和Phase三列有關(guān)細(xì)胞周期的信息。
g2m_genes = cc.genes$g2m.genes
g2m_genes = CaseMatch(search = g2m_genes, match = rownames(scRNA))
s_genes = cc.genes$s.genes
s_genes = CaseMatch(search = s_genes, match = rownames(scRNA))
scRNA <- CellCycleScoring(object=scRNA,  g2m.features=g2m_genes,  s.features=s_genes)
head(scRNA@meta.data)  #此時(shí)可以看到,meta.data增加了3列

# 觀察細(xì)胞周期相關(guān)基因是否影響聚類
scRNA <- RunPCA(scRNA, features = c(s_genes, g2m_genes))
p1 <- DimPlot(scRNA, reduction = "pca", group.by = "Phase")
p1
ggsave("../../out/3.2cell-cycle.pdf", plot = p1) 
# 影響不大,基本重合在一起了
SingleCell7_2.jpeg
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容