DecontX是一種通過去除RNA測序數(shù)據(jù)中非細(xì)胞信號的工具,它適用于單細(xì)胞RNA測序數(shù)據(jù)和高通量RNA測序數(shù)據(jù)。
https://github.com/campbio/celda
DecontX的工作原理是基于兩個假設(shè):(1)在RNA測序數(shù)據(jù)中,非細(xì)胞信號包含了許多外源性RNA(例如病毒、細(xì)菌、寄生蟲等)和內(nèi)源性RNA(例如rRNA、tRNA、miRNA等),這些RNA并不會貢獻(xiàn)到真正的細(xì)胞類型鑒定和表達(dá)定量上;(2)非細(xì)胞RNA的比例在樣本之間存在差異,因此可以利用這種差異來區(qū)分細(xì)胞RNA信號和非細(xì)胞RNA信號。
DecontX先將RNA測序數(shù)據(jù)按照基因進(jìn)行分類,然后利用一系列策略去除外源性RNA和內(nèi)源性RNA。最后,DecontX使用一個模型來估計每個細(xì)胞的非細(xì)胞RNA信號占比,并根據(jù)這個信號占比來對細(xì)胞進(jìn)行過濾和去除。這樣就可以降低樣本中非目標(biāo)細(xì)胞的影響,從而提高細(xì)胞類型鑒定和表達(dá)定量的精度。
DecontX分析做了什么?
- 去除了污染的細(xì)胞,細(xì)胞數(shù)會有減少。
- 矯正了基因表達(dá)量,基因表達(dá)量矩陣有變化,不再是整數(shù)。后續(xù)做monocle有一個bug,monocle的輸入矩陣需要是整數(shù),這里要做一下取整處理。