單細(xì)胞分析的主要問題存在較明顯的批次效應(yīng),影響聚類效果,深度學(xué)習(xí)方法,逐漸可以應(yīng)用到單細(xì)胞分析領(lǐng)域。
單細(xì)胞RNA測序(scRNA-seq)可以通過無監(jiān)督的聚類來表征細(xì)胞類型和狀態(tài),但是不斷增加的細(xì)胞數(shù)量和批次效應(yīng)給計(jì)算帶來了挑戰(zhàn)。我們提出了DESC,這是一種無監(jiān)督的深度嵌入算法,通過迭代優(yōu)化聚類目標(biāo)函數(shù)來對scRNA-seq數(shù)據(jù)進(jìn)行聚類。通過迭代的自我學(xué)習(xí),DESC會逐漸消除批次效應(yīng),只要批次之間的技術(shù)差異小于真實(shí)的生物學(xué)差異即可。作為一種軟聚類算法,DESC的聚類分配概率在生物學(xué)上可以解釋,并且可以揭示細(xì)胞的離散和偽時態(tài)結(jié)構(gòu)。全面的評估表明,DESC可以在群集精度和穩(wěn)定性之間取得適當(dāng)?shù)钠胶?,并且占用的?nèi)存很小,不需要顯式要求批處理信息即可去除批處理效果,并且可以在可用時利用GPU。隨著單細(xì)胞研究規(guī)模的不斷擴(kuò)大,我們相信DESC將為生物醫(yī)學(xué)研究人員提供一個有價值的工具,以消除復(fù)雜的細(xì)胞異質(zhì)性。

文獻(xiàn)來源:https://www.nature.com/articles/s41467-020-15851-3