Yu Z, Lu Y, Wang Y, et al. ZINB-based Graph Embedding Autoencoder for Single-cell RNA-seq Interpretations. AAAI 2022.
摘要導(dǎo)讀
單細(xì)胞RNA測序(scRNA-seq)提供了在單細(xì)胞分辨率下的全基因組基因表達(dá)水平的高通量信息,實(shí)現(xiàn)了對單個(gè)細(xì)胞的轉(zhuǎn)錄組的精確理解。(單細(xì)胞RNA測序數(shù)據(jù)的意義)不幸的是,快速增長的scRNA-seq數(shù)據(jù)和損失事件的頻繁發(fā)生給細(xì)胞類型標(biāo)注帶來了重大挑戰(zhàn)。本文提出了一種基于單細(xì)胞模型的深度圖嵌入聚類(scTAG)方法,該方法同時(shí)學(xué)習(xí)細(xì)胞之間的拓?fù)浔硎?,并基于深度GCN識別細(xì)胞類簇。scTAG將零膨脹負(fù)二項(xiàng)(ZINB)模型集成到拓?fù)渥赃m應(yīng)圖卷積自編碼器中,學(xué)習(xí)低維潛在表示,并采用KL散度聚類。scTAG通過同時(shí)優(yōu)化聚類損失、ZINB損失和細(xì)胞圖重建損失,利用拓?fù)浣Y(jié)構(gòu)以端到端的方式聯(lián)合優(yōu)化聚類標(biāo)簽分配和特征學(xué)習(xí)。
https://github.com/Philyzh8/scTAG
Recently, emerging graph neural networks (GNNs) have been demonstrated to naturally capture graph structure information propagated through neighbor information.
Graph embedding clustering often combines deep autoencoder and graph clustering algorithms, which can learn the latent compact representation to explore both the rich content and structural information.
模型淺析

模型的結(jié)構(gòu)順序如下:
- 首先是對數(shù)據(jù)的預(yù)處理
都需要被轉(zhuǎn)化
并且在轉(zhuǎn)化之后只選擇前個(gè)高度相關(guān)變量用于實(shí)驗(yàn)
- 使用基于歐式距離的KNN算法構(gòu)造近鄰樣本之間的關(guān)系信息
- 拓?fù)渥赃m應(yīng)圖卷積自動(dòng)編碼器
其思想是,TAGCN在每一層使用K個(gè)圖的卷積核來提取不同大小的局部特征,這避免了近似卷積核不能完全提取圖信息的缺點(diǎn)。相比于傳統(tǒng)GCN而言,增強(qiáng)了對數(shù)據(jù)的學(xué)習(xí)能力。
考慮到第個(gè)隱層,假設(shè)此時(shí)每個(gè)節(jié)點(diǎn)在進(jìn)行特征映射后都有
特征,即第
個(gè)隱層的輸入數(shù)據(jù)為
,其具體的計(jì)算如下:
【這部分的具體操作可以看原始論文,這里就不再誤導(dǎo)】之后的操作就是對輸出進(jìn)行激活,得到隱含表示矩陣
,并利用解碼器對圖信息(內(nèi)積)進(jìn)行重構(gòu):
- ZINB-based 圖卷積自編碼
本部分的目的在于,應(yīng)用ZINB分布模型模擬數(shù)據(jù)分布來捕獲數(shù)據(jù)的潛在特征,即使用數(shù)據(jù)的分布參數(shù)對輸入數(shù)據(jù)進(jìn)行重構(gòu):具體來說,本文在得到的之后連接了3層全連接層,用來學(xué)習(xí)ZINB模型對應(yīng)的參數(shù)。重構(gòu)損失使用負(fù)對數(shù)似然,
- KL聚類
-
聯(lián)合優(yōu)化
文章行云流水,可以說是SDCN的升級版,主要體現(xiàn)在GCN和AE被換成了TAGCN,直接對GCN的輸出進(jìn)行ZINB參數(shù)學(xué)習(xí)。去掉了AE的重構(gòu)損失,但是加入了TAGCN的圖結(jié)構(gòu)
重構(gòu),和以ZINB參數(shù)的似然估計(jì),也變相對語義
進(jìn)行了約束學(xué)習(xí)。實(shí)驗(yàn)部分也設(shè)置很巧妙,避開了對專業(yè)領(lǐng)域的挖掘,從數(shù)據(jù)的特點(diǎn)出發(fā),把握了模型和數(shù)據(jù)的匹配性。






