前言
Immugent最近讀到了一篇有關細胞通訊分析的新算法文章:Comparative analysis of cell-cell communication at single-cell resolution,發(fā)表在大名鼎鼎的NBT雜志上。文章開發(fā)了一種細胞通訊分析的新算法--Scriabin,并且在算法介紹部分明確表示,以往細胞通訊算法都不是真正意義上的單個細胞水平的分析,而是基于一類細胞或者一群細胞來展開。這么一說,然后細細想來,確實是這么一回事。
細胞通訊分析是單細胞數(shù)據中常用的分析手段,目前已經開發(fā)出了一系列算法:Cellchat,CellPhoneDB以及NicheNet等。它們均是從不同角度,或者不同數(shù)據庫中提取出的受體/配體信息進行細胞通訊分析。今天介紹的這款新型細胞通訊分析軟件Scriabin,真正的是對每一個細胞進行通訊分析。雖然這種改進聽著是非常好,但是萬事萬物都有其兩面性,這樣也意味著要分析更多的樣本,從而對計算資源提出了更高要求。不過硬件上的限制終究都可以得到解決,而在更精細的水平上進行分析會讓我們更加接近科學問題的本質。因此,Scriabin在細胞通訊分析這塊的改進是具有跨時代意義的。
在本期推文中,Immugent將會通過原文對Scriabin的功能框架進行大致介紹,后面會根據需要專門更新一期代碼實操的推文。
主要內容
為了開發(fā)出一種用于從scRNA-seq數(shù)據中進行全面分析細胞通訊信號(cell–cell communication,CCC)的工具,Scriabin根據數(shù)據集大小和分析目標實現(xiàn)了三個獨立的工作模式:(1)細胞-細胞交互矩陣(CCIM)工作流,最適合較小的數(shù)據集,分析數(shù)據集中每個細胞-細胞對的通信;(2)為大規(guī)模對比分析而設計的總結交互圖工作流程,識別了樣本之間具有不同通訊的細胞-細胞對;(3)適用于發(fā)現(xiàn)任何數(shù)據集大小的交互式工作流程,查找共表達配體-受體對的模塊。在Scriabin的分析流程中,CCC的基本單位被看作是一個表達配體的發(fā)送細胞Ni,這些配體被它們的同源受體接收,這些受體由接收細胞Nj表達。

文章第一幅圖是Scriabin的搭建流程圖,我們可以看出Scriabin通過計算數(shù)據集中每對細胞對每個配體-受體對的表達取幾何平均值,進而在CCIM中的M是將這些信息進行編碼后的結果。Scriabin目前支持使用15種不同的蛋白質-蛋白質相互作用數(shù)據庫來定義潛在的配體-受體相互作用,默認使用OmniPath數(shù)據庫,因為該數(shù)據庫包含對每種潛在相互作用的基因類別、機制和文獻支持的強大注釋。由于配體-受體相互作用是定向的,Scriabin將每個細胞分別視為“發(fā)送者”(配體表達)和“接收者”(受體表達),從而保持了CCC網絡的定向性質。其中M可以類似于基因表達矩陣,用于降維、聚類和差異分析。

話都這樣說了,實際應用的效果如何呢?隨后,作者就通過不同的單細胞數(shù)據對Scriabin的性能進行了測試。首先,作者使用了一項來自鱗狀細胞癌的單細胞測序數(shù)據,作者發(fā)現(xiàn)腫瘤內T細胞和正常皮膚中的T細胞之間存在高度的全轉錄組表型重疊性。隨后經過進一步分析,作者發(fā)現(xiàn)與未耗竭的T細胞相比,耗竭的T細胞主要通過耗竭相關標記物CTLA4和TIGIT,并且主要與CD1C+ DC進行細胞通訊;它們丟失了涉及促炎趨化因子(如CCL4和CCL5)的通信途徑,這說明了傳統(tǒng)的細胞通訊分析算法可能忽略了細胞通訊的異質性。

接下來,作者嘗試使用Scriabin的交互程序去發(fā)現(xiàn)新的細胞通訊網絡。為了說明這一過程的可擴展性,作者選擇分析發(fā)育中的胎兒腸的大型單細胞圖譜,該圖譜是由來自四個解剖位置的76,592個細胞組成。Scriabin在所有解剖位置發(fā)現(xiàn)了75個顯著相關的相互作用程序。隨后對這些相互作用程序中配體和受體表達的所有單細胞進行評分,揭示了許多程序的強細胞類型特異性表達模式以及發(fā)送者或受體潛能的細胞內微妙的類型差異,突出了維持單細胞分辨率的重要性。
對于常規(guī)的多組間功能分析是比較簡單的,因為沒有時間的連續(xù)性,而在有些情況下需要對多個連續(xù)事件進行分析才能找出規(guī)律。如人體感染新冠病毒后在不同時間點的免疫反應,而Scriabin可以將多個連續(xù)時間點拼接在一起,從而識別出在時間和機制上處于下游的細胞通訊網絡。

為了說明新冠感染人體的這一過程,作者分析了已發(fā)表的奇觀呼吸道(ALI)中,人支氣管上皮細胞(HBECs)在感染嚴重急性呼吸綜合征冠狀病毒2 (SARS-CoV-2)的數(shù)據集,該數(shù)據集每三天采一次樣品,覆蓋了整個感染過程。此外,該數(shù)據集包含人類氣道的所有典型上皮細胞類型,并表明纖毛細胞和俱樂部細胞是該模型系統(tǒng)中優(yōu)先感染的細胞類型,一些細胞具有超過50%的來自SARS-CoV-2的獨特分子標識符(UMIs)。
總之,作者首先定義了隨時間變化的基因的每個細胞基因標記,并使用該基因標記來預測預期會導致觀察到的細胞基因標記的活性配體。接下來,作者使用Scriabin的高分辨率分組工作流程來對齊來自三個感染后時間點的數(shù)據集,然后作者使用這些數(shù)據集來組裝縱向通信網絡。最后,Scribain的分析結果闡明了細胞間縱向信號通路的獨特能力,暗示未感染的旁觀者細胞的活性可能是下游感染反應的重要介質。這可能反映了其他病毒感染的過程,其中非生產性感染細胞可能是下游炎癥活動的關鍵驅動因素。
展望
總的來說,Scriabin為scRNA-seq數(shù)據中CCC的全面分析提供了一個更強大工具包,這將有助于發(fā)現(xiàn)在不同疾病狀態(tài)下豐富的細胞互作信息,從而揭示每個細胞所處生態(tài)位和其表型之間的關系。但需要注意的是Scriabin的所有下游信號分析都依賴于NicheNet的配體-靶標活性矩陣,這可能會因細胞類型和用于產生它的刺激條件而產生偏差。NicheNet數(shù)據庫也不允許分析抑制性信號,因此Scriabin將只返回預測導致激活信號的CCC聯(lián)系。雖然Scriabin使用NicheNet通過檢查下游基因表達變化來預測活躍的CCC聯(lián)系,但一個額外的分析目標包括確定導致配體上調或表示成功信號傳導的上游信號機制。因為通過使用一組基因來推斷上游信號傳導而不是僅僅依賴于配體表達(這可能受到mRNA和蛋白質表達之間的缺失或差異的影響),還可以獲得額外更多的互作信息。
此外,Scriabin假設配體和受體的基因表達值與它們的蛋白質表達密切相關。未來的改進點將是支持多組學數(shù)據集的分析,其中直接測量參與CCC的細胞表面蛋白質,或者能夠分析通過與多組學數(shù)據參考整合而估算的蛋白質測量值。Scriabin的未來迭代將尋求解決這些問題,并進一步提高計算效率。
好啦,本期分享到這里就結束了,我們下期再會~~
[參考文獻]
Wilk AJ, Shalek AK, Holmes S, Blish CA. Comparative analysis of cell-cell communication at single-cell resolution. Nat Biotechnol. 2023 May 11. doi: 10.1038/s41587-023-01782-z. Epub ahead of print. PMID: 37169965.