作者,追風少年i
組織是一個有序的統(tǒng)一體,細胞與細胞之間不是割裂的存在,而是存在頻繁的相互作用,這種相互作用,是通過配體細胞表達配體,配體作用于受體和受體細胞,從而引起受體細胞的生物學變化。正是因為這種頻繁的相互作用,體現(xiàn)了細胞之間的有序統(tǒng)一,以及在受到疾病等外界刺激條件下對這種有序狀態(tài)的影響和細胞之間交流的變化以應(yīng)對這些刺激。為了分析細胞之間的相互作用,開發(fā)了很多方法,其中CellphoneDB[1]、CellChat[2]、NicheNet[3]最為經(jīng)典,極大地促進了細胞交流的研究。
細胞通訊導論
多細胞生物是由不同類型的細胞組成的“社會”,而且是一個開放的“社會”,這個“社會”中的每個細胞必須協(xié)調(diào)他們的行為,為此,細胞建立通訊聯(lián)絡(luò)是必須的。如生物體的生長發(fā)育、分化、各種組織器官的形成、組織的維持以及各種生理活動的協(xié)調(diào),都需要高度精確和高效的細胞間的通訊機制。
細胞之間的相互通訊是一個極其復雜的過程,通常指一個細胞發(fā)出的信息通過介質(zhì)傳遞到另一個細胞產(chǎn)生相應(yīng)的反應(yīng)。細胞通訊中有兩個基本概念:細胞信號傳導和信號轉(zhuǎn)導,前者強調(diào)的產(chǎn)生與細胞間的傳送,而信號轉(zhuǎn)導是接受與接收后信號轉(zhuǎn)換的方式途徑和結(jié)果。細胞有三種通訊方式:第一種通過化學信號分子,這是動物和植物最普遍采用的通訊方式;第二種通過相鄰細胞表面分子的粘著;第三種通過細胞與細胞外基質(zhì)的粘著。
細胞通訊基本過程:①信號分子的合成:一般的細胞都合成信號分子,而內(nèi)分泌細胞是信號分子的主要來源。②信號分子從信號生成細胞釋放到周圍環(huán)境中:這是一個相當復雜的過程,特別是蛋白質(zhì)類的信號分子,要經(jīng)過內(nèi)膜系統(tǒng)的合成、加工、分選和分泌,最后釋放到細胞外。③信號分子向靶細胞運輸:運輸?shù)姆绞接泻芏喾N,激素類主要是通過血液循環(huán)系統(tǒng)運送到靶細胞,而致密組織的信號分析則是釋放到周圍環(huán)境中影響周圍的細胞。④靶細胞對信號分子的識別和檢測:主要通過位于細胞膜或細胞內(nèi)受體蛋白的選擇性的識別和結(jié)合。⑤細胞對細胞外信號進行跨膜轉(zhuǎn)導,產(chǎn)生細胞內(nèi)信號。⑥細胞內(nèi)信號作用于效應(yīng)分子,進行逐步放大的級聯(lián)反應(yīng),引起細胞代謝、生長、基因表達等方面的一系列變化。
細胞完成信號應(yīng)答之后,要進行信號解除,終止細胞應(yīng)答,主要是通過對信號分子的修飾、水解或結(jié)合等方式降低信號分子的水平和濃度以終止反應(yīng)。示意圖如下:

而細胞之間的通訊,也成為了單細胞數(shù)據(jù)分析非常重要的一環(huán)。
單細胞通訊分析最常用的方法----CellphoneDB[1]
2020年Efremova M[1]等人發(fā)表的細胞通訊分析方法CellPhoneDB[1],是單細胞分析細胞通訊最常見的手段,引用率遠遠高于其他方法,目前已經(jīng)更新到了3.0版本,可以分析空間轉(zhuǎn)錄組的生態(tài)位通訊,關(guān)于空間轉(zhuǎn)錄組的通訊分析放在空間轉(zhuǎn)錄組部分分享。
數(shù)據(jù)庫
CellPhoneDB[1]配有詳細的受配體數(shù)據(jù)庫,其整合了此前的公共數(shù)據(jù)庫,還會進行手動矯正,以得到更加準確的受配體注釋。此外,針對受配體有多個亞基的情況,也進行了注釋。下面這張圖顯示了CellPhoneDB[1]配有的數(shù)據(jù)庫包含多少種分泌蛋白和膜蛋白、蛋白質(zhì)復合物、受配體關(guān)系,以及它們來源于什么數(shù)據(jù)庫。數(shù)據(jù)庫唯一的缺點就是物種是人,小鼠或其他物種進行分析需要做基因轉(zhuǎn)換。

CellPhoneDB[1]推斷細胞通訊的原理
CellPhoneDB[1]分析細胞通訊需要兩個前提條件----表達矩陣和細胞注釋,對于ligand-receptor這個互作關(guān)系,計算clusterA里面ligand的表達均值,計算另一個clusterB中receptor的表達均值,二者的均值為MEAN;在隨機更換細胞的label之后,依據(jù)新的標簽,計算“clusterA”里面ligand的表達均值,"clusterB"中receptor的表達均值,再求一個平均值mean,這樣的過程重復多次,就可以得到一個mean的分布,即null distribution,但是這里需要注意一個問題,上述講到的通訊方向是clusterA→clusterB,當研究clusterB→clusterA的時候,即clusterB表達ligand,cluster表達receptor。MEAN在這個分布中所在的位置以及更極端的位置,構(gòu)成的占比,就是p值(p值的定義)。所以CellPhoneDB推測兩種細胞類型之間顯著富集的受配體關(guān)系,本質(zhì)上還是基于一個細胞類型里面的受體表達量,以及另一種細胞類型里面的配體表達量。此外,如果某種關(guān)系無處不在(在所有細胞類型之間都很明顯),則無法識別是否顯著。其中配受體在細胞類型中平均值的相乘,為細胞之間的通訊強度。

CellPhoneDB[1]分析的注意事項
(1)當分析的細胞數(shù)過多的情況下,會進行下采樣分析,只分析1/3的細胞。
(2)當存在復合物的情況下,多亞基考慮表達低的那一個亞基
(3)配受體表達占比到達一定的閾值才會納入分析,默認是10%。
CellPhoneDB[1]分析的可視化展示
CellPhoneDB內(nèi)置了可視化展示的方法,文獻中的示例如下:

但是這個展示方法有兩個問題,1)右邊的熱圖表示細胞類型兩兩之間的相互作用的數(shù)量,但沿著對角線左右是對稱的,也就是說A-B與B-A的互作數(shù)目是一樣的,這顯然是不合理的;2)左邊是具體受配體對,細胞對的互作氣泡圖,點的大小表示顯著水平,顏色則是The means of the average expression level of interacting molecule 1 in cluster 1 and interacting molecule 2 in cluster 2,而沒有說哪一個是受體哪一個是配體。
原因都和CellPhoneDB[1]內(nèi)置的ligand-receptor互作關(guān)系對有關(guān)。CellPhoneDB[1]默認的展示方法不區(qū)分受體還是配體,對于配受體對gene1-gene2,可以是gene1配體gene2受體,也可以是gene1受體gene2配體,忽略了方向性。具體分析的時候,要注意方向性的問題。
單細胞通訊可視化最“美”的方法----CellChat[1]
異常值影響與CellChat[2]方法改進
在分析細胞通訊的過程中,分析細胞溝通交流強度容易受到異常值的干擾。由于單細胞數(shù)據(jù)的稀疏性,簡單粗暴地采用平均值相乘的方法有欠合理,0值占比較大和異常高的表達值,都會顯著影響分析的配受體通訊強度,為了解決這個問題,CellChat采用了4分位值的策略,計算方法如下:
