腫瘤表達譜分析組織中免疫細胞浸潤情況 --- CIBERSORT & xCell

腫瘤微環(huán)境是近年來的研究熱點。復雜而動態(tài)的微環(huán)境中,腫瘤細胞與浸潤性免疫細胞、基質細胞等相互作用,這在促進或抑制腫瘤生長、侵襲、轉移以及對病人臨床預后方面可能具有多方面的影響。很多算法與工具應運而生。
而基于表達譜分析組織中細胞組分情況,主要分成兩大類:去卷積(deconvolving)方法分析細胞組成成分與評估每種細胞類型的富集情況。今天介紹兩種比較典型的工具,分別是基于前者的CIBERSORT和基于后者的xCell,兩種工具都可以在網(wǎng)頁在線運行或利用R語言編程運行。

1. CIBERSORT

image

文章于2015年發(fā)表于Nature Methods,目前引用量已經(jīng)超過1200,可見熱度。
算法本身的理解目前對于我來講有一定難度,總體是利用線性支持向量回歸(linear support vector regression)方法對腫瘤組織表達矩陣進行反卷積,分析組織中各類型的細胞含量。
文章給出了一個名為LM22的leukocyte gene signature matrix作為參考集,包含22種白細胞亞型,

It contains 547 genes that distinguish 22 human hematopoietic cell phenotypes, including seven T-cell types, na?ve and memory B cells, plasma cells, natural killer (NK) cells and myeloid subsets.

1.1 網(wǎng)頁版

http://cibersort.stanford.edu/是其在線工具的網(wǎng)址,注冊后即可獲得500M的存儲空間,進而使用。

image

首先點擊Menu下的Upload Files,上傳我們需要進行分析的表達矩陣,格式要求如下:

image

總結來說就是需要上傳制表符分隔的,每行為基因,每列為樣本的表達譜文件,基因名采用HUGO gene symbols,表達值不經(jīng)過log2處理,且不能有缺失值。
文件上傳成功后,F(xiàn)ile Type選擇Mixture,Title自行編寫,之后點擊Menu下的Run CIBERSORT,進入下面頁面

image

第一個“絕對模式”和“相對模式”的選擇,根據(jù)頁面所列的細節(jié),個人認為暫不勾選較好

image

Signature gene file 選擇LM22(22 immune cell types) (另:工具也可以自行確定signature matrix,分析其他細胞類型情況,我們先行跳過)
Mixture file 選擇我們之前upload好的文件
Permutations 選擇1000,準確性會更高,雖然運行時間變長
其余高級選項保留默認,點擊Run,進行分析,分析之后即可下載各種文件格式的結果。結果示例如下圖:

image

1.2 R函數(shù)版

我們知道上述網(wǎng)頁工具已經(jīng)是相當簡便的了,那么我們再用R函數(shù)做CIBERSORT是不是就沒有意義呢,不是,最起碼網(wǎng)不好的時候不用著急。。。
R函數(shù)版非常簡單,只需要source一下封裝好的腳本,再把相關文件導入運算即可

source('CIBERSORT.R')
result <- CIBERSORT('LM22.txt','CIBERSORT_RNA.txt', perm = 1000, QN = TRUE)

腳本CIBERSORT.R在 https://rdrr.io/github/singha53/amritr/src/R/supportFunc_cibersort.R上可以找到,復制,粘貼,保存即可。
CIBERSORT()有4個參數(shù),第一個'LM22.txt'即參考集leukocyte gene signature matrix,可在https://cibersort.stanford.edu/download.php處下載,第二個'CIBERSORT_RNA.txt'是我們準備好的表達矩陣,perm是計算p值時的置換次數(shù),我們設置為1000,與網(wǎng)頁版保持一致,QN是是否進行分位數(shù)歸一化,默認為TRUE。運行后即可得到樣本各細胞組分含量的結果。

2. xCell

文章于2017年發(fā)表于Genome Biology,目前引用在230+,影響力并沒有CIBERSORT這么廣泛。

image

算法包含了5個大類的64種細胞類型

image

2.1 網(wǎng)頁版

https://xcell.ucsf.edu/是其在線工具的網(wǎng)址,不需注冊

image

只需要上傳基因表達數(shù)據(jù),填寫自己的郵箱地址,Run。結果運行出來后,會通過郵件的形式發(fā)至我們留的郵箱。注意填寫RNA-seq與否的選項框。
表達數(shù)據(jù)的格式要求:

image

2.2 R包版

R包xCell存放在Github上,https://github.com/dviraran/xCell

devtools::install_github('dviraran/xCell')
library(xCell)
xCell  = xCellAnalysis(expr, rnaseq = TRUE) # RNA-seq
# xCell = xCellAnalysis(expr, rnaseq = FALSE) # 非RNA-seq

主要就是xCellAnalysis()函數(shù),第一個參數(shù)是我們的表達矩陣對象,同時注意rnaseq參數(shù)是或否的選擇。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容