hello,我們今天要繼續(xù)擴展10X空間轉錄組的個性化分析,其中主要是CNV分析和速率分析的空間圖譜,參考文獻在Spatiotemporal heterogeneity of glioblastoma is dictated by microenvironmental interference,大家可以好好看一看,許多方法值得我們借鑒和運用。
首先來分享空間轉錄組的CNV分析,關鍵是擴展到空間的CNV圖譜,其實關于空間轉錄組的CNV分析,大家可以參考我之前分享的文章10X空間轉錄組數(shù)據(jù)分析之CNV事件的spatial landscape、10X空間轉錄組數(shù)據(jù)分析之思路總結(針對腫瘤樣本)、10X空間轉錄組數(shù)據(jù)推斷基因拷貝數(shù)畸變(copy number aberrations)CNA等,而我們今天分享的CNV,是之前的延申。

圖片.png

圖片.png
inferCNV的分析會得到很多的文件,其中這里我們關注三個文件
(1)17_HMM_predHMMi3.hmm_mode-samples.pred_cnv_regions.dat,染色體區(qū)段的CNV事件

圖片.png
(2)17_HMM_predHMMi3.hmm_mode-samples.pred_cnv_genes.dat,針對基因的CNV事件。

圖片.png
(3)17_HMM_predHMMi6.rand_trees.hmm_mode-subclusters.cell_groupings,針對每個細胞的CNV標識

圖片.png
根據(jù)上述的三個文件,就可以拿到樣本全面的CNV信息,從而構建CNV圖譜。
看一看CNV分析的詳細做法
通過將基因與其染色體位置對齊并對相對表達值應用移動平均值來估計拷貝數(shù)變異 (CNV),每個染色體內(nèi)有 100 個基因的滑動窗口。首先,使用 InferCNV包根據(jù)基因組各自的定位排列基因。作為非惡性細胞的參考集,我們使用了來自非惡性皮質樣本的空間轉錄組數(shù)據(jù)集(這里采用空間轉錄組數(shù)據(jù)直接進行CNV分析)。為了提高速度和計算能力,下采樣是可選的。為了避免任何特定基因對移動平均值的顯著影響,我們通過使用 infercnv 包替換所有高于/低于 exp(i)=|2.6| 的值來限制相對表達值 [-2.6,2.6]。 如前所述,這僅在 CNV 估計的背景下進行。 導出的 .RDS 文件被重新導入并按估計的 CNV 改變的染色體平均值分組,并使用 SPATA對象的 fdata slot對齊到它們的空間位置。 使用 SPATA::joinWithFeatures() 函數(shù)進行聚類比較的提取。 此外,還實現(xiàn)了選擇染色體中變化最大的基因的選項。

圖片.png
最后挑選顯著的CNV事件,實現(xiàn)我們的空間CNV圖譜

圖片.png
接下來我們第二個分析點,空間轉錄組的速率分析。
其實在空間轉錄組出現(xiàn)的時候,對于軌跡的分析就希望得到細胞不僅僅是時間的變化,更多的是想要空間上的遷移,大家可以參考我之前分享的內(nèi)容10X空間轉錄組的軌跡分析,但是當時限于空間轉錄組的分析精度,很少再深入研究,不過隨著分析的進展,單細胞空間聯(lián)合方法、10X空間轉錄組速率分析(Velocyto)之SIRV等等,越來越趨向于空間轉錄組對于軌跡的判斷,雖然很多時候細胞群之間不一定有分化關系,但是這樣的轉變確實體現(xiàn)了基因、通路的遷移。

圖片.png
空間轉錄組做RNA速率之前呢,大家最好先看看之前分享的內(nèi)容,包括10X單細胞(10X空間轉錄組)基于馬爾可夫過程和RNA速率的細胞命運預測(Cellrank代碼分享)、10X單細胞(10X空間轉錄組)基于馬爾可夫過程和RNA速率的細胞命運預測(Cellrank)、10X空間轉錄組數(shù)據(jù)分析之Pattern recognition and clustering,因為空間轉錄組的分析是建立在這里基礎之上的。

圖片.png

圖片.png
其中空間上的坐標是一致的,也可以借用單細胞的方法,在UMAP圖上展示軌跡,但是我最欣賞下面的降維展示方法:

圖片.png
關于PCA的意義,這里不再多說,大家可以參考我之前的文章10X單細胞10X空間轉錄組降維分析之PCA軸的秘密,每個軸都有特定的含義,這樣展示的方式更加一目了然。
接下來具體的做法RNA velocity estimation
使用 CellRanger BAM 文件通過ready-to-use pipeline從 velocyto 包中分離拼接和未拼接讀數(shù)的表達矩陣。生成的 .loom 文件被讀入 scVelo Seurat。合并Seurat 對象并執(zhí)行了批次效應的去除。數(shù)據(jù)整合后,具有外顯子和內(nèi)含子基因級 UMI 計數(shù)的 Seurat 對象被轉換為 h5ad 格式。我們將 h5ad 文件讀入到 AnnData 對象中。接下來,執(zhí)行標準化并通過scVelo包選擇了 2,000 個高變的基因。排除了外顯子和內(nèi)含子read中分配讀數(shù)少于 20 的所有基因,并使用動力學模型估計了 RNA 速度和潛伏時間。數(shù)據(jù)將導出為 .csv 文件并實施到 SPATA 對象中以進行進一步的可視化。The explained pipeline is implemented into a SPATA wrapper for scVelo (SPATA::getRNA velocity, in the development branch).
可視化的具體做法,通過使用集成到 adata.obsm['X_umap'] slot中的 AnnData 對象中的前 3 個主成分 (PC1-3) 對所有腫瘤樣本進行可視化。 velocity streams由參考“X_umap” slot的 pl.velocity_embedding_stream 函數(shù)計算。 在空間轉錄組數(shù)據(jù)中,目標是在添加velocity streams并保留空間結構。 我們將空間坐標從 SPATA對象遷移到 AnnData 對象到用于 pl.velocity_embedding_stream 函數(shù)的 adata.obsm['X_umap'] slot中。
Estimation of transient gene expression programs along RNA velocity streams,為了估計在空間(空間轉錄組學)和時間(RNA 速度估計)中動態(tài)調(diào)節(jié)的轉錄程序,使用計算出的velocity streams作為空間軌跡。 使用 SPATA::createTrajectories 函數(shù),沿著最近描述的時空軌跡尋找遵循預定義動態(tài)的基因。

圖片.png

圖片.png
不過我還是很喜歡下面的展示方式

圖片.png
- 注:Diffusion plots (dimensional reduction, with RNA-velocity) indicate the difference of reactive and lineage differentiation along the major axis. Heatmaps of the lineage to reactive trajectory are illustrated. On the bottom of the heatmap, a barplot indicates the sample source. A lineplot at the top of the heatmap illustrates the gene set enrichment analysis of the reactive immune and NPC-like cell states
最后補充一個Spatial correlation analysis
為了繪制空間相關基因表達或基因集富集,使用了 z score的歸一化表達值。 基因集的一個基因表達vector或富集vector用于沿空間軌跡對spot進行排序。 構建從最低排名到最高排名的點的軌跡(基于 z score輸入vector)。 感興趣的基因(與空間軌跡相關)通過來自 stats-package(R 軟件)的 loess-fit 進行擬合,并與排名spot對齊并進行縮放。 通過 Pearson 的乘積矩相關系數(shù)進行相關分析。 對于熱圖說明,通過沿預定義的空間軌跡對黃土擬合表達的最大峰值進行排序來計算基因順序。
好了,不知道大家學到了么
生活很好,有你更好