作者,追風(fēng)少年i
周五了,一周的收官之戰(zhàn),馬上國慶了,希望大家有個(gè)好的假期,一切都會好起來,周星馳有一句臺詞,雖然我們都是路人甲乙丙丁,但是一樣是有生命,有靈魂的。
書接上文,空間多組學(xué)分析破譯膠質(zhì)母細(xì)胞瘤中的雙向腫瘤-宿主相互依賴性(空間微環(huán)境),我們來進(jìn)行方法拾遺并復(fù)現(xiàn)。
這里我們主要關(guān)注空間轉(zhuǎn)錄組的分析,關(guān)于空間代謝和空間蛋白,仍然需要不斷的學(xué)習(xí)。
第一點(diǎn),空間CNV分析。
-
CNA estimation
圖片.png
通過將基因與其染色體位置對齊并對相對表達(dá)值應(yīng)用移動平均值來估計(jì)拷貝數(shù)變異 (CNV),每個(gè)染色體內(nèi)有 100 個(gè)基因的滑動窗口(跟inferCNV的原理一致),首先,使用 InferCNV 包根據(jù)它們各自的基因組定位排列基因。 作為非惡性細(xì)胞的參考集,使用了來自非惡性皮層樣本的空間轉(zhuǎn)錄組數(shù)據(jù)集(注意這里ref的選擇)。 為了提高速度和計(jì)算能力,subsample是可選的。 為了避免任何特定基因?qū)σ苿悠骄€的相當(dāng)大的影響,將相對表達(dá)值限制在 [-2.6,2.6] 的范圍內(nèi),將所有高于/低于 exp(i) = |2.6| 的值替換為 exp(i) = |2.6|。然后重新導(dǎo)入導(dǎo)出的 .RDS 輸出文件,并按估計(jì)的 CNA 的染色體平均值進(jìn)行分組,并使用 SPATA 對象的 fdata slot與它們的空間位置對齊。使用 SPATA::joinWithFeatures() 函數(shù),然后提取了集群比較??臻g數(shù)據(jù)的 CNA 分析是通過 SPATA2::runCnvAnalysis() 命令在 SPATA2 中實(shí)現(xiàn)的。在下一步中,估計(jì)的 CNA 值重新排列到定義的染色體bin中。這些 bin 由 SPATAwrappers 函數(shù) Create.ref.bins() 創(chuàng)建,使用 SPATA 對象和給定 bin 的大小作為輸入。在本研究中,使用了 1Mbp 的 bin 大小,產(chǎn)生 3847 個(gè)染色體 bin,每個(gè) bin 平均覆蓋 5.5 個(gè)基因。使用 10kbp 滑動窗口進(jìn)行重新縮放和插值。對于標(biāo)準(zhǔn)化,使用了一個(gè) loess 回歸模型,用于確定來自 InferCNV 輸出的拷貝數(shù)值。使用 SPATAwrappers::run-CNV.Normalization() 函數(shù)進(jìn)行Interpolation和歸一化。
SPATA分析CNV的代碼如下
library(SPATA2)
spata_obj <- loadSpataObject("data/spata-obj-gbm275.RDS")###加載infercnv分析得到的rds
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory
cnv_prefix = "Chr"
)
# change input
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory to
clear_noise_via_ref_mean_sd = list(sd_amplifier = 2)
# example on how to use the functions arguments if you want to specify the reference (ref_*)
runCnvAnalysis(
object = spata_obj,
directory_cnv_folder = "data-gmb275/cnv-results", # example directory to
ref_annotation = cnv_ref$annotation,
ref_mtr = cnv_ref$mtr,
ref_regions = cnv_ref$regions
)
##CNV-Results
cnv_results <- getCnvResults(spata_obj)
names(cnv_results)
##Visualization
plotCnvResults(object = spata_obj)

plotSurface(object = spata_obj, color_by = "seurat_clusters")
plotCnvResults(object = spata_obj, across = "seurat_clusters")


###CNV-Heatmap
getCnvFeatureNames(object = spata_obj)
# are part of all feature names
getFeatureNames(object = spata_obj)
## numeric integer numeric numeric
## "nCount_Spatial" "nFeature_Spatial" "percent.mt" "percent.RB"
## factor character factor factor
## "seurat_clusters" "segmentation" "Leiden_UMAP" "cluster"
## logical numeric numeric numeric
## "keep" "Chr0" "Chr1" "Chr10"
## numeric numeric numeric numeric
## "Chr11" "Chr12" "Chr13" "Chr14"
## numeric numeric numeric numeric
## "Chr15" "Chr16" "Chr17" "Chr18"
## numeric numeric numeric numeric
## "Chr19" "Chr2" "Chr20" "Chr21"
## numeric numeric numeric numeric
## "Chr22" "Chr23" "Chr3" "Chr4"
## numeric numeric numeric numeric
## "Chr5" "Chr6" "Chr7" "Chr8"
## numeric
## "Chr9"
plotSurface(object = spata_obj, color_by = "Chr7", pt_clrsp = "Reds 3", c1 = 1)
plotSurface(object = spata_obj, color_by = "Chr10", pt_clrsp = "Blues 3", rev = FALSE, c1 = 1)

CNA subclone analysis
為了根據(jù) CNA 數(shù)據(jù)確定亞克隆,進(jìn)行了 PCA 分析,然后對前 30 個(gè)組分進(jìn)行 KMeans 聚類(CNV得到的矩陣進(jìn)行分析)。為了確定最優(yōu)的tree cut,我們估計(jì)了 Calinski-Harabasz 指數(shù)并使用了 k~CH 指數(shù)曲線的第一個(gè)峰值(CH 指數(shù) vs Number of clusters)。 下一個(gè)目標(biāo)是量化空間上不同的轉(zhuǎn)錄程序與亞克隆結(jié)構(gòu)的空間相關(guān)性和重疊。 首先,我們通過擬合值 (f(ck)) 估計(jì)給定 CNA 亞克隆的每個(gè)點(diǎn) (S1, S2;.; Sk) 到 KMeans 質(zhì)心 (c) 的距離 (Sdist),如下所示:

從進(jìn)一步分析中去除了距離較近的點(diǎn)(Sdist < quantileSdist ;0.9)。 然后,估計(jì)了所有給定點(diǎn)的主要空間不同轉(zhuǎn)錄程序,并量化了給定亞克隆中每個(gè)轉(zhuǎn)錄程序的表達(dá)百分比。
第二部分
-
Prediction of tumor cell content
為單細(xì)胞測序研究建立的分析和算法不一定適用于空間分辨轉(zhuǎn)錄組數(shù)據(jù)的分析。 這主要是由于每個(gè)點(diǎn)內(nèi)的細(xì)胞組成不明確,分析這些數(shù)據(jù)的一個(gè)優(yōu)勢是近似每個(gè)點(diǎn)的真實(shí)組成。單細(xì)胞數(shù)據(jù)和空間轉(zhuǎn)錄組學(xué)的整合已經(jīng)可以預(yù)測某些細(xì)胞類型的空間豐度,但在腫瘤中,由于樣本內(nèi)部和樣本之間存在巨大的異質(zhì)性,這種預(yù)測很困難。 與高度可變的基因表達(dá)相比,染色體改變是評估每個(gè)點(diǎn)的腫瘤細(xì)胞含量的相當(dāng)穩(wěn)健和合適的參數(shù)。 為了訓(xùn)練和驗(yàn)證預(yù)測模型,對同一供體進(jìn)行了單細(xì)胞測序和相應(yīng)的空間分辨轉(zhuǎn)錄組學(xué)。
推斷了 scRNA-seq 數(shù)據(jù)集的拷貝數(shù)變化,并提取了腫瘤和非惡性細(xì)胞的特征,這些特征顯示出很大的相似性。

接下來,驗(yàn)證了從 RNA-seq 數(shù)據(jù)調(diào)用的推斷 CNA 反映 DNA 測序中檢測到的 CNA 的程度。 因此,使用了最近發(fā)表的 slide-RNA-seq 和 slide-DNA-seq 數(shù)據(jù)集,并比較了兩種空間測序方法檢測到的 CNA。 兩種驗(yàn)證方法都表明,從空間轉(zhuǎn)錄組學(xué)中獲得的推斷 CNA 反映了使用 10X Visium 平臺獲得的空間分辨轉(zhuǎn)錄組學(xué)中的實(shí)際染色體增益和損失。
第三點(diǎn),Spatial autocorrelation Moran’s I,關(guān)于這個(gè)內(nèi)容,用過monocle3的童鞋應(yīng)該很熟悉。
空間自相關(guān)使用 Moran 的 I 統(tǒng)計(jì)值根據(jù)特征位置和屬性值確定點(diǎn)與其鄰居的空間依賴性。 這允許評估定義的基因表達(dá)或特征是分組的、分布的還是隨機(jī)的。 如果 Z 值或 p 值表示統(tǒng)計(jì)顯著性,則 Moran's I 指數(shù)值為正表示有聚集趨勢,而 Moran's I 指數(shù)值為負(fù)表示有分散趨勢。 自相關(guān)定義為:

where N defines the number of spatial spots with the index x and y and the matrix of spatial weights as wxy. The feature is indicated by exp and
最后來一張空間軌跡

主要還是針對CNV的分析為主
最后我把下面的內(nèi)容和視頻中細(xì)胞定義的腳本(clustermole+singleR+cellID)列在下面,有需要的可以拿去研究。
單細(xì)胞數(shù)據(jù)分析之單樣本分析篇
單細(xì)胞數(shù)據(jù)分析之多樣本整合篇
單細(xì)胞數(shù)據(jù)分析之細(xì)胞注釋篇
單細(xì)胞數(shù)據(jù)分析之軌跡分析篇
單細(xì)胞數(shù)據(jù)分析之細(xì)胞通訊篇
單細(xì)胞數(shù)據(jù)分析之CNV篇
單細(xì)胞數(shù)據(jù)分析之轉(zhuǎn)錄因子篇
空間數(shù)據(jù)的全部個(gè)性化分析PPT
