空轉(zhuǎn)分析方法拾遺2

作者,追風(fēng)少年i

周五了,一周的收官之戰(zhàn),馬上國慶了,希望大家有個(gè)好的假期,一切都會好起來,周星馳有一句臺詞,雖然我們都是路人甲乙丙丁,但是一樣是有生命,有靈魂的。

書接上文,空間多組學(xué)分析破譯膠質(zhì)母細(xì)胞瘤中的雙向腫瘤-宿主相互依賴性(空間微環(huán)境),我們來進(jìn)行方法拾遺并復(fù)現(xiàn)。

這里我們主要關(guān)注空間轉(zhuǎn)錄組的分析,關(guān)于空間代謝和空間蛋白,仍然需要不斷的學(xué)習(xí)。

第一點(diǎn),空間CNV分析。

  • CNA estimation
    圖片.png

通過將基因與其染色體位置對齊并對相對表達(dá)值應(yīng)用移動平均值來估計(jì)拷貝數(shù)變異 (CNV),每個(gè)染色體內(nèi)有 100 個(gè)基因的滑動窗口(跟inferCNV的原理一致),首先,使用 InferCNV 包根據(jù)它們各自的基因組定位排列基因。 作為非惡性細(xì)胞的參考集,使用了來自非惡性皮層樣本的空間轉(zhuǎn)錄組數(shù)據(jù)集(注意這里ref的選擇)。 為了提高速度和計(jì)算能力,subsample是可選的。 為了避免任何特定基因?qū)σ苿悠骄€的相當(dāng)大的影響,將相對表達(dá)值限制在 [-2.6,2.6] 的范圍內(nèi),將所有高于/低于 exp(i) = |2.6| 的值替換為 exp(i) = |2.6|。然后重新導(dǎo)入導(dǎo)出的 .RDS 輸出文件,并按估計(jì)的 CNA 的染色體平均值進(jìn)行分組,并使用 SPATA 對象的 fdata slot與它們的空間位置對齊。使用 SPATA::joinWithFeatures() 函數(shù),然后提取了集群比較??臻g數(shù)據(jù)的 CNA 分析是通過 SPATA2::runCnvAnalysis() 命令在 SPATA2 中實(shí)現(xiàn)的。在下一步中,估計(jì)的 CNA 值重新排列到定義的染色體bin中。這些 bin 由 SPATAwrappers 函數(shù) Create.ref.bins() 創(chuàng)建,使用 SPATA 對象和給定 bin 的大小作為輸入。在本研究中,使用了 1Mbp 的 bin 大小,產(chǎn)生 3847 個(gè)染色體 bin,每個(gè) bin 平均覆蓋 5.5 個(gè)基因。使用 10kbp 滑動窗口進(jìn)行重新縮放和插值。對于標(biāo)準(zhǔn)化,使用了一個(gè) loess 回歸模型,用于確定來自 InferCNV 輸出的拷貝數(shù)值。使用 SPATAwrappers::run-CNV.Normalization() 函數(shù)進(jìn)行Interpolation和歸一化。

SPATA分析CNV的代碼如下

library(SPATA2)
spata_obj <- loadSpataObject("data/spata-obj-gbm275.RDS")###加載infercnv分析得到的rds

spata_obj <-
  runCnvAnalysis(
    object = spata_obj
    directory_cnv_folder = "data-gmb275/cnv-results" # example directory
    cnv_prefix = "Chr"
    )

# change input
spata_obj <- 
  runCnvAnalysis(
    object = spata_obj
    directory_cnv_folder = "data-gmb275/cnv-results" # example directory to 
    clear_noise_via_ref_mean_sd = list(sd_amplifier = 2)

# example on how to use the functions arguments if you want to specify the reference (ref_*)
runCnvAnalysis(
  object = spata_obj,
  directory_cnv_folder = "data-gmb275/cnv-results", # example directory to 
  ref_annotation = cnv_ref$annotation, 
  ref_mtr = cnv_ref$mtr, 
  ref_regions = cnv_ref$regions
)

##CNV-Results
cnv_results <- getCnvResults(spata_obj)

names(cnv_results)
##Visualization
plotCnvResults(object = spata_obj)
圖片.png
plotSurface(object = spata_obj, color_by = "seurat_clusters")

plotCnvResults(object = spata_obj, across = "seurat_clusters")
圖片.png
圖片.png
###CNV-Heatmap
getCnvFeatureNames(object = spata_obj)

# are part of all feature names
getFeatureNames(object = spata_obj)
##            numeric            integer            numeric            numeric 
##   "nCount_Spatial" "nFeature_Spatial"       "percent.mt"       "percent.RB" 
##             factor          character             factor             factor 
##  "seurat_clusters"     "segmentation"      "Leiden_UMAP"          "cluster" 
##            logical            numeric            numeric            numeric 
##             "keep"             "Chr0"             "Chr1"            "Chr10" 
##            numeric            numeric            numeric            numeric 
##            "Chr11"            "Chr12"            "Chr13"            "Chr14" 
##            numeric            numeric            numeric            numeric 
##            "Chr15"            "Chr16"            "Chr17"            "Chr18" 
##            numeric            numeric            numeric            numeric 
##            "Chr19"             "Chr2"            "Chr20"            "Chr21" 
##            numeric            numeric            numeric            numeric 
##            "Chr22"            "Chr23"             "Chr3"             "Chr4" 
##            numeric            numeric            numeric            numeric 
##             "Chr5"             "Chr6"             "Chr7"             "Chr8" 
##            numeric 
##             "Chr9"
plotSurface(object = spata_obj, color_by = "Chr7", pt_clrsp = "Reds 3", c1 = 1)

plotSurface(object = spata_obj, color_by = "Chr10", pt_clrsp = "Blues 3", rev = FALSE, c1 = 1)
圖片.png

CNA subclone analysis
為了根據(jù) CNA 數(shù)據(jù)確定亞克隆,進(jìn)行了 PCA 分析,然后對前 30 個(gè)組分進(jìn)行 KMeans 聚類(CNV得到的矩陣進(jìn)行分析)。為了確定最優(yōu)的tree cut,我們估計(jì)了 Calinski-Harabasz 指數(shù)并使用了 k~CH 指數(shù)曲線的第一個(gè)峰值(CH 指數(shù) vs Number of clusters)。 下一個(gè)目標(biāo)是量化空間上不同的轉(zhuǎn)錄程序與亞克隆結(jié)構(gòu)的空間相關(guān)性和重疊。 首先,我們通過擬合值 (f(ck)) 估計(jì)給定 CNA 亞克隆的每個(gè)點(diǎn) (S1, S2;.; Sk) 到 KMeans 質(zhì)心 (c) 的距離 (Sdist),如下所示:

圖片.png

從進(jìn)一步分析中去除了距離較近的點(diǎn)(Sdist < quantileSdist ;0.9)。 然后,估計(jì)了所有給定點(diǎn)的主要空間不同轉(zhuǎn)錄程序,并量化了給定亞克隆中每個(gè)轉(zhuǎn)錄程序的表達(dá)百分比。

第二部分

  • Prediction of tumor cell content
    為單細(xì)胞測序研究建立的分析和算法不一定適用于空間分辨轉(zhuǎn)錄組數(shù)據(jù)的分析。 這主要是由于每個(gè)點(diǎn)內(nèi)的細(xì)胞組成不明確,分析這些數(shù)據(jù)的一個(gè)優(yōu)勢是近似每個(gè)點(diǎn)的真實(shí)組成。單細(xì)胞數(shù)據(jù)和空間轉(zhuǎn)錄組學(xué)的整合已經(jīng)可以預(yù)測某些細(xì)胞類型的空間豐度,但在腫瘤中,由于樣本內(nèi)部和樣本之間存在巨大的異質(zhì)性,這種預(yù)測很困難。 與高度可變的基因表達(dá)相比,染色體改變是評估每個(gè)點(diǎn)的腫瘤細(xì)胞含量的相當(dāng)穩(wěn)健和合適的參數(shù)。 為了訓(xùn)練和驗(yàn)證預(yù)測模型,對同一供體進(jìn)行了單細(xì)胞測序和相應(yīng)的空間分辨轉(zhuǎn)錄組學(xué)。

推斷了 scRNA-seq 數(shù)據(jù)集的拷貝數(shù)變化,并提取了腫瘤和非惡性細(xì)胞的特征,這些特征顯示出很大的相似性。

Validation of CNA Analysis

接下來,驗(yàn)證了從 RNA-seq 數(shù)據(jù)調(diào)用的推斷 CNA 反映 DNA 測序中檢測到的 CNA 的程度。 因此,使用了最近發(fā)表的 slide-RNA-seq 和 slide-DNA-seq 數(shù)據(jù)集,并比較了兩種空間測序方法檢測到的 CNA。 兩種驗(yàn)證方法都表明,從空間轉(zhuǎn)錄組學(xué)中獲得的推斷 CNA 反映了使用 10X Visium 平臺獲得的空間分辨轉(zhuǎn)錄組學(xué)中的實(shí)際染色體增益和損失。

第三點(diǎn),Spatial autocorrelation Moran’s I,關(guān)于這個(gè)內(nèi)容,用過monocle3的童鞋應(yīng)該很熟悉。

空間自相關(guān)使用 Moran 的 I 統(tǒng)計(jì)值根據(jù)特征位置和屬性值確定點(diǎn)與其鄰居的空間依賴性。 這允許評估定義的基因表達(dá)或特征是分組的、分布的還是隨機(jī)的。 如果 Z 值或 p 值表示統(tǒng)計(jì)顯著性,則 Moran's I 指數(shù)值為正表示有聚集趨勢,而 Moran's I 指數(shù)值為負(fù)表示有分散趨勢。 自相關(guān)定義為:

圖片.png

where N defines the number of spatial spots with the index x and y and the matrix of spatial weights as wxy. The feature is indicated by exp and \overline{\text{exp}} the mean value of neighboring features. The spatial weights were defined as a distance matrix of the cartesian space.W is defined as the sum of all wxy.

最后來一張空間軌跡

空間軌跡

主要還是針對CNV的分析為主

最后我把下面的內(nèi)容和視頻中細(xì)胞定義的腳本(clustermole+singleR+cellID)列在下面,有需要的可以拿去研究。

單細(xì)胞數(shù)據(jù)分析之單樣本分析篇
單細(xì)胞數(shù)據(jù)分析之多樣本整合篇
單細(xì)胞數(shù)據(jù)分析之細(xì)胞注釋篇
單細(xì)胞數(shù)據(jù)分析之軌跡分析篇
單細(xì)胞數(shù)據(jù)分析之細(xì)胞通訊篇
單細(xì)胞數(shù)據(jù)分析之CNV篇
單細(xì)胞數(shù)據(jù)分析之轉(zhuǎn)錄因子篇
空間數(shù)據(jù)的全部個(gè)性化分析PPT

還有 2% 的精彩內(nèi)容
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。
支付 ¥100.00 繼續(xù)閱讀

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容