Seurat對象數(shù)據(jù)結構

1、標準流程里面的過濾三步驟,也可以用 SCTransform 代替

Seurat基本教程
seurat對象結構
單細胞轉(zhuǎn)錄組分析中的各種數(shù)據(jù)結構




image.png

2、Seurat 每一步處理類似流水線傳送帶上的容器(Container),每個函數(shù)會依次進行處理。每個函數(shù)輸入一種數(shù)據(jù)都會輸出另外一個數(shù)據(jù),并且把輸出數(shù)據(jù)也存放在這個容器中。 需要時可以提取某一步驟的數(shù)據(jù)。 還有一類函數(shù),不參與數(shù)據(jù)轉(zhuǎn)換,類似質(zhì)檢員(Inspector),在每一個數(shù)據(jù)轉(zhuǎn)換后,查看容器中的內(nèi)容,幫助判斷質(zhì)量、評估處理后的效果。

image.png

3、Seurat 流程第一步就是創(chuàng)建 Seurat 對象,首先要明白 Seurat 對象的構成。Seurat 對象進一步細分為: Assay Object 對象 和 DimReduc Object 對象。

Assay Object 對象存放的多組學的表達數(shù)據(jù), DimReduc Object 對象存放的是對 Assay Object 對象進行降維分析后的結果。

Seurat Object

Assay Object

DimReduc Object

4、專門下載和管理 Seurat示例數(shù)據(jù)對象的軟件包:SeuratData

SeuratData 先把 datasets 變成 Seurat 對象,再把 Seurat 對象以軟件包的形式分發(fā)和管理。

image.png

5、以pbmc為例,展開Seurat流程。

在Seurat對象后面加個@ 可以查看Seurat對象的內(nèi)容。彈出小窗口,可以查看里面的內(nèi)容。


Seurat對象組成
image.png

5.1 mata.data
Seurat對象中的mata.data 是一個用來對所有細胞做注釋的數(shù)據(jù)框。每一行代表一個細胞,每一列代表細胞的屬性。當需要根據(jù)細胞的屬性和類型對細胞進行篩選的時候,經(jīng)常會用到mata.data。當然也可以把分析得到的結果,添加到mata.data中。


mata.data

5.2 assay
一個Seurat對象可以包括多個assay對象,但是在某個時刻,只有一個assay對象是默認激活的??梢酝ㄟ^函數(shù) active.assay 查詢當前默認激活的是哪個assay對象。也可以用 DefaultAssay 來設置默認的 assay。


image.png

5.3 ident
可以理解為細胞的類型,在Seurat對象中,細胞可能有好幾種不同方法注釋的類型,但是在某一時刻,只有一種細胞類型是默認激活的。可以用active.ident來查詢當前默認的細胞類型是什么。


image.png

5.4 reduction
和assay一樣,reduction返回的也是一個列表。里面包含的是一個或多個 DimReduc object 對象。 每個DimReduc object 對象對應的是 assay 對象進行某種降維分析后得到的結果。降維也就是PCA 、tsen 、umap 三種。 下面這個例子里面的列表中,有兩個DimReduc object 對象,分別是PCA 和umap


image.png

5.5 version
是創(chuàng)建這個對象時,所使用的Seurat版本。

5.6 commands
是一個列表,里面保存的是workflow中每個步驟所使用的命令和參數(shù)。還有命令執(zhí)行的日期和時間。


image.png
5.7 Assay Object 的內(nèi)部結構
image.png

counts 保存的是未經(jīng)處理的原始數(shù)據(jù)。適合存放稀疏矩陣。


image.png

原始數(shù)據(jù)經(jīng)過標準化后,會存放在@data中,和counts 一樣也是一個特殊的 Matrix 對象。

image.png

當數(shù)據(jù)進行scale后,存放在名為scale.data中


image.png

key : 每個active對象都有一個key值,可以用fetch函數(shù)來獲取。。。沒聲音這里

image.png

var.features : 是一個普通的向量,里面存放的是高表達變異的基因名??梢杂煤瘮?shù)VaribleFeatures來獲得這個向量。


image.png

meta.features : Seurat對象中的mata.data 是對所有細胞做注釋的數(shù)據(jù)框。 而在assay對象中,meta.features 是對每個 features 做的注釋。 如果要對 features 的功能進行注釋、打分、篩選都需要用到meta.features。對于不同的assay來說,每個features的含義是不同的。


image.png
5.8 DimReduc Object 的內(nèi)部結構

和assay對象一樣,也是存放在一個列表中。

image.png
image.png

6、正式開始Seurat流程的workflow的每一個步驟

看視頻,講的挺詳細的。這里只記錄一些關鍵的細節(jié)。


image.png
image.png

%>% 是管道的意思
dplyr包:grpup_by top_n

image.png

patchwork 包 可以整合成一個圖


image.png
image.png

畫圖函數(shù)的特點比較


image.png
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容