
DeepSpaceDB是一個專注于10X Genomics Visium和Xenium平臺的空間轉(zhuǎn)錄組學數(shù)據(jù)庫,旨在解決現(xiàn)有數(shù)據(jù)庫“重數(shù)據(jù)收錄、輕交互分析”的問題。與SpatialDB、STOmicsDB、SOAR 等現(xiàn)有數(shù)據(jù)庫相比,DeepSpaceDB 強調(diào)高級交互功能和深度分析能力,而非單純追求平臺覆蓋廣度。
該數(shù)據(jù)庫,不僅包含10x Visium平臺的數(shù)據(jù),還包含了Xenium平臺的數(shù)據(jù),數(shù)據(jù)庫還支持上傳自己的數(shù)據(jù)在平臺上進行分析,主要功能包含以下5大模塊內(nèi)容:樣本檢索和分類、數(shù)據(jù)分析統(tǒng)計、差異分析、基因&通路檢索、數(shù)據(jù)上傳分析。

數(shù)據(jù)庫目前已收錄了2144個10x Visium空轉(zhuǎn)的樣本,包含540萬個spots點的數(shù)據(jù),另外還收錄了1045份Xenium樣本,共計包含1億2900萬個細胞的數(shù)據(jù)。
數(shù)據(jù)庫主要收錄的樣本類型為人和小鼠樣本,其中人的樣本數(shù)據(jù)包含2061個,小鼠的樣本數(shù)據(jù)包含1080個。其中:
人源:腦、肺、肝、皮膚、腎、乳腺、心臟、胰腺等;癌癥樣本占比高,健康樣本較少
鼠源:腦、肝、肺、胰腺、骨骼肌、皮膚、小腸、脾、大腸、腎等;健康對照樣本較多

下面,我們就來看看每個模塊的具體功能吧
樣本檢索和分類模塊:
樣本檢索和分類模塊是數(shù)據(jù)庫的核心功能,該界面分為5個功能區(qū):

1、篩選過濾
數(shù)據(jù)庫提供了8大篩選指標,分別是物種、組織類型、組織類型細分、疾病狀態(tài)、疾病狀態(tài)細分、性別、數(shù)據(jù)來源、技術(shù)平臺,方便使用者快速篩選目標樣本類型。
2、檢索區(qū)
可根據(jù)關(guān)鍵詞檢索特定樣本,支持多個關(guān)鍵詞同時檢索。
3、功能區(qū)
除了檢索和清除過濾條件的功能外,還可以進行樣本間的比較和相應(yīng)數(shù)據(jù)下載。
4、數(shù)據(jù)庫統(tǒng)計區(qū)
該區(qū)域展示了符合過濾條件的所有樣本,可以通過點擊鏈接直接查看對樣樣本的數(shù)據(jù)情況,來源數(shù)據(jù)庫,以及來源的文獻。
5、預(yù)覽區(qū)
點擊相應(yīng)的樣本后,可在右側(cè)快速瀏覽樣本的基本情況以及HE染色結(jié)果。

單樣本分析模塊:
點擊感興趣的樣本ID后,即可進入單樣本分析模塊。該模塊的分析展示的內(nèi)容如下:
1、樣本基本信息:
樣本基本信息介紹,包括技術(shù)平臺、物種、組織、疾病條件,來源數(shù)據(jù)庫以及發(fā)表時間等等。

2、樣本在數(shù)據(jù)庫中的降維聚類坐標
根據(jù)樣本整體的基因表達模式,可獲得目標樣本在所有樣本中的表達分布情況,可通過該圖找到與目標樣本基因表達相似的樣本。

3、樣本數(shù)據(jù)質(zhì)量
可查看樣本UMI、基因、線粒體基因表達分布熱圖,還可以查看該樣本與數(shù)據(jù)庫中的其他樣本整體相比,相對數(shù)據(jù)質(zhì)量如何,以及在所有spot點中的數(shù)據(jù)相對數(shù)據(jù)表現(xiàn)。

4、病理注釋
該數(shù)據(jù)庫擁有特色功能——病理注釋,左圖是基于大語言模型GPT-4o進行的AI自動注釋,右圖則是由病理專家進行的人工注釋。在左圖中移動鼠標到相應(yīng)的區(qū)域,即可查看對應(yīng)區(qū)域的AI自動注釋的結(jié)果。

5、空間降維聚類
該數(shù)據(jù)庫提供了三種不同的降維聚類方法,分別是標準、BASS以及BayesSpace降維聚類方式

6、空間高變基因分析
該數(shù)據(jù)庫提供了singleCellHaystack、SPARK-X、BinSpect三種不同工具去預(yù)測空間高變基因,同時也只是目標基因檢索,可直接查看特定基因是否為空間高變基因。

7、空間高變通路分析
該數(shù)據(jù)庫通過singleCellHaystack工具去預(yù)測在空間上表達顯著差異的信號通路,該分析工具基于通路基因集打分的原理,通過計算通路在空間局部區(qū)域表達的活性差異,篩選顯著變化的通路。

8、空間反卷積細胞注釋
該數(shù)據(jù)提供基于RCTD和SPOTlight反卷積后的細胞注釋結(jié)果,左圖是目標細胞類型在空間上的表達分布熱圖,可直接切換不同細胞類型進行查看,右圖是整體的細胞類型注釋結(jié)果。最后還統(tǒng)計了樣本中不同細胞類型的占比。


9、細胞互作分析
該數(shù)據(jù)庫還提供了基于CellChat的細胞通訊分析結(jié)果,可惜目前還沒有在線的交互界面,只可以下載表格進行查看。

10、豐富的數(shù)據(jù)下載
最后,該數(shù)據(jù)庫還提供了豐富的數(shù)據(jù)下載內(nèi)容,不僅可以下載樣本的表達矩陣,還可以下載上述各個分析環(huán)節(jié)的作圖表格數(shù)據(jù),便于后期做個性化的調(diào)整。

樣本在線分析模塊:
樣本在線分析模塊支持樣本內(nèi)以及樣本間的比較分析,樣本內(nèi)分析可以個性化圈選相應(yīng)的區(qū)域后,進行同一張切片上,不同區(qū)域基因表達差異分析比較。同時也支持比較不同切片上,相同區(qū)域的基因表達比較,且支持個性化的手動圈選比較,可以根據(jù)病理染色結(jié)果圈選特征區(qū)域進行深入分析。
單樣本分析,可以圈選特點區(qū)域進行差異基因和差異通路的比較。


多樣本分析,勾選多個樣本后,直接在Tissue Explorer界面進行操作,可以比較樣本之間的差異基因和差異通路。

搜索模塊:
搜索模塊支持提供目標基因在或者目標通路的檢索,可直接檢索目標基因和目標通路在不同物種、不同平臺上的檢出情況,對于不確定自己關(guān)注的基因在相關(guān)組織中能否檢出的情況,可以先通過搜索模塊進行檢索。檢索結(jié)果分為三部分:
第一部分是目標基因在哪些組織樣本中高表達

第二部分是目標基因在不同疾病狀態(tài)的分布情況。

第三部是目標基因顯著表達的樣本信息統(tǒng)計

數(shù)據(jù)上傳分析模塊:
我們還可以上傳自己的空間轉(zhuǎn)錄組數(shù)據(jù),進行在線分析,或者與數(shù)據(jù)庫中已有的樣本數(shù)據(jù)進行對比。上傳的數(shù)據(jù)只有自己可見,且數(shù)據(jù)庫只會保留7天,7天之后也會自動刪除已上傳的數(shù)據(jù)。

好啦,今天就是DeepSpaceDB空間轉(zhuǎn)錄組數(shù)據(jù)庫的使用分享,希望能給大家?guī)硪恍椭?,我們下期見?/p>
參考資料:
1、https://genomics.virus.kyoto-u.ac.jp/deepspacedb/
2、Honcharuk V, Zainab A, Horimoto Y, et al. DeepSpaceDB: a spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments.?Nucleic Acids Res. 2026;54(D1):D1017-D1030. doi:10.1093/nar/gkaf1117