論文圖鑒14:多組學(xué)2

多組學(xué)1在這里論文日鑒7--單細(xì)胞數(shù)據(jù)整合 - 簡(jiǎn)書(shū) (jianshu.com)

MOGONE

MOGONET integrates multi-omics data using graph convolutional networks allowing patient classification and biomarker identification | Nature Communications

第一個(gè)利用圖卷積網(wǎng)絡(luò)(GCNs) 進(jìn)行組學(xué)數(shù)據(jù)學(xué)習(xí)以對(duì)新樣本進(jìn)行有效類(lèi)別預(yù)測(cè)的有監(jiān)督的多組學(xué)集成方法。
MOGONET integrates multi-omics data using graph convolutional networks allowing patient classification and biomarker identification

一個(gè)用于生物醫(yī)學(xué)應(yīng)用中分類(lèi)任務(wù)的多組學(xué)數(shù)據(jù)分析框架。MOGONET 在標(biāo)簽空間上將組學(xué)特定學(xué)習(xí)與多組學(xué)綜合分類(lèi)相結(jié)合。具體來(lái)說(shuō),MOGONET 利用圖卷積網(wǎng)絡(luò)(GCN)進(jìn)行組學(xué)特定的學(xué)習(xí)。與全連通神經(jīng)網(wǎng)絡(luò)相比,GCN 既利用了組學(xué)特征,又利用了相似網(wǎng)絡(luò)描述的樣本之間的相關(guān)性,從而獲得了更好的分類(lèi)性能。MOGONET 除了直接連接每個(gè)組學(xué)數(shù)據(jù)類(lèi)型的標(biāo)簽分布,還利用視圖相關(guān)發(fā)現(xiàn)網(wǎng)絡(luò)(VCDN)探索標(biāo)簽空間的交叉組學(xué)相關(guān)性,以實(shí)現(xiàn)有效的多組學(xué)集成。MOGONET 是第一個(gè)利用 GCNs 進(jìn)行組學(xué)數(shù)據(jù)學(xué)習(xí),對(duì)新樣本進(jìn)行有效類(lèi)別預(yù)測(cè)的有監(jiān)督的多組學(xué)集成方法。我們通過(guò)廣泛的生物醫(yī)學(xué)分類(lèi)應(yīng)用,包括阿爾茨海默病患者分類(lèi),低級(jí)別膠質(zhì)瘤(LGG)的腫瘤分級(jí)分類(lèi),腎癌類(lèi)型分類(lèi)和乳腺浸潤(rùn)癌亞型分類(lèi),證明了 MOGONET 的能力和多功能性。我們還通過(guò)綜合的消融研究,說(shuō)明了整合多種組學(xué)數(shù)據(jù)類(lèi)型的必要性,以及將 GCN 和 VCDN 結(jié)合起來(lái)進(jìn)行多組學(xué)數(shù)據(jù)分類(lèi)的重要性。此外,我們證明 MOGONET 可以識(shí)別與所研究的生物醫(yī)學(xué)問(wèn)題相關(guān)的重要組學(xué)特征和生物標(biāo)志物。


image.png

比如能利用三種組學(xué)數(shù)據(jù)(即 mRNA 表達(dá)數(shù)據(jù)、 DNA 甲基化數(shù)據(jù)和 miRNA 表達(dá)數(shù)據(jù))進(jìn)行分類(lèi),以提供關(guān)于疾病的全面和互補(bǔ)的信息
txWang/MOGONET: MOGONET (Multi-Omics Graph cOnvolutional NETworks) is a novel multi-omics data integrative analysis framework for classification tasks in biomedical applications. (github.com)

Single-cell multiomics: technologies and data analysis methods

單細(xì)胞多組學(xué)分析的基本特征包括: (1)用于單細(xì)胞分離,條形碼和測(cè)序的技術(shù),以測(cè)量來(lái)自單個(gè)細(xì)胞的多種類(lèi)型的分子; (2)分子的綜合分析,以表征基于分子標(biāo)記的細(xì)胞類(lèi)型及其關(guān)于病理生理過(guò)程的功能。在這里,我們總結(jié)了單細(xì)胞多組學(xué)分析(mRNA 基因組,mRNA-DNA 甲基化,mRNA 染色質(zhì)可及性和 mRNA-蛋白質(zhì))的技術(shù)以及單細(xì)胞多組學(xué)數(shù)據(jù)的綜合分析方法。

20年的文章,可能有點(diǎn)老了?(感覺(jué)分析方法應(yīng)該是的,技術(shù)上還不清楚)

image.png

為了對(duì)單細(xì)胞多組學(xué)數(shù)據(jù)進(jìn)行綜合分析,對(duì)單細(xì)胞單組學(xué)數(shù)據(jù)的處理方法進(jìn)行了擴(kuò)展和組合。這些策略可以分類(lèi)為(1)單細(xì)胞單組學(xué)數(shù)據(jù)之間的相關(guān)性分析(圖5a) ; (2)一種類(lèi)型的單細(xì)胞數(shù)據(jù)(例如 scRNA-seq)的分析,然后整合另一種單細(xì)胞數(shù)據(jù)類(lèi)型(例如來(lái)自 scWGS 的 SNV 或來(lái)自 scATAC-seq 的開(kāi)放染色質(zhì)位點(diǎn))(圖5b) ; 和(3)所有類(lèi)型的單細(xì)胞組學(xué)數(shù)據(jù)的綜合分析以產(chǎn)生整體單細(xì)胞圖(例如,細(xì)胞群體或分化軌跡)(圖5c)。


image.png

Using machine learning approaches for multi-omics data analysis: A review

image.png

Concatenation-based 的集成方法考慮使用由多個(gè)組學(xué)數(shù)據(jù)集合構(gòu)成的聯(lián)合數(shù)據(jù)矩陣來(lái)開(kāi)發(fā)模型。圖2顯示了Concatenation-based 的集成的階段。第一階段包括來(lái)自三個(gè)獨(dú)立組學(xué)(如基因組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))的原始數(shù)據(jù)以及相應(yīng)的表型信息。通常,Concatenation-based 集成不需要任何預(yù)處理,因此沒(méi)有第2階段。在第三階段,來(lái)自個(gè)體組學(xué)的數(shù)據(jù)被連接起來(lái),形成一個(gè)單一的大型多組學(xué)數(shù)據(jù)矩陣。最后,在第四階段,聯(lián)合矩陣用于監(jiān)督或非監(jiān)督分析。使用Concatenation-based 的方法的主要優(yōu)點(diǎn)是,一旦所有個(gè)體組學(xué)的Concatenation完成,使用機(jī)器學(xué)習(xí)進(jìn)行回歸或分類(lèi)就比較簡(jiǎn)單。這些方法平等地使用所有的連接特征,并且可以為給定的表型選擇最有區(qū)別的特征。

Model-based 的集成方法為不同的組學(xué)數(shù)據(jù)創(chuàng)建多個(gè)中間模型,然后從不同的中間模型構(gòu)建最終模型(圖2)。第一階段建立三個(gè)獨(dú)立組學(xué)的原始數(shù)據(jù)以及相應(yīng)的表型信息。在第二階段,為每個(gè)組學(xué)開(kāi)發(fā)單獨(dú)的模型,然后在第三階段將其集成到一個(gè)聯(lián)合模型中。最后,對(duì)第四階段的關(guān)節(jié)模型進(jìn)行了分析?;谀P偷恼戏椒ǖ闹饕獌?yōu)勢(shì)在于它們可以用于基于不同組學(xué)類(lèi)型的合并模型,其中每個(gè)模型都是從具有相同疾病信息的不同患者組開(kāi)發(fā)的。
Model-based 的整合方法有助于理解不同組學(xué)之間對(duì)某一表型的相互作用(例如,在胰腺癌中的生存)。第四階段的最終多維關(guān)節(jié)模型可以使用 ML 算法(例如神經(jīng)網(wǎng)絡(luò))建立,該算法使用每個(gè)組學(xué)模型(第三階段)中最相關(guān)的變量。這種方法可以分析個(gè)別模型的預(yù)測(cè)能力的改善,并找到最佳的區(qū)分特征。

Transformation-based 的集成方法首先將組學(xué)數(shù)據(jù)集轉(zhuǎn)換為圖形或核矩陣,然后將其組合成一個(gè)模型。圖2顯示了Transformation-based 的集成的各個(gè)階段。第一階段建立三個(gè)個(gè)體組學(xué)的原始數(shù)據(jù)以及相應(yīng)的表型信息。在第二階段,為為獨(dú)立組學(xué)開(kāi)發(fā)轉(zhuǎn)換方法(以圖形或核關(guān)系的形式),這些組學(xué)后來(lái)被整合到第三階段的聯(lián)合轉(zhuǎn)換中。最后,在第四階段進(jìn)行了分析。Transformation-based的集成方法的主要優(yōu)點(diǎn)是,如果可以獲得獨(dú)特的信息(如患者 ID) ,則可以使用它們來(lái)組合各種組學(xué)。

圖形提供了一種形式化的手段來(lái)轉(zhuǎn)換和描述不同組學(xué)樣本之間的關(guān)系,其中圖形的節(jié)點(diǎn)和邊分別表示主題及其關(guān)系。類(lèi)似地,核方法能夠?qū)?shù)據(jù)從其原始空間轉(zhuǎn)換為更高維的特征空間。然后,這些方法在特征空間中探索線(xiàn)性決策函數(shù),但這些函數(shù)在原始空間中是非線(xiàn)性的。

image.png
image.png

注: 其實(shí)可以看出第三種方法正在越來(lái)越多

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容