今天給小朋友數(shù)據(jù)可視化工具時候,發(fā)現(xiàn)國內(nèi)很多人開發(fā)出來數(shù)據(jù)可視化平臺,可以滿足許多數(shù)據(jù)可視化需要。想著干脆整了一個目錄貼。簡單記錄下來,幾個我不時會看到的,都是非常漂亮的工作,相信也解決了非常多人的數(shù)據(jù)可視化問題。值得好好學(xué)習(xí)一波。
Visual Omics

Visual Omics: a web-based platform for omics data analysis and visualization with rich graph-tuning capabilities
發(fā)表在 Bioinformatics 期刊上,2023年見刊,約等于新鮮出爐~
解決的問題:R包輸出的圖片都是靜態(tài)的,固定的,不可編輯的,為此作者團隊開發(fā)了一個用于組學(xué)數(shù)據(jù)分析和科學(xué)圖表編輯的在線工具。集成了多種組學(xué)分析,包括差異表達分析、富集分析、蛋白結(jié)構(gòu)域預(yù)測和蛋白質(zhì)相互作用分析,并提供了豐富的圖形展示。它還可以獨立繪制和自定義在組學(xué)分析中常見的基礎(chǔ)圖表,如各種PCA/PCoA圖、條形圖、箱線圖、熱力圖、集合交集圖、氣泡圖和火山圖等。

從實現(xiàn)邏輯來猜測,重點使用了 ggplot2 進行數(shù)據(jù)可視化。是一個不錯的工作,支持了大量分析,開放了許多參數(shù)。

Image GP
ImageGP: An easy‐to‐use data visualization web server for scientific researchers

ImageGP 發(fā)表在 iMeta 期刊,相信在發(fā)表之前就很多人了解過這個平臺。目前發(fā)表一年多,積累引用>100次,實際被引不確定。
解決的問題:ImageGP是一個專為生物學(xué)和化學(xué)數(shù)據(jù)可視化而設(shè)計的專業(yè)平臺。ImageGP可以在用戶友好的界面中生成常見的線條、柱狀圖、散點圖、箱線圖、集合圖、熱力圖和直方圖等廣義圖表,以最常見的輸入內(nèi)容為基礎(chǔ)。
ImageGP提供了高達26個參數(shù),以滿足定制化需求。ImageGP還包含了專門的圖表,如火山圖、功能富集圖,用于大多數(shù)組學(xué)數(shù)據(jù)分析,以及其他四個專門用于微生物組分析的功能。

文稿介紹相對簡單,不過不影響這個平臺被廣泛使用。
Hiplot
Hiplot: a comprehensive and easy-to-use web service for boosting publication-ready biomedical data visualization

Hiplot 發(fā)表于 Briefings in Bioinformatics,是我了解到做得比較成熟,目前也廣為人知的平臺。由于這個平臺是社區(qū)驅(qū)動,文稿上標注了 Hiplot Consortium。這個比較有意思。

圖稿顯示很詳細,后臺主要以 R shiny 為主。我與劍鋒有聊過兩三句話(當時我正好在做 TBtools-II 的插件模式,在健明的引薦下微信認識)。Hiplot 這個平臺做得非常成功,當然投稿不順利確實復(fù)雜。不過,就我個人的認知而言,這個平臺可能是最為成熟,或許支持的數(shù)據(jù)可視化類型也最多。此外,Hiplot 有企業(yè)支持,這或許是一個小小助力。相比于單打獨斗,沒有物質(zhì)支持的平臺,有得到支持的工作,往往會更為成熟,同時也好用?;蛟S有必要再貼一張圖。

還是必須再說一句,做得真是精巧~ 非常值得學(xué)習(xí)。
OmicsSuite
OmicsSuite: a customized and pipelined suite for analysis and visualization of multi-omics big data

OmicsSuite 發(fā)表于 Horticulture Research 期刊。事實上如果發(fā)表在其他期刊可能我就看不到,畢竟是園藝方向期刊。
解決的問題:文稿中強調(diào)了本地化的意義,這個我個人完全贊同。整體功能接近 Hiplot 的 stand-alone 版,類似的支持了大量數(shù)據(jù)可視化。

我覺得這對于網(wǎng)絡(luò)環(huán)境不太好的朋友,值得關(guān)注下子。Hiplot 我記得也有本地版本,不過我個人認知 Hiplot 的本地版主要指作為一個瀏覽器替代。留意到作者列表,Hiplot 和 OmicsSuite 的作者列表有重疊。這個比較有趣。
OmicsStudio
OmicStudio: A composable bioinformatics cloud platform with real‐time feedback that can generate high‐quality graphs for publication

解決的問題:一個詞組:云平臺。與 Visual Omics 屬于一類。發(fā)表單位是“聯(lián)川生物”。事實上,這個平臺我記得起步比較晚,不過現(xiàn)在用戶相信也很多,同時也發(fā)表出來了。支持了許多分析,我沒有使用過。不過相信有公司經(jīng)費支持,一般都可以維護得相對較好。

SangerBox
Sangerbox: A comprehensive, interaction‐friendly clinical bioinformatics analysis platform

解決的問題:同樣是一個詞組:云平臺。SangerBox 我有大體了解。早期與 TBtools 類似,開發(fā)的是本地軟件,重點關(guān)注了醫(yī)學(xué)方面數(shù)據(jù)分析,印象還組織過一些培訓(xùn)。我與開發(fā)團隊中的某一兩人有聊過兩三句。后來似乎就全部上云了。相信現(xiàn)在做得也很好。發(fā)表了這份工作。

寫在最后
或許有時間的話,我會一個一個體驗一波。不過我們已經(jīng)可以發(fā)現(xiàn),現(xiàn)在的生物信息學(xué)數(shù)據(jù)可視化,重度依賴 R 語言。換句話說,要做好數(shù)據(jù)分析可視化,必須學(xué)好 R 語言,至于后續(xù)開發(fā)平臺,大多數(shù)時候,可以直接寫 R ShinyApp。至于 Python,在統(tǒng)計數(shù)據(jù)可視化上,距離 R 語言還是有一些距離。
有個事情說來有趣,我翻了下作者團隊列表,發(fā)現(xiàn)我跟每一個工作中至少一個作者都有聊過(第一個無法確定),當然都只是說過一兩句話的狀態(tài)。類似的工作,我審過不少,其中大多數(shù)是見刊的,畢竟我知道,真的不容易,所以要么給大修,要么就小修。
開發(fā)數(shù)據(jù)分析平臺,并非一個簡單的整合過程。
「好的工具解決我們眼前的問題,不然我們根本沒時間想以后得問題」。