用 Superset 和 Druid 快速打造實時數(shù)據(jù)分析看板

Apache Superset是一款開源的企業(yè)級數(shù)據(jù)可視化和探索平臺。它具有直觀的界面,豐富的圖表與儀表盤類型,并支持大規(guī)模數(shù)據(jù)集,方便進(jìn)行實時分析與探索。Apache Druid是一款高性能、分布式、低延遲的OLAP數(shù)據(jù)存儲方案。它適用于數(shù)據(jù)探查和快速數(shù)據(jù)摘要等場景,能輕松應(yīng)對PB級數(shù)據(jù)。


Screenshot 2023-04-21 at 10.59.51 PM.png

本文將介紹如何結(jié)合Superset和Druid這兩個優(yōu)秀的開源軟件,快速搭建一個實時數(shù)據(jù)分析看板應(yīng)用。將二者整合,我們可以輕松實現(xiàn)一個幫助企業(yè)快速監(jiān)控數(shù)據(jù)、獲得數(shù)據(jù)洞察的智能平臺。

一、環(huán)境準(zhǔn)備

  1. 安裝 Druid,安裝和配置Superset
    安裝步驟省略,可自行搜索。

  2. 添加 Druid 數(shù)據(jù)源

  • 登錄Superset, 選擇“數(shù)據(jù)源”菜單
  • 點擊“+ 數(shù)據(jù)源”按鈕,選擇“Druid”數(shù)據(jù)源類型
  • 填寫Druid數(shù)據(jù)源相關(guān)信息:
    • 名稱: Druid數(shù)據(jù)源名稱, 如test_druid
    • 主機: Druid Broker主機IP/域名
    • 端口:Druid Broker服務(wù)端口,默認(rèn)為8082
    • 點擊“保存”按鈕,Druid數(shù)據(jù)源添加成功!

二、構(gòu)建Druid數(shù)據(jù)表和查詢

  1. 登錄Druid Console, 構(gòu)建數(shù)據(jù)表
    在Druid Console通過上傳數(shù)據(jù)文件或提供數(shù)據(jù)流的方式創(chuàng)建數(shù)據(jù)表

  2. 定義復(fù)雜的查詢
    Druid支持豐富的查詢類型, 如GroupBy、TopN、Timeseries等...(查詢語法示例)

{
  "queryType": "groupBy",
  "dataSource": "wikiticker", 
  "granularity": "all",
  "dimensions": ["page","country"],
  "aggregations": {
    "count": "count"
  },
  "intervals": [
    "2020-01-01/2020-01-02"
  ] 
}
  • queryType:指定GroupBy查詢類型
  • dataSource:查詢的數(shù)據(jù)源
  • granularity:聚合粒度,all表示全量數(shù)據(jù)
  • dimensions:分組維度
  • aggregations:聚合指標(biāo),這里使用count計數(shù)
  • intervals:時間范圍
    該查詢會按page和country兩個維度對wikiticker數(shù)據(jù)源在2020-01-01至2020-01-02的所有數(shù)據(jù)進(jìn)行分組,并統(tǒng)計每個分組的記錄數(shù)。
    Druid通過簡潔的JSON配置支持構(gòu)建復(fù)雜的分組、TopN、時間序列等聚合查詢。

三、在 Superset 中創(chuàng)建報表

  1. 新建Druid表格視圖
    在Superset中,我們需要創(chuàng)建表格視圖來顯示Druid數(shù)據(jù)集的數(shù)據(jù)。新建Druid表格視圖的步驟如下:
  • 選擇數(shù)據(jù)源為我們之前添加的Druid數(shù)據(jù)源test_druid
  • 選擇“Druid數(shù)據(jù)集”,這會拉取Druid Console中已有的數(shù)據(jù)集列表
  • 選擇要查詢的Druid數(shù)據(jù)集,比如wikiticker
  • 選擇要查詢的時間范圍,可選擇最近1小時、1天、1周、1月或自定義時間范圍
  • 選擇要使用的查詢類型,包括Timeseries、TopN、GroupBy等
  • 根據(jù)所選查詢類型配置對應(yīng)的參數(shù),如分組維度、聚合指標(biāo)等
  • 點擊“引入表格”按鈕,表格視圖創(chuàng)建成功
  1. 使用多種圖表類型可視化數(shù)據(jù)
    在新建的表格視圖上,點擊工具欄的“創(chuàng)建圖表”按鈕,選擇要使用的圖表類型,即可將查詢結(jié)果以圖表形式進(jìn)行可視化展示。

Superset支持線圖、柱狀圖、散點圖、地圖、盒形圖等多種圖表類型,選擇合適的可視化形式。

  1. 構(gòu)建實時數(shù)據(jù)看板
    將創(chuàng)建好的多個圖表和文本框拖動到儀表盤,設(shè)置自動刷新間隔,即可以實現(xiàn)一個實時數(shù)據(jù)監(jiān)控看板。
    步驟如下:
  • 點擊左側(cè)“儀表盤”菜單, 選擇“新建儀表盤”
  • 輸入儀表盤名稱, 選擇布局樣式, 點擊“保存”
  • 添加文本框、圖像等組件進(jìn)行裝飾(可選)
  • 將創(chuàng)建好的圖表從左側(cè)的可用內(nèi)容拖動到儀表盤 Grid 空間中
  • 點擊添加到儀表盤的圖表,在右側(cè)設(shè)置面板中設(shè)置自動刷新間隔(如每1分鐘)
  • 回到儀表盤界面, 點擊右上方“保存并進(jìn)入編輯模式”按鈕
  • 調(diào)整組件大小和位置, 美化儀表盤整體樣式
  • 點擊右上方“保存”按鈕, 實時數(shù)據(jù)看板創(chuàng)建成功!

四、總結(jié)
通過 Superset 和 Druid,我們實現(xiàn)了一個實時數(shù)據(jù)分析看板應(yīng)用。Druid提供實時和歷史數(shù)據(jù)的存儲與查詢,Superset通過豐富的可視化手段, 將Druid查詢結(jié)果呈現(xiàn)直觀的網(wǎng)頁報表和儀表盤。

寫作是一個學(xué)習(xí)和思考的過程, 我也會不斷總結(jié)與改進(jìn)。謝謝閱讀,如果你對文章中的內(nèi)容有疑惑,歡迎點擊我頭像,看我個人介紹,與我取得聯(lián)系,謝謝~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容