OLAP簡介

OLAP簡介


摘要

druid對于做大數(shù)據(jù)的同學(xué)們來說,并不陌生。我之前也研究過很多OLAP的框架,最近研究了一下最新版的druid(0.9.1.1), 想和大家在此分享一下,和大家一起學(xué)習(xí)進(jìn)步。對于沒有接觸過BI和數(shù)據(jù)分析的同學(xué),先給大家簡單介紹一下OLAP,作為入門。

什么是OLAP(聯(lián)機(jī)分析處理)

這個(gè)是和數(shù)據(jù)處理非常相關(guān)的一個(gè)概念。接觸過BI(商務(wù)智能的同學(xué)一定清楚。數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機(jī)事務(wù)處理OLTP(on-line transaction processing)、聯(lián)機(jī)分析處理OLAP(On-Line Analytical Processing); OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。通俗的講,就是對數(shù)據(jù)的增刪改查等操作。 OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。通俗的講,就是對數(shù)據(jù)按不同維度的聚合,維度的上鉆,下卷等。

OLAP可以分為ROLAP,MOLAP和HOLAP

  • ROLAP: 使用關(guān)系型數(shù)據(jù)庫或者擴(kuò)展的關(guān)系型數(shù)據(jù)庫來管理數(shù)據(jù)倉庫數(shù)據(jù),而OLAP中間件支持其余的功能。ROLAP包含了每個(gè)后端關(guān)系型數(shù)據(jù)庫的優(yōu)化,聚合,維度操作邏輯的實(shí)現(xiàn),附件的工具以及服務(wù)等。所以ROLAP比MOLAP有更好的可伸縮性。 比較典型的ROLAP有mondrian, Presto(facebook)。目前阿里的DRDS也可以看作是ROLAP的框架

  • MOLAP: 通過基于數(shù)據(jù)立方體的多位存儲引擎,支持?jǐn)?shù)據(jù)的多位視圖。即通過將多維視圖直接映射到數(shù)據(jù)立方體上,使用數(shù)據(jù)立方體能夠?qū)㈩A(yù)計(jì)算的匯總數(shù)據(jù)快速索引。比較典型的MOLAP框架有kylin(apache), Lylin(ebay)、pinot(linkedin)和druid

也就是說MOLAP是空間換時(shí)間,即把所有的分析情況都物化為物理表或者視圖,查詢的時(shí)候直接從相應(yīng)的物化表中獲取數(shù)據(jù), 而ROLAP則通過按維度分庫,分表等方式,實(shí)現(xiàn)單一維度下的快速查詢,通過分布式框架,并行完成分析任務(wù),來實(shí)現(xiàn)數(shù)據(jù)的分析功能。MOLAP 實(shí)現(xiàn)較簡單,但當(dāng)分析的維度很多時(shí),數(shù)據(jù)量呈指數(shù)增長,而ROLAP在技術(shù)實(shí)現(xiàn)上要求更高,但擴(kuò)展性也較好。

  • HOLAP: 混合OLAP結(jié)合ROLAP和MOLAP,得益于ROLAP較大的可伸縮性和MOLAP的快速查詢。

更多的關(guān)于OLAP的知識,推介大家看機(jī)械工業(yè)出版社出版的《數(shù)據(jù)挖掘-概念與技術(shù)》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容