KAP v2.5新特性之智能化的建模

為什么企業(yè)需要快速建模的能力?

數(shù)據(jù)倉庫作為一種數(shù)據(jù)環(huán)境,具有面向分析、提供管理決策支持的重要作用。而在數(shù)據(jù)倉庫中,多維數(shù)據(jù)模型能夠滿足大多數(shù)企業(yè)的數(shù)據(jù)分析需求——它提供了多角度多層次的分析應(yīng)用,比如基于時(shí)間維度、地域維度等構(gòu)建的銷售星形模型、雪花模型,可以實(shí)現(xiàn)在各時(shí)間維度和地域維度的交叉查詢,以及基于時(shí)間維度和地域維度的細(xì)分。

傳統(tǒng)的多維模型建模,具有冗長而復(fù)雜的特點(diǎn)。首先要選擇業(yè)務(wù)過程,其次聲明數(shù)據(jù)粒度,之后確定維度字段和事實(shí)字段。其中,由于業(yè)務(wù)過程是由很多微觀的業(yè)務(wù)活動組成的,比如注冊用戶、獲得訂單、開具發(fā)票、接受付款、處理索賠等等。因此,建模人員需要耗費(fèi)大量時(shí)間去理解和組織業(yè)務(wù)活動,這樣創(chuàng)建的模型最終才能回答業(yè)務(wù)分析的具體問題,為管理決策提供權(quán)威的數(shù)據(jù)支持。

而在當(dāng)前的信息時(shí)代,業(yè)務(wù)的快速反應(yīng)能力決定了很多企業(yè)能否把握準(zhǔn)確的時(shí)機(jī),甚至決定了很多企業(yè)在關(guān)鍵時(shí)刻的生死存亡。比如零售行業(yè),尤其是電商方向的企業(yè),管理決策層需要關(guān)注引起利潤變化的因素并迅速調(diào)整的營銷策略。因此,快速建模或者調(diào)整數(shù)據(jù)模型才可以支持這類的業(yè)務(wù)快速反應(yīng)能力

KAP 支持業(yè)務(wù)的快速反應(yīng)

KAP 支持標(biāo)準(zhǔn)SQL接口,通過JDBC和ODBC無縫對接主流BI產(chǎn)品,完全匹配商業(yè)分析師熟悉的分析模式。分析師無需了解大數(shù)據(jù)底層架構(gòu),可以在海量大數(shù)據(jù)上進(jìn)行交互式的分析,釋放了大數(shù)據(jù)生產(chǎn)力。

不同的企業(yè)中,常用的業(yè)務(wù)分析問題是基本固定的,比如零售行業(yè)的常見問題“同樣的營銷模式下,不同渠道的利潤差別有多大?”。而這些常用的業(yè)務(wù)分析問題都已經(jīng)轉(zhuǎn)化為固定的的查詢報(bào)表、成體系的SQL查詢語句或者商業(yè)分析師相對穩(wěn)定的查詢模式。

KAP v2.5支持自動創(chuàng)建合適的模型,減少了建模人員了解業(yè)務(wù)細(xì)節(jié)的時(shí)間成本,消除了建模人員與業(yè)務(wù)人員的磨合成本,大大增加了企業(yè)的快速反應(yīng)能力。

KAP v2.5的自動建模之路

具體來說,KAP v2.5 增強(qiáng)了智能化的建模,模型推薦支持通過SQL自動生成模型,Cube優(yōu)化器支持多種存儲優(yōu)化策略。另外,新增了通過SQL驗(yàn)證模型的能力,支持對業(yè)務(wù)分析需求變化的快速響應(yīng)。

模型推薦

模型從無到有的部分,最考驗(yàn)建模人員對業(yè)務(wù)邏輯和查詢需求的理解。傳統(tǒng)多維模型的建模耗時(shí)耗力,而且對最終所創(chuàng)建的模型是否能回答業(yè)務(wù)查詢無法保證。KAP v2.5支持通過SQL自動生成模型。導(dǎo)入源表后,即可通過輸入SQL自動創(chuàng)建模型,實(shí)現(xiàn)了從SQL到模型的一鍵生成。以查詢SQL為依據(jù),自動生成的模型可以準(zhǔn)確的回答這些查詢SQL。

多策略的Cube優(yōu)化器

Cube是數(shù)據(jù)倉庫中一個經(jīng)典的概念,是多維模型的一個形象的說法。傳統(tǒng)OLAP 技術(shù)下,Cube雖然能存儲大量維度,但隨著維度增加, Cube所需要的存儲空間也會呈幾何倍數(shù)增長。比如一個Cube中包含了N個維度,那么這N個維度將生成2N 個維度組合。這些成倍增長的維度組合中,有很多在整個Cube的生命周期里都不會被使用,同時(shí)由于維度組合數(shù)爆炸而帶來的存儲膨脹、構(gòu)建時(shí)間冗長、甚至查詢性能由此而下降的弊病。

為了解決這個問題 KAP 提供了多種場景下,對Cube的優(yōu)化設(shè)置,幫助用戶篩選出真正會被使用到的 Cube維度組合,避免大量存儲資源被無效的維度組合耗用,縮短構(gòu)建時(shí)間。優(yōu)化設(shè)置包括衍生維度、聚合組、聯(lián)合維度、層級維度、必要維度和Rowkey等。

結(jié)合不同的業(yè)務(wù)場景,合理的使用這些優(yōu)化設(shè)置能夠使數(shù)據(jù)建模事半功倍。根據(jù)這些優(yōu)化設(shè)置的方法,商業(yè)分析師可以定制精確滿足業(yè)務(wù)場景的Cube,避免Cube爆炸的問題。

Cube優(yōu)化器提供了多種優(yōu)化策略來滿足不同的業(yè)務(wù)場景, 其中模型優(yōu)先策略,充分利用數(shù)據(jù)自身的邏輯關(guān)系優(yōu)化Cube,滿足靈活查詢場景;業(yè)務(wù)優(yōu)先策略,定向加速指定SQL,用最小的存儲成本支持常見的報(bào)表查詢模式;綜合優(yōu)化策略,支持以上兩種需求,滿足了多種優(yōu)化場景。

快速驗(yàn)證SQL

同樣,在傳統(tǒng)的OLAP 技術(shù)下,數(shù)據(jù)模型需要在構(gòu)建后才能得到驗(yàn)證。每一次模型從設(shè)計(jì)到驗(yàn)證,需要付出很大的時(shí)間成本與資源代價(jià),滯后的模型設(shè)計(jì)反饋難以滿足當(dāng)前快節(jié)奏的市場變化。

KAP v2.5支持的快速驗(yàn)證能力,極大地加速了模型反饋。無需構(gòu)建,建模后即可快速驗(yàn)證模型是否滿足業(yè)務(wù)查詢SQL,快速響應(yīng)業(yè)務(wù)分析需求變化。

總結(jié)

在當(dāng)前的信息時(shí)代,業(yè)務(wù)的快速反應(yīng)能力決定了很多企業(yè)能否把握準(zhǔn)確的時(shí)機(jī),KAP致力于幫助更多企業(yè)把握時(shí)機(jī),通過支持以SQL為中心的自動建模,支持模型設(shè)計(jì)快速驗(yàn)證,以響應(yīng)瞬息萬變的市場需求,實(shí)現(xiàn)更多企業(yè)的商業(yè)價(jià)值與使命。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容