指標(biāo)管理體系設(shè)計

引言

指標(biāo)作為業(yè)務(wù)和數(shù)據(jù)的結(jié)合,是數(shù)據(jù)統(tǒng)計的基礎(chǔ),也是量化業(yè)務(wù)效果的依據(jù)。如何避免指標(biāo)統(tǒng)計使用過程中出現(xiàn)的指標(biāo)名稱混亂,指標(biāo)不唯一?同時做好數(shù)據(jù)有序地和有結(jié)構(gòu)地分類組織和存儲,避免底層數(shù)據(jù)的重復(fù)建設(shè),數(shù)據(jù)統(tǒng)計來源的不唯一。本文重點(diǎn)介紹了如何根據(jù)業(yè)務(wù)過程來定義原子指標(biāo),根據(jù)原子指標(biāo)和修飾詞的結(jié)合來定義相關(guān)派生指標(biāo),同時做好指標(biāo)的規(guī)范命名。

1、背景介紹

指標(biāo)是指將業(yè)務(wù)單元細(xì)分后量化的度量值,它使得業(yè)務(wù)目標(biāo)可描述、可度量、可拆解。而指標(biāo)體系的搭建是最為重要的,將直接影響「產(chǎn)生→處理→存儲→計算→應(yīng)用」的全流程。而在實(shí)際的使用過程中出現(xiàn)了以下問題:① 對于同一業(yè)務(wù)場景,各部門會用不同的指標(biāo)來衡量;② 對于同一指標(biāo)的計算,不同的時間點(diǎn)去統(tǒng)計,統(tǒng)計來源和方式會有差異。

具體來說,要做到以下幾點(diǎn):1)規(guī)范維度和量度命名,確保唯一性,命名規(guī)則要盡量做到明確、通用、易懂;2)對確認(rèn)維度或量度,統(tǒng)一計算口徑,避免歧義;3)涵蓋盡可能多的核心維度和量度,以此為基礎(chǔ)推動數(shù)據(jù)建設(shè),確保指標(biāo)字典里覆蓋的維度都可區(qū)分,指標(biāo)都可統(tǒng)計;4)基于指標(biāo)字典,將核心維度和量度注入元數(shù)據(jù)中心,接入指標(biāo)提取工具,后續(xù)實(shí)現(xiàn)不需要寫sql即可完成自助查詢及分析需求,搭建數(shù)據(jù)自助分析的基礎(chǔ)。

因此要提供標(biāo)準(zhǔn)化的、共享的、數(shù)據(jù)服務(wù)能力,降低數(shù)據(jù)互通成本,釋放計算、存儲、人力等資源,以消除業(yè)務(wù)和技術(shù)之痛。數(shù)據(jù)體系架構(gòu)如下:

業(yè)務(wù)板塊:如果業(yè)務(wù)產(chǎn)品比較多,且彼此之間的指標(biāo)或者重疊性比較少的,可單獨(dú)分開。

規(guī)范定義:設(shè)計出一套數(shù)據(jù)規(guī)范的命名體系。

模型設(shè)計:以維度建模理論為基礎(chǔ),基于維度建模總線架構(gòu),構(gòu)建一致性的維度和事實(shí)。

數(shù)據(jù)體系架構(gòu)

2 指標(biāo)的規(guī)范定義

指標(biāo)的規(guī)范定義,以維度建模作為理論基礎(chǔ),構(gòu)建總線矩陣,劃分和定義數(shù)據(jù)域、業(yè)務(wù)過程、維度、度量/原子指標(biāo)、修飾類型、修飾詞、時間周期、派生指標(biāo)等。

指標(biāo)的規(guī)范定義

①數(shù)據(jù)域

指面向業(yè)務(wù)分析,將業(yè)務(wù)過程或者維度進(jìn)行抽象的集合。其中,業(yè)務(wù)過程可以概括為一個個不拆分的行為事件,在業(yè)務(wù)過程之下,可以定義指標(biāo);維度,是度量的環(huán)境,如買家下單事件,買家是維度。為了保障整個體系的生命力,數(shù)據(jù)域是需要抽象提煉,并且長期維護(hù)更新的,但不輕易變動。

②業(yè)務(wù)過程

指企業(yè)的業(yè)務(wù)活動事件,如,下單、支付、退款都是業(yè)務(wù)過程。其中,業(yè)務(wù)過程不可拆分。

③時間周期

用來明確統(tǒng)計的時間范圍或者時間點(diǎn),如最近30天、自然周、截止當(dāng)日等。

④修飾類型

是對修飾詞的一種抽象劃分。修飾類型從屬于某個業(yè)務(wù)域,如日志域的訪問終端類型涵蓋無線端、PC端等修飾詞。

⑤修飾詞

指的是統(tǒng)計維度以外指標(biāo)的業(yè)務(wù)場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞無線端、PC端等。

⑥度量/原子指標(biāo)

原子指標(biāo)和度量含義相同,基于某一業(yè)務(wù)事件行為下的度量,是業(yè)務(wù)定義中不可再拆分的指標(biāo),具有明確業(yè)務(wù)含義的名稱,如支付金額。

⑦維度

維度是度量的環(huán)境,用來反映業(yè)務(wù)的一類屬性,這類屬性的集合構(gòu)成一個維度,也可以稱為實(shí)體對象。維度屬于一個數(shù)據(jù)域,如地理維度(其中包括國家、地區(qū)、省市等)、時間維度(其中包括年、季、月、周、日等級別內(nèi)容)。

⑧維度屬性

維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。

⑨派生指標(biāo)

派生指標(biāo)=1個原子指標(biāo)+多個修飾詞(可選)+時間周期??梢岳斫鉃樵又笜?biāo)業(yè)務(wù)統(tǒng)計范圍的圈定。如原子指標(biāo):支付金額,最近1天海外買家支付金額則為派生指標(biāo)。

派生指標(biāo)又分以下三種類型:

事務(wù)型指標(biāo):是指對業(yè)務(wù)活動進(jìn)行衡量的指標(biāo)。例如,新增注冊會員數(shù)、訂單支付金額,這類指標(biāo)需要維護(hù)原子指標(biāo)以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo)。

存量型指標(biāo):是指對實(shí)體對象(如商品、會員)某些狀態(tài)的統(tǒng)計,例如商品總數(shù)、注冊會員總數(shù),這類指標(biāo)需要維護(hù)原子指標(biāo)以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo),對應(yīng)的時間周期一般為“歷史截止當(dāng)前某個時間”。

復(fù)合型指標(biāo):是在事務(wù)性指標(biāo)和存量型指標(biāo)的基礎(chǔ)上復(fù)合成的。例如,瀏覽UV-下單買家數(shù)轉(zhuǎn)化率。復(fù)合型指標(biāo)的規(guī)則:

比率型:創(chuàng)建原子指標(biāo),如CTR、瀏覽UV-下單買家數(shù)轉(zhuǎn)化率、滿意率等。例如,“最近1天店鋪首頁CTR”,原子指標(biāo)為“CTR”,時間周期為“最近1天”,修飾類型為“頁面類型”,修飾詞為“店鋪首頁”。

比例型:創(chuàng)建原子指標(biāo),如百分比、占比。例如,“最近1天無線支付金額占比”,原子指標(biāo)為“支付金額占比”,修飾類型為“終端類型”,修飾詞為“無線”。

變化量型:不創(chuàng)建原子指標(biāo),增加修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo)。例如,“最近1天訂單支付金額上1天變化量”,原子指標(biāo)為“訂單支付金額”, 時間周期為“最近1天”,修飾類型為“統(tǒng)計方法”,修飾詞為“上1天變化量”。

變化率型:創(chuàng)建原子指標(biāo),例如,“最近7天海外買家支付金額上7天變化率”,原子指標(biāo)為“支付金額變化率”,修飾類型為“買家地域”,修飾詞為“海外買家”。

統(tǒng)計型(均值、分位數(shù)等):不創(chuàng)建原子指標(biāo),增加修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo);在修飾類型“統(tǒng)計方法”下增加修飾詞,如人均、日均、行業(yè)平均等。例如,“自然月日均UV”,原子指標(biāo)為 “UV”,修飾類型為“統(tǒng)計方法”,修飾詞為“日均”。

3 指標(biāo)管理的功能實(shí)現(xiàn)

為了實(shí)現(xiàn)指標(biāo)管理,需考慮的底層信息:

指標(biāo)管理功能設(shè)計

部分前臺界面展示:

原子指標(biāo)功能界面

派生指標(biāo)功能界面

4 數(shù)據(jù)的使用框架

在對指標(biāo)進(jìn)行規(guī)范定義與管理的基礎(chǔ)上,可以此推動底層事實(shí)表以及維表的建設(shè),保證數(shù)據(jù)統(tǒng)計的數(shù)據(jù)源唯一以及計算口徑統(tǒng)一。同時,通過指標(biāo)和修飾詞的結(jié)合,便于業(yè)務(wù)人員進(jìn)行自助分析與使用數(shù)據(jù),降低數(shù)據(jù)獲取的效率,從而產(chǎn)生有價值的結(jié)論,輔助決策,充分發(fā)揮數(shù)據(jù)的價值。

數(shù)據(jù)分析使用框架

總結(jié)

本文總結(jié)了如何基于業(yè)務(wù)來劃分業(yè)務(wù)過程,從而涉及對應(yīng)的原子指標(biāo),在與維度結(jié)合的基礎(chǔ)上創(chuàng)建派生指標(biāo),建設(shè)成規(guī)范統(tǒng)一的數(shù)據(jù)指標(biāo)體系。以此推動數(shù)據(jù)統(tǒng)計來源的唯一性,并接入指標(biāo)提取工具,后續(xù)業(yè)務(wù)完成自助查詢及分析需求,搭建數(shù)據(jù)自助分析的基礎(chǔ)。

本書部分內(nèi)容根據(jù)阿里巴巴數(shù)據(jù)技術(shù)以及產(chǎn)品部的《大數(shù)據(jù)之路 阿里巴巴大數(shù)據(jù)實(shí)踐》讀書筆記而展開,歡迎大家一起交流。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容