第八章 維度設(shè)計之維度設(shè)計基礎(chǔ)


基本概念:

1)維度:描述業(yè)務(wù)的角度、環(huán)境

2)屬性:描述維度的列,一般用于查詢約束、分類匯總

3)事實:即度量

4)維度使用主鍵標(biāo)識,主鍵分兩種:代理鍵和自然鍵

① 代理鍵:無業(yè)務(wù)意義,如自增ID

② 自然鍵:具有業(yè)務(wù)意義,如商品ID


基本方法:

維度設(shè)計的過程就是確定維度屬性的過程,一般流程如下:

1)確定維度,具備唯一性

2)確定主維表,確定描述維度的主表

3)確定相關(guān)表,根據(jù)業(yè)務(wù)之間的關(guān)聯(lián)性,確定維度的相關(guān)表

4)確定維度屬性:包含兩個階段,第一個階段從主維表中選擇維度屬性,第二階段從相關(guān)維表中選擇維度屬性。確定維度有以下原則:

① 盡可能豐富的維度屬性,為下游分析、統(tǒng)計提供良好的基礎(chǔ)

② 維度屬性提供編碼+文字的描述,編碼用于表關(guān)聯(lián),文字表示真正的標(biāo)簽

③ 沉淀出通用的維度屬性,一來減少下游使用的復(fù)雜度,二來避免下游口徑不一致


層次結(jié)構(gòu):

1)維度中有些屬性以層次的方式相互關(guān)聯(lián)

2)層次結(jié)構(gòu)的屬性常用于數(shù)據(jù)鉆取


規(guī)范化與非規(guī)范化:

1)把屬性層次實例化成一系列維度,而不是單一維度,被稱為雪花模型。大多數(shù)OLTP系統(tǒng)采用這種方法規(guī)范化數(shù)據(jù),將重復(fù)屬性移至自身表中,刪除數(shù)據(jù)冗余

2) 將維度屬性層次合并到單個維度中稱為反規(guī)范化,主要用于數(shù)據(jù)分析。用存儲空間換取查詢性能


層次屬性


反規(guī)范化成單一屬性



維度一致性與交叉探索:

1)有些場景需要將不同數(shù)據(jù)域的事實數(shù)據(jù)合并在一起進行查詢,稱為交叉查詢

2)為了確保交叉查詢中數(shù)據(jù)的維度格式一致性、內(nèi)容一致性,采用共享維表的方式,建立唯一的公共維表

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容