
基本概念:
1)維度:描述業(yè)務(wù)的角度、環(huán)境
2)屬性:描述維度的列,一般用于查詢約束、分類匯總
3)事實:即度量
4)維度使用主鍵標(biāo)識,主鍵分兩種:代理鍵和自然鍵
① 代理鍵:無業(yè)務(wù)意義,如自增ID
② 自然鍵:具有業(yè)務(wù)意義,如商品ID
基本方法:
維度設(shè)計的過程就是確定維度屬性的過程,一般流程如下:
1)確定維度,具備唯一性
2)確定主維表,確定描述維度的主表
3)確定相關(guān)表,根據(jù)業(yè)務(wù)之間的關(guān)聯(lián)性,確定維度的相關(guān)表
4)確定維度屬性:包含兩個階段,第一個階段從主維表中選擇維度屬性,第二階段從相關(guān)維表中選擇維度屬性。確定維度有以下原則:
① 盡可能豐富的維度屬性,為下游分析、統(tǒng)計提供良好的基礎(chǔ)
② 維度屬性提供編碼+文字的描述,編碼用于表關(guān)聯(lián),文字表示真正的標(biāo)簽
③ 沉淀出通用的維度屬性,一來減少下游使用的復(fù)雜度,二來避免下游口徑不一致
層次結(jié)構(gòu):
1)維度中有些屬性以層次的方式相互關(guān)聯(lián)

2)層次結(jié)構(gòu)的屬性常用于數(shù)據(jù)鉆取

規(guī)范化與非規(guī)范化:
1)把屬性層次實例化成一系列維度,而不是單一維度,被稱為雪花模型。大多數(shù)OLTP系統(tǒng)采用這種方法規(guī)范化數(shù)據(jù),將重復(fù)屬性移至自身表中,刪除數(shù)據(jù)冗余
2) 將維度屬性層次合并到單個維度中稱為反規(guī)范化,主要用于數(shù)據(jù)分析。用存儲空間換取查詢性能

層次屬性

維度一致性與交叉探索:
1)有些場景需要將不同數(shù)據(jù)域的事實數(shù)據(jù)合并在一起進行查詢,稱為交叉查詢
2)為了確保交叉查詢中數(shù)據(jù)的維度格式一致性、內(nèi)容一致性,采用共享維表的方式,建立唯一的公共維表