一. 建模過程概述
??開始討論維度建模設(shè)計(jì)工作前,必須考慮正確的人選 。最值得注意的是,我們強(qiáng)烈主張業(yè)務(wù)代表參加建模會(huì)議 。他們的加入與合作必然會(huì)增加最終模型解決用戶需求的可能性。同樣,組織的業(yè)務(wù)數(shù)據(jù) 管理人員也應(yīng)該參加 ,特別是當(dāng)討論涉及那些由他們來管理的數(shù)據(jù)時(shí)。
??維度模型的構(gòu)建是一個(gè)具有高度動(dòng)態(tài)性且需要迭代產(chǎn)生的過程 。最初的準(zhǔn)備過程完成后,設(shè)計(jì)工作將開始處理從總線架構(gòu)獲取的圖形化模型 ,確定設(shè)計(jì)范圍并澄清所提出的事實(shí)表及相關(guān)維度表的粒度 。
??高級(jí)模型設(shè)計(jì)完成后,設(shè)計(jì)小組將開展針對(duì)維度表屬性 、領(lǐng)域值 、來源 、關(guān)系、數(shù)據(jù)質(zhì)量關(guān)注點(diǎn)和轉(zhuǎn)換等方面的工作。確定維度后,將建模事實(shí)表 。建模過程的最后階段是與感興趣的伙伴,特別是業(yè)務(wù)代表們一起對(duì)模型進(jìn)行評(píng)審和驗(yàn)證工作 。主要目標(biāo)是建立滿足用戶需求的模型 ,檢驗(yàn)加載到模型中的數(shù)據(jù)的可用性,為ETL小組提供最初的源到目標(biāo)的映射。
??維度模型通過一系列設(shè)計(jì)會(huì)議展開,每一次會(huì)議將產(chǎn)生更詳細(xì) 、更健壯的按照業(yè)務(wù)需求反復(fù)測(cè)試過的設(shè)計(jì)結(jié)果 。當(dāng)模型清楚地滿足用戶需求后,結(jié)束建模過程。通常需要三四周時(shí)間完成一次業(yè)務(wù)過程維度模型的設(shè)計(jì) ,當(dāng)然需要的時(shí)間會(huì)隨著小組的經(jīng)驗(yàn) 、詳細(xì)業(yè)務(wù)需求的可用性 、涉及的業(yè)務(wù)代表或授權(quán)負(fù)責(zé)管理組織數(shù)據(jù)的人員 、數(shù)據(jù)源的復(fù)雜程度 、利用現(xiàn)存一致性維度的能力等的差異而存在較大的差異。
二. 組織工作
??開始構(gòu)建模型前,為使維度建模過程能夠順利開展 ,必須開展適當(dāng)?shù)臏?zhǔn)備工作。除準(zhǔn)備好適當(dāng)?shù)馁Y源外,還需要考慮后勤保障問題,以便能夠富有成效地開展設(shè)計(jì)工作 。
2.1 確定參與人 ,特別是業(yè)務(wù)代表們
??最好的維度模型往往是小組努力協(xié)同工作的結(jié)果 。沒有哪個(gè)個(gè)人能夠掌握有效地建立模型所需要的業(yè)務(wù)需求的所有知識(shí)以及源系統(tǒng)的所有特性 。盡管數(shù)據(jù)建模人員能夠使建模過程更加容易并專門負(fù)責(zé)交付物,但我們相信讓業(yè)務(wù)出身的主題業(yè)務(wù)專家參與其間是至關(guān)重要的:他們的見識(shí)是無價(jià)之寶 ,特別是因?yàn)樗麄兪悄切┠軌蛑赋鋈绾螐脑磾?shù)據(jù)中得到數(shù)據(jù)并將這些數(shù)據(jù)轉(zhuǎn)換為有價(jià)值的分析信息的人員 。盡管在設(shè)計(jì)活動(dòng)中加入更多的人會(huì)增加過程變慢的風(fēng)險(xiǎn),但得到豐富的、完整的設(shè)計(jì)可以證明這一額外的開銷是值得的 。
??讓某些具備實(shí)際涉及的源系統(tǒng)的知識(shí)的人參與是非常有益的 。您可以將數(shù)據(jù)庫管理員 (DBA)和 ETL 小組代表加入到小組中 ,這樣他們既能夠?qū)W習(xí)到建模工作過程中揭示的知識(shí) , 又能夠抵制應(yīng)用第 3 范式 (3NF)概念的誘惑或按照BI 應(yīng)用的復(fù)雜性努力使 ETL 過程更加合理。記住目標(biāo)是在 ETL 過程的復(fù)雜性與 BI 展現(xiàn)層的簡(jiǎn)單性和可預(yù)測(cè)性之間取得平衡 。
??深入討論建模過程前,應(yīng)該花點(diǎn)時(shí)間考慮正在開展的DW/BI 環(huán)境問題 。如果組織正在考慮數(shù)據(jù)治理和管理計(jì)劃 ,那么現(xiàn)在正是開展這 一計(jì)劃的合適時(shí)間 。如果沒有相關(guān)的管理 計(jì)劃 ,則正好是開始這 一計(jì)劃的良機(jī) 。企業(yè) DW/BI 工作致力于維度建模同時(shí)也必須致力于 一致性維度策略 以確保整個(gè)企業(yè)業(yè)務(wù)過程的 一致性 。有效的數(shù)據(jù)管理程序能夠幫助組織實(shí) 現(xiàn)一致性維度策略 。在大型企業(yè)中要實(shí)現(xiàn) 一致性維度是非常困難的 。問題通常主要不在技術(shù)方面 ,而是組織交流和達(dá)成共識(shí)的挑戰(zhàn) 。
??企業(yè)中不同的小組通常致力于自己專有的業(yè)務(wù)規(guī)則和定義 。數(shù)據(jù)管理人員必須與相關(guān)的小組緊密合作,開發(fā)公共的業(yè)務(wù)規(guī)則和定義 ,然后在組織中游說 ,讓大家都使用公共規(guī)則和定義以獲得企業(yè)的一致認(rèn)可 。多年來,始終有人在批評(píng)一致性維度 “太強(qiáng)硬”。是的 , 讓企業(yè)中不同領(lǐng)域的人們同意采用公共的屬性名稱、定義及數(shù)值是非常困難的事情 ,但這樣做的要義在于能夠獲得統(tǒng) 一的、集成的數(shù)據(jù) 。如果每個(gè)人都使用自己的標(biāo)識(shí)和業(yè)務(wù)規(guī)則, 就沒有辦法發(fā)布一種 DW/BI 系統(tǒng)承諾提供的統(tǒng)一版本的真實(shí)集合 。最后,Kimball 方法時(shí)常被批評(píng)說它對(duì)那些希望找尋快速解決方案的人來說非常困難的原因之 一是我們闡述了實(shí)際完成工作的詳細(xì)步驟。
2.2 業(yè)務(wù)需求評(píng)審
??開始建模之前,小組必須熟悉業(yè)務(wù)需求 。第 1 步是仔細(xì)評(píng)審業(yè)務(wù)需求文檔 。將業(yè)務(wù)需求轉(zhuǎn)換為靈活的維度模型,用于支持范圍廣泛的分析,而不是僅僅支持特定的報(bào)表 。某些設(shè)計(jì)人員試圖跳過需求評(píng)審直接進(jìn)入設(shè)計(jì),如果這樣做,最后建立的模型通常是源數(shù)據(jù)驅(qū)動(dòng)的而沒有考慮業(yè)務(wù)團(tuán)體需要的增加的價(jià)值 。讓業(yè)務(wù)代表加入到建模小組中有助于避免此類數(shù)據(jù)驅(qū)動(dòng)的方法 。
2.3 利用建模工具
??開始建?;顒?dòng)前 ,準(zhǔn)備一些工具是非常必要的。使用電子報(bào)表作為最初的文檔工具是 有效的 ,因?yàn)槔盟梢栽诜磸?fù)法代過程中方便井快速地實(shí)施變更 。
??在建?;顒?dòng)進(jìn)入最后階段后,可以方便地將工作轉(zhuǎn)換到企業(yè)所使用的任何類型的建模工具中。多數(shù)建模工具都支持建立維度模型的維度設(shè)計(jì)功能 。在詳細(xì)設(shè)計(jì)完成后 ,建模工具可幫助DBA 將設(shè)計(jì)的模型 置換到數(shù)據(jù)庫中 ,包括建表 、索引、分區(qū) 、視圖及數(shù)據(jù)庫的其他物理元素 。
2.4 利用數(shù)據(jù)分析工具
??在整個(gè)建模過程中 ,小組需要隨著理解深入不斷地開發(fā)源數(shù)據(jù)結(jié)構(gòu) 、內(nèi)容、關(guān)系和獲取規(guī)則。需要對(duì)處于可用狀態(tài)的數(shù)據(jù)進(jìn)行驗(yàn)證 ,或者至少可以對(duì)缺陷進(jìn)行管理,了解在將它們轉(zhuǎn)換到維度模型時(shí)需要做些什么 。數(shù)據(jù)分析(data profiling)利用查詢能力探索源數(shù)據(jù)系 統(tǒng)中實(shí)際存在的內(nèi)容和關(guān)系 ,而不要依靠那些不完整的或過期的文檔 。簡(jiǎn)單的數(shù)據(jù)分析工 作可以通過編寫簡(jiǎn)單的 SQL 語句實(shí)現(xiàn) ,復(fù)雜的數(shù)據(jù)分析工作可以通過專用工具來實(shí)現(xiàn) 。主 要的 ETL 提供商提供的產(chǎn)品 一般都包括數(shù)據(jù)分析功能 。
2.5 利用或建立命名規(guī)則
??在建立維度模型的過程中 ,不可避免地會(huì)遇到命名規(guī)則的問題 。數(shù)據(jù)模型的標(biāo)識(shí)必須 是描述性的并且與業(yè)務(wù)場(chǎng)景 一致 。表 和列名是 BI 應(yīng)用接口的關(guān)鍵元素 。類似 “ 描述 (Description )” 這樣的列名在數(shù)據(jù)模型環(huán)境中可能己非常清楚了 ,但對(duì)于報(bào)表環(huán)境來說 ,這 樣的命名顯然達(dá)不到交流的效果 。
??設(shè)計(jì)維度模型的部分過程集中于對(duì)公共定義和標(biāo)識(shí)的認(rèn)定 。由于不同的業(yè)務(wù)小組可能對(duì)同一個(gè)名稱具有不同的理解(同名異義 ),或者不同的名稱表示的 是同種含義(異名同義), 結(jié)果使命名工作非常困難 。人們一般都不愿意放棄自己熟悉的詞匯而采用新的詞匯 。在命名規(guī)則上花費(fèi)時(shí)間是一種看起來意義不大 ,但從長(zhǎng)遠(yuǎn)來看意義重大的任務(wù) 。
??大型組織通常設(shè)有 IT 部門,專門負(fù)責(zé)命名規(guī)則 。常用的方法是采用包含 三個(gè)部分的命 名標(biāo)準(zhǔn) :主詞、限定詞(如果適合的話) 、類詞 。利用IT部門的工作成果 ,充分理解對(duì)有 已經(jīng)存在的命名規(guī)則進(jìn)行擴(kuò)展能夠支持形成更有利于商業(yè)交流的表和列名 。如果組織沒有現(xiàn)成的命名規(guī)則,則必須在維度建 模過程中建立命名規(guī)則 。
2.6 日歷和設(shè)施的協(xié)調(diào)
??最后但并非不重要的是 ,需要按照參與者的日程安排來設(shè)計(jì)會(huì) 議日程 。不一定要利用整天的時(shí)間 ,可以每周利用三 四天的上午和下午召開持續(xù)時(shí)間為兩三個(gè)小時(shí)的會(huì)議 ,這是 比較現(xiàn)實(shí)的。這一方法充分考慮到小組成員可能會(huì)有其他工作需要處理 ,這樣留出會(huì)前、會(huì)間和會(huì)后的時(shí)間讓他們能夠處理于頭的工作 。設(shè)計(jì)小組可以利用非會(huì)議時(shí)間研究源數(shù)據(jù)并確認(rèn)需求,留出時(shí)間讓數(shù)據(jù)建模人員在每次會(huì)議前更新設(shè)計(jì)文檔 。
??如前所述,建模過程通常會(huì)用三四周的時(shí)間對(duì)單一過程開展建模工作 ,例如 ,銷售訂單,或?qū)o密相關(guān)的業(yè)務(wù)過程開展建模工作,例如,處于不同的但密切相關(guān)的事實(shí)表中的健康設(shè)施和專業(yè)要求事務(wù) 。多種因素會(huì)對(duì)工作量造成影響 。最終,先前已經(jīng)存在的核心維度的可用性使建模工作能夠特別關(guān)注事實(shí)表的性能度量 ,這樣能夠顯著地降低開展工作所 需要的時(shí)間。
??最后,您必須保留適當(dāng)?shù)脑O(shè)施 。在設(shè)計(jì)工作期間 ,最好能夠保留 一個(gè)專用的會(huì)議室 , 當(dāng)然在大多數(shù)組織中 ,這一想法不易實(shí)現(xiàn) ,因?yàn)闀?huì)議室總是不夠用 。如果會(huì)議室的四壁都 有從地板到天花板的自板那就更好了 。除了會(huì)議設(shè)施外 ,小組還需要一些基本的用品 ,例 如,自粘白板紙。會(huì)議期間通 常需要電腦投影儀,設(shè)計(jì)評(píng)審絕對(duì)離不開它 。
三. 維度模型設(shè)計(jì)
在設(shè)計(jì)維度模型 期間存在 4 個(gè)關(guān)鍵決策 :
? 確定業(yè)務(wù)過程
? 聲明業(yè)務(wù)過程的粒度
? 確定維度
? 確定事實(shí)
第 1 步確定業(yè)務(wù)過程通常按照需求獲取的結(jié)果來確定 。以此為基礎(chǔ) ,小組可以開展相關(guān)的設(shè)計(jì)任務(wù)。
? 定義模型范圍和粒度的高級(jí)模型
? 詳細(xì)設(shè)計(jì)每個(gè)表的屬性和度量
? IT 和業(yè)務(wù)代表的評(píng)審和驗(yàn)收
? 設(shè)計(jì)文檔定稿
要完成所有 的數(shù)據(jù)建模工作 ,維度建模要采取法代方式開展 。對(duì)需求和源細(xì)節(jié)要反復(fù) 考慮以進(jìn)一步精煉模型 ,隨著理解的不斷深入 ,對(duì)模型進(jìn)行必要 的修改。
3.1 統(tǒng)一對(duì)高層氣泡圖的理解
??設(shè)計(jì)會(huì)議的初始任務(wù)是建立目標(biāo)業(yè)務(wù)過程 的高層維度模型圖。由于您是從總線矩陣開始的 ,所以第1個(gè)草圖的建立相對(duì)比較直接 。盡管有經(jīng)驗(yàn)的設(shè)計(jì)人員可能會(huì)設(shè)計(jì)出初始的 向?qū)泳S度模型井展示給 小組用于評(píng)審 ,但我們?nèi)匀唤ㄗh不要采用 這種方法 ,因?yàn)樗鼪]有使整個(gè)小組參與到過程中。
??高層圖圖形化地表示了業(yè)務(wù)過程的維度和事實(shí) 表 ,如下圖所示 。出于明顯可見的原因,我們將其稱為氣泡圖 。這一實(shí)體級(jí)的圖形化模型確定了事實(shí)表和與之相關(guān)的維度表的粒度,清楚地展現(xiàn)給非技術(shù)人員。
??粒度描述需要建模小組考慮滿足業(yè)務(wù)需求需要什么以及物理數(shù)據(jù)源能夠提供什么數(shù)據(jù) 。氣泡圖必須根據(jù)可用的物理數(shù)據(jù)設(shè)計(jì) ??偩€矩陣 的一行可能會(huì)用多個(gè)氣泡圖表示 ,每個(gè)氣泡閣對(duì)應(yīng)具有特定粒度的特定事實(shí)表 。
??大多數(shù)主要的維度在確定了粒度后可以自然地獲得 。清楚的事實(shí)表粒度聲明的重要影響之一是可以精確地以圖示化方法表示有關(guān)的維度 。維度的選擇也可能會(huì)導(dǎo)致您重新思考粒度聲明 。如果提出的維度無法匹配事實(shí)表的粒度 ,那么要么不用該維度 ,改變事實(shí)表的粒度 ,要么考慮使用多值設(shè)計(jì)解決方案 。
??關(guān)方交流時(shí)介紹項(xiàng)目 、項(xiàng)目范圍以及數(shù)據(jù)內(nèi)容 。

??為幫助理解 ,在給定業(yè)務(wù)過程的多個(gè)高層模型圖之間保持 一致性是非常有益的 。盡管每個(gè)事實(shí)表被文檔化到不同的頁面中,將相關(guān)的涉及多個(gè)氣泡圖的維度安排到 一個(gè)相似的 系列中是非常有用的 。
3.2 開發(fā)詳細(xì)的維度模型
??在高層氣泡圖設(shè)計(jì)完成后 ,就可以開始關(guān)注細(xì)節(jié)了 。小組應(yīng)該定期見面,以便逐表逐列地定義詳細(xì)的維度模型 。業(yè)務(wù)代表應(yīng)該參加此類交互會(huì)議 ,您需要他們對(duì)屬性 、過濾器 、分組、標(biāo)識(shí)和度量的反饋 。
??最有效的方法是先開始設(shè)計(jì)維度表 ,然后考慮設(shè)計(jì)事實(shí)表 。我們建議在開始細(xì)節(jié)設(shè)計(jì)過程時(shí)己經(jīng)具備明確的維度表。日期維度一般可以作為首選開始考慮的維度表 。這樣能夠確保建模小組更早地獲得成功 ,理解建模過程 ,并學(xué)會(huì)作為一個(gè) 小組而共同工作 。
??詳細(xì)建模確定每個(gè)維度內(nèi)有趣且有用的屬性 ,并確定每個(gè)事實(shí)表應(yīng)該具有的適當(dāng)?shù)亩攘?。您也希望獲取源 、定義以及如何獲得這些屬性和度量的基本業(yè)務(wù)規(guī)則 。在設(shè)計(jì)會(huì)議期間對(duì)源系統(tǒng)和系統(tǒng)化數(shù)據(jù)概要的持續(xù)分析,將有助于小組更好地理解其擁有的源數(shù)據(jù)的實(shí)際情況。
確定維度及其屬性
??在詳細(xì)設(shè)計(jì)階段 ,將定義關(guān)鍵的一致性維度 。因?yàn)?DW/BI 系統(tǒng)是企業(yè)的資源 ,所以這些定義必須為整個(gè)企業(yè)所接受 。數(shù)據(jù)管理人員和業(yè)務(wù)分析師是獲得組織一致認(rèn)可的表和屬性命名、描述和定義的關(guān)鍵資源 。設(shè)計(jì)小組將主導(dǎo)該過程的展開井利用命名規(guī)則 (如果存在的話)。但是對(duì)標(biāo)準(zhǔn)業(yè)務(wù)定義和名稱達(dá)成致是最終的業(yè)務(wù)任務(wù),其列名對(duì)業(yè)務(wù)用戶來說必須具有意義 。這一過程可能需要一定的時(shí)間才能完成,但這一投資可以獲得巨大回報(bào) ,其結(jié)果是用戶愿意并接受維度模型 。毫無疑問 ,管理指導(dǎo)委員會(huì)必須參與解決一致性維度和命名問題 。
??在此點(diǎn)上,建模小組通常還需要充分考慮維度模型中可能包含的雜項(xiàng)維度和微型維度 。直到小組深入開展設(shè)計(jì)工作后 ,這些更關(guān)注性能的模式才可能會(huì)有存在的必要性 。確定事實(shí)
??聲明粒度是對(duì)事實(shí)表度量討論的成果,因?yàn)槭聦?shí)都必須與粒度保持一致 。數(shù)據(jù)分析工作確定了由源系統(tǒng)的度量事件建立的計(jì)數(shù)和數(shù)量。然而,事實(shí)表并不會(huì)受制于這些 基表 。 可能會(huì)存在業(yè)務(wù)需要分析的來自基表的其他度量。確定緩慢變化維度技術(shù)
??根據(jù)高層模型圖初步設(shè)計(jì)好維度和事實(shí)表后,應(yīng)當(dāng)再次考慮維度表的設(shè)計(jì) 。針對(duì)維度表的每個(gè)屬性 ,需要定義在源系統(tǒng)數(shù)據(jù)發(fā)生變化時(shí),對(duì)維度表會(huì)產(chǎn)生何種影響 。再次強(qiáng)調(diào), 業(yè)務(wù)數(shù)據(jù)管理員是建立適合的規(guī)則的重要來源 。有益的方法是詢問源系統(tǒng)專家是否能夠確 定某個(gè)數(shù)據(jù)元素的變化是由于源數(shù)據(jù)變化所引起的。建立詳細(xì)的表設(shè)計(jì)文檔
??詳細(xì)建模階段的關(guān)鍵交 付品是設(shè)計(jì)工作單 。在我們的網(wǎng)站 WWW. kimballgroup.com 上 ,從書名 The Dαtα Warehouse Lifecycle Toolkit, Second Edition 下面的 Tools and Utilities 可以獲得其數(shù)字化模板 。通過與感興趣的業(yè)務(wù)相關(guān)方以及其他分析型業(yè)務(wù) 用戶、BI 應(yīng)用開發(fā)人員 ,以及最重要的參與設(shè)計(jì)任務(wù)的 ETL 開發(fā)人員交流獲取工作單的各 個(gè)細(xì)節(jié) 。
??應(yīng)該為每個(gè)維度和事實(shí)表建立不同的工作單。支持信息至少應(yīng)該包含屬性 /事實(shí)名稱 、描述示例值 、每個(gè)維度屬性的緩慢變化維度類型標(biāo)識(shí) 。此外 ,詳細(xì)的事實(shí)表設(shè)計(jì)應(yīng)該確認(rèn)每個(gè)外鍵關(guān)系 、適當(dāng)?shù)耐嘶S度 ,以及表明每個(gè)事實(shí)是可加 、半可加還是不可加的相關(guān)規(guī)則。
??維度設(shè)計(jì)工作單是建立源到目標(biāo)映射文檔的第 1 步。物理設(shè)計(jì)小組將不斷充實(shí)物理表 以及列名、數(shù)據(jù)類型和有關(guān)鍵的聲明 。對(duì)模型出現(xiàn)的問題進(jìn)行跟蹤
??在設(shè)計(jì)過程中發(fā) 現(xiàn)的所有問題 、定義、轉(zhuǎn)換規(guī)則和數(shù)據(jù)質(zhì)量挑戰(zhàn)必須記錄到問題跟蹤日志中。會(huì)議期間應(yīng)指派專人獲取并跟蹤相關(guān)問題 。如果項(xiàng)目經(jīng)理參與設(shè)計(jì)會(huì)議,則通常由他們擔(dān)負(fù)這一責(zé)任,因?yàn)樗麄兺ǔ>诟掠嘘P(guān)問題并負(fù)責(zé)推進(jìn)解決發(fā)現(xiàn)的問題 。協(xié)調(diào)人在每次會(huì)議結(jié)束前應(yīng)該留出適當(dāng)?shù)臅r(shí)間用于評(píng)審和驗(yàn)證新的問題條目并為發(fā)現(xiàn)的問題指派負(fù)責(zé)人。在兩次會(huì)議期間,設(shè)計(jì)小組通常忙于分析數(shù)據(jù) ,澄清并達(dá)成大家認(rèn)可的定義, 與源系統(tǒng)專家會(huì)面以解決突出的問題。

- 維護(hù)并更新總線矩陣
??在詳細(xì)建模過程中 ,通常對(duì)被建模的業(yè)務(wù)過程會(huì)有新的發(fā)現(xiàn)。常見的情況是,這些新發(fā)現(xiàn)可能會(huì)引入新事實(shí)表以支持業(yè)務(wù)過程,可能產(chǎn)生新維度,也可能需要重新劃分或合并維度 。在整個(gè)設(shè)計(jì)過程中,必須始終保持對(duì)總線矩陣的更新,因?yàn)榭偩€矩陣是關(guān)鍵的交流和規(guī)劃工具。詳細(xì)的總線矩陣通常獲 取有關(guān)事實(shí)表粒度和度 量的額外信息。
3.3 模型評(píng)審與驗(yàn)證
??一旦設(shè)計(jì)小組對(duì)模型充滿信心后 ,過程將進(jìn)入到評(píng)審與驗(yàn)證階段,以從其他有關(guān)小組 獲得針對(duì)模型的反饋意見 ,包括 :
? IT 資源,例如 ,未參加建模工作的 DW/BI 小組成員 、源系統(tǒng)專家以及 DBA 等
? 未參與建模工作的分析或強(qiáng)力商業(yè)用戶
? 范圍廣泛的商業(yè)用戶團(tuán)體
IT 平審
??通常,對(duì)詳細(xì)維度模型的第 1 次評(píng)審主要由 IT 組織同行參與 。評(píng)審人員通常由非常熟悉目標(biāo)業(yè)務(wù)過程的人員組成,因?yàn)樗麄冊(cè)O(shè)計(jì)或管理運(yùn)行 的系統(tǒng)。至少他們可能熟悉部分的 目標(biāo)數(shù)據(jù)模型,因?yàn)槟航?jīng)就與源數(shù)據(jù)相關(guān)的問題和 他們打過交道。
??IT 評(píng)審是極具挑戰(zhàn)性的 ,因?yàn)閰⑴c者通常都不太了解維度模型 。實(shí)際上 ,他們中的大 多數(shù)人可能都是精通并狂熱的第 3 范式(3NF)支持者 。他們趨向采用面向過程的事務(wù)型建模 規(guī)則處理維度模型 。與其將大量時(shí)間放到爭(zhēng)論不同建模方法 的優(yōu)缺點(diǎn)上 ,不如在評(píng)審過程 巾積極主動(dòng)地提供一些維度建模教育 。
??當(dāng)每個(gè)人都了解一些基本概念后,首先應(yīng)該從總線矩陣開始評(píng)審 。這樣做可以讓參與 人對(duì)項(xiàng)目范圍和整個(gè)的數(shù)據(jù)結(jié)構(gòu)有一些理解,闡明一致性維度的作用 ,展示相關(guān)的業(yè)務(wù)活 動(dòng)優(yōu)先順序 。接下來,描述如何從 總線矩陣上選擇行 ,并將其直接轉(zhuǎn)換到高層維度模型圖中。這樣做,可以讓所有人看到實(shí)體級(jí)別的模型映射 ,有利于后續(xù)討論的開展 。
??多數(shù)評(píng)審會(huì)議主要通過瀏覽維度和事實(shí)表工作單細(xì)節(jié)開展 。在會(huì)議期 間,討論模型時(shí), 對(duì)每個(gè)表存在 的問題進(jìn)行評(píng)審也是非常好的辦法 。
??會(huì)議可能會(huì)對(duì)模型進(jìn)行修改 。記住要指定小組成員專門負(fù)責(zé)獲取相關(guān) 的問題和建議。核心用戶評(píng)審
??在多數(shù)項(xiàng)目中 ,并不需要這樣的評(píng)審 ,因?yàn)楹诵纳虡I(yè)用戶都 是建模小組的成員且已經(jīng)對(duì)維度模型有深刻的理解 。如果核心商業(yè)用戶未成為建模小組成員 ,則核心用戶評(píng)審會(huì)議與IT評(píng)審會(huì)議的范圍和結(jié)構(gòu)類似。核心商業(yè)用戶具有比普通商業(yè)用戶更強(qiáng)的技術(shù)背 景并能 夠處理模型 的細(xì) 節(jié) 。在小型組織中,經(jīng)常將IT評(píng)審和核心用戶評(píng)審合并到一個(gè)會(huì)議中 。-
廣泛的業(yè)務(wù)用戶評(píng)審
??這樣的會(huì)議與其說是設(shè)計(jì)評(píng)審 ,不如說是教育與培訓(xùn) 。您希望就相關(guān) 內(nèi)容給人們以教育和啟迪而不是強(qiáng)迫他們接受 ,同時(shí)應(yīng)該描述維度模型如何能夠支持業(yè)務(wù)需求 。應(yīng)當(dāng)從企業(yè)DW/BI數(shù)據(jù)路標(biāo)的總線矩陣開始 ,評(píng)審高層模型氣泡圖,最后 ,評(píng)審關(guān)鍵維度 ,例如客戶和產(chǎn)品維度等 。有時(shí),在講解氣泡圖時(shí)輔以如下圖所示的描述維度中 的層次下鉆路徑 。
image.png
??記得在這樣的教育/評(píng)審會(huì)上要分配 一定的時(shí)間用于描述如何使用模型來回答有關(guān)業(yè)務(wù)過程的范圍廣泛的問題。我們通常會(huì)在需求文檔中加入 一些示例 ,并簡(jiǎn)略地說明如何解 決這些示例的問題。
- 形成設(shè)計(jì)文檔
在模型穩(wěn)定后 ,應(yīng)該對(duì)設(shè)計(jì)小組的工作文件進(jìn)行編制 ,形成設(shè)計(jì)文檔 。該文檔通常包括:
? 項(xiàng)目的簡(jiǎn)短描述
? 高級(jí)數(shù)據(jù)模型圖
? 詳細(xì)的針對(duì)每個(gè)事實(shí)和維度表的維度設(shè)計(jì) 工作單
? 開放的問題
參考:
- 《數(shù)據(jù)倉庫工具箱 維度建模權(quán)威指南》第三版
