數(shù)倉(cāng)總結(jié)目錄:
說(shuō)說(shuō)數(shù)倉(cāng)(1) - 什么是數(shù)倉(cāng)
說(shuō)說(shuō)數(shù)倉(cāng)(2) - 傳統(tǒng)數(shù)倉(cāng)與互聯(lián)網(wǎng)數(shù)倉(cāng)
說(shuō)說(shuō)數(shù)倉(cāng)(3) - 數(shù)倉(cāng)架構(gòu)
說(shuō)說(shuō)數(shù)倉(cāng)(4) - 指標(biāo)字典
說(shuō)說(shuō)數(shù)倉(cāng)(5)-最重要的維度之日期維度
說(shuō)說(shuō)數(shù)倉(cāng)(6)-關(guān)于命名規(guī)范
說(shuō)說(shuō)數(shù)倉(cāng)(7)-淺談數(shù)據(jù)治理
說(shuō)說(shuō)數(shù)倉(cāng)(8)-關(guān)于增量
說(shuō)說(shuō)數(shù)倉(cāng)(9)-上下游約定
說(shuō)說(shuō)數(shù)倉(cāng)(10)-任務(wù)注釋
我忘記是在哪里看到,還是自以為的,反正目前我依然是這么想的:
廣義數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)包含很多的解決方案,其中就包含數(shù)據(jù)治理,數(shù)據(jù)治理也是貫穿整個(gè)項(xiàng)目始終的,是一件長(zhǎng)久的事情。
現(xiàn)在很多人都把數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)單的理解成數(shù)據(jù)建模了。
數(shù)據(jù)治理包含很多的事情,我也沒做過(guò),所以在網(wǎng)上找些資料分享下。
為什么要做數(shù)據(jù)治理
隨著數(shù)據(jù)量越來(lái)越大,數(shù)據(jù)成為一種資產(chǎn),我們需要更好地管理這些數(shù)據(jù),更好地體現(xiàn)數(shù)據(jù)的價(jià)值,這就需要數(shù)據(jù)治理。
其實(shí)在搭建數(shù)據(jù)平臺(tái)的時(shí)候,我們遇到的一系列問(wèn)題都可以通過(guò)數(shù)據(jù)治理來(lái)解決:
- 數(shù)據(jù)質(zhì)量越來(lái)越差,問(wèn)題發(fā)現(xiàn)嚴(yán)重滯后
- 缺少數(shù)據(jù)標(biāo)準(zhǔn),各個(gè)部門標(biāo)準(zhǔn)不統(tǒng)一
- 數(shù)據(jù)變更對(duì)下游的影響不清晰,無(wú)法確認(rèn)影響范圍
什么是數(shù)據(jù)治理
數(shù)據(jù)治理(Data Governance),是一套持續(xù)改善管理機(jī)制,通常包括了數(shù)據(jù)架構(gòu)組織、數(shù)據(jù)模型、政策及體系制定、技術(shù)工具、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、影響度分析、作業(yè)流程、監(jiān)督及考核流程等內(nèi)容。
簡(jiǎn)單來(lái)說(shuō)就是有很多流程和標(biāo)準(zhǔn),像“元數(shù)據(jù)管理”、“主數(shù)據(jù)管理”、“數(shù)據(jù)質(zhì)量”都包含其中。
通過(guò)數(shù)據(jù)治理來(lái)解決我們使用數(shù)據(jù)的過(guò)程中遇到的問(wèn)題。
- 數(shù)據(jù)標(biāo)準(zhǔn)
各種各樣的規(guī)范:命名規(guī)范,數(shù)據(jù)定義,數(shù)據(jù)類型,前面我有說(shuō)過(guò)這個(gè)問(wèn)題,這里提到了“詞素”這個(gè)概念,我前面管它叫詞根了,說(shuō)說(shuō)數(shù)倉(cāng)(6)-關(guān)于命名規(guī)范
標(biāo)準(zhǔn)規(guī)范這東西,好是好,不過(guò)冷不丁一看還是頭大,先整理這些,后面緩過(guò)來(lái)繼續(xù)。
可以參考IBM的文章:大數(shù)據(jù)治理系列
-- 未完待續(xù)