2019-08-06

數(shù)據(jù)質(zhì)量

15.1數(shù)據(jù)質(zhì)量保障原則

1.完整性

完整性是指數(shù)據(jù)的記錄和信息是否完整,是否存在缺失的情況。

2.準(zhǔn)確性

準(zhǔn)確性是指數(shù)據(jù)種記錄的信息和數(shù)據(jù)是否準(zhǔn)確,是否存在異?;蛘咤e誤的信息。

3.一致性

4.及時性

數(shù)據(jù)是小時級別或者實(shí)時級別的。阿里的交易大屏就做到了秒級。

15.2數(shù)據(jù)質(zhì)量方法概述

1.消費(fèi)場景知曉

2.數(shù)據(jù)生產(chǎn)加工各個環(huán)節(jié)卡點(diǎn)校驗(yàn)

在線系統(tǒng):OLTP

離線系統(tǒng):OLAP

3.風(fēng)控點(diǎn)監(jiān)控

4.質(zhì)量衡量

5.質(zhì)量配套工具

15.2.1消費(fèi)場景知曉

1.數(shù)據(jù)資產(chǎn)等級定義

毀滅性質(zhì)

全局性質(zhì)

局部性質(zhì)

一般性質(zhì)

未知性質(zhì)

2.數(shù)據(jù)資產(chǎn)等級落地方法

15.2.2數(shù)據(jù)加工過程卡點(diǎn)校驗(yàn)

1.在線系統(tǒng)卡點(diǎn)校驗(yàn)

2.離線系統(tǒng)卡點(diǎn)校驗(yàn)

首先,是代碼提交時的卡點(diǎn)校驗(yàn)。在此背景下,我們上線了代碼掃描工具SQLSCAN

其次,任務(wù)發(fā)布上線時的卡點(diǎn)校驗(yàn)。

最后,節(jié)點(diǎn)變更或數(shù)據(jù)重刷前的變更通知。

15.2.3風(fēng)險點(diǎn)監(jiān)控

1.在線數(shù)據(jù)風(fēng)險點(diǎn)監(jiān)控

實(shí)時業(yè)務(wù)檢測平臺BCP,用于保障在線系統(tǒng)的數(shù)據(jù)質(zhì)量。

2.離線數(shù)據(jù)風(fēng)險點(diǎn)監(jiān)控

(1)數(shù)據(jù)準(zhǔn)確性

DQC檢查

(2)數(shù)據(jù)及時性

任務(wù)優(yōu)先級

任務(wù)報警:監(jiān)控報警系統(tǒng)

摩薩德:離線任務(wù)的監(jiān)控報警系統(tǒng)

出錯告警

完成告警

未完成告警

周期性告警

超時告警

15.2.4質(zhì)量衡量

1.數(shù)據(jù)質(zhì)量起夜率

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容