數(shù)據(jù)質(zhì)量檢查工具

  1. 應(yīng)用場(chǎng)景
    常用場(chǎng)景是將數(shù)據(jù)引接到數(shù)倉,對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查。
  2. 主要功能
    (1)數(shù)據(jù)質(zhì)量檢查規(guī)則
    提供質(zhì)量規(guī)則:空值檢查、重復(fù)值檢查、值域檢查、規(guī)范檢查、波動(dòng)檢查、離群值檢查、完整性檢查、邏輯檢查、自定義檢查等。
    (2)數(shù)據(jù)質(zhì)量檢查模板配置
    針對(duì)數(shù)據(jù)集,根據(jù)提供的質(zhì)量規(guī)則列表,選擇檢查項(xiàng),配置針對(duì)檢查項(xiàng)的檢查參數(shù),生成質(zhì)量檢查模板。
    (3)數(shù)據(jù)質(zhì)量檢查調(diào)度
    配置調(diào)度參數(shù),定時(shí)執(zhí)行數(shù)據(jù)質(zhì)量檢查任務(wù)。
    (4)數(shù)據(jù)質(zhì)量檢查報(bào)告
    執(zhí)行質(zhì)量檢查任務(wù),生成質(zhì)量檢查報(bào)告,提供報(bào)告下載功能。
  3. 技術(shù)實(shí)現(xiàn)
    (1)質(zhì)量檢查規(guī)則實(shí)現(xiàn)
    (2)執(zhí)行引擎
    Sql、Python。SparkSql。
    (3)數(shù)據(jù)庫
    (4)定時(shí)調(diào)度
    定時(shí)調(diào)度引擎。
    參考:
    [Apache Griffin]
    [Openrfine]
    按表配置監(jiān)控規(guī)則
    內(nèi)置模板規(guī)則
    Profiling Use Case
    內(nèi)置模板規(guī)則
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容