- 應(yīng)用場(chǎng)景
常用場(chǎng)景是將數(shù)據(jù)引接到數(shù)倉,對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查。 - 主要功能
(1)數(shù)據(jù)質(zhì)量檢查規(guī)則
提供質(zhì)量規(guī)則:空值檢查、重復(fù)值檢查、值域檢查、規(guī)范檢查、波動(dòng)檢查、離群值檢查、完整性檢查、邏輯檢查、自定義檢查等。
(2)數(shù)據(jù)質(zhì)量檢查模板配置
針對(duì)數(shù)據(jù)集,根據(jù)提供的質(zhì)量規(guī)則列表,選擇檢查項(xiàng),配置針對(duì)檢查項(xiàng)的檢查參數(shù),生成質(zhì)量檢查模板。
(3)數(shù)據(jù)質(zhì)量檢查調(diào)度
配置調(diào)度參數(shù),定時(shí)執(zhí)行數(shù)據(jù)質(zhì)量檢查任務(wù)。
(4)數(shù)據(jù)質(zhì)量檢查報(bào)告
執(zhí)行質(zhì)量檢查任務(wù),生成質(zhì)量檢查報(bào)告,提供報(bào)告下載功能。 - 技術(shù)實(shí)現(xiàn)
(1)質(zhì)量檢查規(guī)則實(shí)現(xiàn)
(2)執(zhí)行引擎
Sql、Python。SparkSql。
(3)數(shù)據(jù)庫
(4)定時(shí)調(diào)度
定時(shí)調(diào)度引擎。
參考:
[Apache Griffin]
[Openrfine]
按表配置監(jiān)控規(guī)則
內(nèi)置模板規(guī)則
Profiling Use Case
內(nèi)置模板規(guī)則
數(shù)據(jù)質(zhì)量檢查工具
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 1 概述 SonarQube(sonar)是一個(gè)開源平臺(tái),用于管理源代碼的質(zhì)量。 SonarQube不只是一個(gè)質(zhì)量...
- 概述數(shù)據(jù)質(zhì)量模塊是大數(shù)據(jù)平臺(tái)中必不可少的一個(gè)功能組件,Apache Griffin[http://griffin....
- ? OpenRefine提供數(shù)據(jù)集治理功能,它很擅長(zhǎng)數(shù)據(jù)的探索、清理、轉(zhuǎn)換等,主要功能介紹如下。 轉(zhuǎn)換數(shù)據(jù)? Op...
- 當(dāng)前越來越多的企業(yè)認(rèn)識(shí)到了數(shù)據(jù)的重要性,數(shù)據(jù)倉庫、大數(shù)據(jù)平臺(tái)的建設(shè)如雨后春筍。但數(shù)據(jù)是一把雙刃劍,它能給企業(yè)帶來業(yè)...
- 1 大數(shù)據(jù)平臺(tái)的數(shù)據(jù)質(zhì)量概述 數(shù)據(jù)質(zhì)量是大數(shù)據(jù)挖掘能否卓有成效的基礎(chǔ),在大數(shù)據(jù)領(lǐng)域里有一句廣為流傳的話叫“Garb...