BIGDATA專題------DB、ETL、DW、OLAP、DM、BI關系結(jié)構圖

先上圖:

image.png

(1)DB/Database/數(shù)據(jù)庫——這里一般指的就是OLTP數(shù)據(jù)庫,在線事物數(shù)據(jù)庫,用來支持生產(chǎn)的,比如超市的買賣系統(tǒng)。DB保留的是數(shù)據(jù)信息的最新狀態(tài),只有一個狀態(tài)!比如,每天早上起床洗臉照鏡子,看到的就是當時的狀態(tài),至于之前的每天的狀態(tài),不會出現(xiàn)的你的眼前,這個眼前就是db。

(2)DW/Data Warehouse/數(shù)據(jù)倉庫——這里保存的是DB中的不同時間點的狀態(tài),比如,每天早上洗完照鏡子時,都拍一張照片,天天這樣,這些照片放入到一個相冊中,之后就可以查看每一天的狀態(tài)了,這個相冊就是數(shù)據(jù)倉庫,他保存的是數(shù)據(jù)在不同時間點的狀態(tài),對同一個數(shù)據(jù)信息,保留不同時間點的狀態(tài),就便于我們做統(tǒng)計分析了。

(3)ETL/Extraction-Transformation-Loading——用于完成DB到DW的數(shù)據(jù)轉(zhuǎn)存,它將DB中的某一個時間點的狀態(tài),“抽取”出來,根據(jù)DW的存儲模型要求,“轉(zhuǎn)換”一下數(shù)據(jù)格式,然后再“加載”到DW的一個過程,這里需要強調(diào)的是,DB的模型是ER模型,遵從范式化設計原則,而DW的數(shù)據(jù)模型是雪花型結(jié)構或者星型結(jié)構,用的是面向主題,面向問題的設計思路,所以DB和DW的模型結(jié)構不同,需要進行轉(zhuǎn)換。

(4)OLAP——在線分析系統(tǒng),簡單說就是報表系統(tǒng),銷售報表,統(tǒng)計報表,等等,這個大家都熟悉,當然,OLAP的統(tǒng)計要更復雜更豐富一些,比如切面,鉆取等等。

(5)DM/Data Mining/數(shù)據(jù)挖掘——這個挖掘,不是簡單的統(tǒng)計了,他是根據(jù)概率論的或者其他的統(tǒng)計學原理,將DW中的大數(shù)據(jù)量進行分析,找出我們不能直觀發(fā)現(xiàn)的規(guī)律,比如,如果我們每天早上照相,量身材的時候,還記錄下頭一天吃的東西,黃瓜,豬腿,烤鴨,以及心情,如果記錄上10年,形成了3650天的相貌和飲食心情的數(shù)據(jù),我們每個人都記錄,有20萬人記錄了,那么,我們也許通過這些記錄,可以分析出,身材相貌和飲食的客觀規(guī)律;再說一個典型的實例,就是英國的超市,在積累了大量數(shù)據(jù)之后,對數(shù)據(jù)分析挖掘之后,得到了一個規(guī)律:將小孩的尿布和啤酒放在一起,銷量會更好——業(yè)務專家在得到該結(jié)論之后,仔細分析,知道了原因,因為英國男人喜歡看足球的多,老婆把小孩介紹男人看管,小孩尿尿需要尿布,而男人看足球喜歡喝酒,所以兩樣商品有密切的關系,放在一起銷售會更好!

(6)BI/Business Intelligence/商業(yè)智能——領導,決策者,在獲取了OLAP的統(tǒng)計信息,和DM得到的科學規(guī)律之后,對生產(chǎn)進行適當?shù)恼{(diào)整,比如,命令超市人員將啤酒喝尿布放在一起銷售,這就反作用于DB修改存貨數(shù)據(jù)了——這就是整個BI的作用!

cover:http://www.cnblogs.com/ycdx2001/p/4538750.html

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容