簡(jiǎn)介
商業(yè)智能(BI, Business Intelligence),是一套完整的解決方案,用來(lái)將企業(yè)中現(xiàn)有的數(shù)據(jù)進(jìn)行有效的整合,快速準(zhǔn)確的提供報(bào)表并提出決策依據(jù),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營(yíng)策略。
由數(shù)據(jù)倉(cāng)庫(kù)(或數(shù)據(jù)集市)、查詢報(bào)表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成、以幫助企業(yè)決策為目的的技術(shù)及其應(yīng)用。
商業(yè)智能能夠輔助的業(yè)務(wù)經(jīng)營(yíng)決策,既可以是操作層的,也可以是戰(zhàn)術(shù)層和戰(zhàn)略層的決策。為了將數(shù)據(jù)轉(zhuǎn)化為知識(shí),需要利用數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術(shù)。因此,從技術(shù)層面上講,商業(yè)智能不是什么新技術(shù),它只是數(shù)據(jù)倉(cāng)庫(kù)、OLAP和數(shù)據(jù)挖掘等技術(shù)的綜合運(yùn)用。
把商業(yè)智能看成一種解決方案應(yīng)該比較恰當(dāng)。商業(yè)智能的關(guān)鍵是從許多來(lái)自不同的企業(yè)運(yùn)作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進(jìn)行清理,以保證數(shù)據(jù)的正確性,然后經(jīng)過(guò)抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(Load),即ETL過(guò)程,合并到一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉(cāng)庫(kù)里,從而得到企業(yè)數(shù)據(jù)的一個(gè)全局視圖,在此基礎(chǔ)上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對(duì)其進(jìn)行分析和處理(這時(shí)信息變?yōu)檩o助決策的知識(shí)),最后將知識(shí)呈現(xiàn)給管理者,為管理者的決策過(guò)程提供數(shù)據(jù)支持。商業(yè)智能產(chǎn)品及解決方案大致可分為數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品、數(shù)據(jù)抽取產(chǎn)品、OLAP產(chǎn)品、展示產(chǎn)品、和集成以上幾種產(chǎn)品的針對(duì)某個(gè)應(yīng)用的整體解決方案等。
功能
主要架構(gòu)
- 讀取數(shù)據(jù)
- 分析功能
- 豐富的畫(huà)面
- 數(shù)據(jù)輸出功能
- 定型處理
應(yīng)用范圍
-
銷售分析
主要分析各項(xiàng)銷售指標(biāo),例如毛利、毛利率、交叉比、銷進(jìn)比、盈利能力、周轉(zhuǎn)率、同比、環(huán)比等等;而分析維又可從管理架構(gòu)、類別品牌、日期、時(shí)段等角度觀察,這些分析維又采用多級(jí)鉆取,從而獲得相當(dāng)透徹的分析思路;同時(shí)根據(jù)海量數(shù)據(jù)產(chǎn)生預(yù)測(cè)信息、報(bào)警信息等分析數(shù)據(jù);還可根據(jù)各種銷售指標(biāo)產(chǎn)生新的透視表。
-
商品分析
商品分析的主要數(shù)據(jù)來(lái)自銷售數(shù)據(jù)和商品基礎(chǔ)數(shù)據(jù),從而產(chǎn)生以分析結(jié)構(gòu)為主線的分析思路。主要分析數(shù)據(jù)有商品的類別結(jié)構(gòu)、品牌結(jié)構(gòu)、價(jià)格結(jié)構(gòu)、毛利結(jié)構(gòu)、結(jié)算方式結(jié)構(gòu)、產(chǎn)地結(jié)構(gòu)等,從而產(chǎn)生商品廣度、商品深度、商品淘汰率、商品引進(jìn)率、商品置換率、重點(diǎn)商品、暢銷商品、滯銷商品、季節(jié)商品等多種指標(biāo)。通過(guò)D系統(tǒng)對(duì)這些指標(biāo)的分析來(lái)指導(dǎo)企業(yè)商品結(jié)構(gòu)的調(diào)整,加強(qiáng)所營(yíng)商品的競(jìng)爭(zhēng)能力和合理配置。
-
人員分析
人員指標(biāo)進(jìn)行分析,特別是對(duì)銷售人員指標(biāo)(銷售指標(biāo)為主,毛利指標(biāo)、換購(gòu)銷商品數(shù)、代銷商品數(shù)、資金占用、資金周轉(zhuǎn)等)的分析,以達(dá)到考核員工業(yè)績(jī),提高員工積極性,并為人力資源的合理利用提供科學(xué)依據(jù)。主要分析的主題有,員工的人員構(gòu)成、銷售人員的人均銷售額、對(duì)于銷售的個(gè)人銷售業(yè)績(jī)、各管理架構(gòu)的人均銷售額、毛利貢獻(xiàn)、采購(gòu)人員分管商品的進(jìn)貨多少、購(gòu)銷代銷的比例、引進(jìn)的商品銷量情況等等
應(yīng)用科學(xué)
終端用戶查詢與報(bào)告工具
- 專門(mén)用來(lái)支持初級(jí)用戶的原始數(shù)據(jù)訪問(wèn),不包括應(yīng)用于專業(yè)人士的成品報(bào)告生成工具。
- OLAP 工具,提供多為數(shù)據(jù)管理的環(huán)境,其典型的應(yīng)用是對(duì)商業(yè)問(wèn)的建模與商業(yè)數(shù)據(jù)分析。OLAP 也被稱為多維分析。
數(shù)據(jù)挖掘(Data Mining)軟件
使用諸如神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納等技術(shù),用來(lái)發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,做出基于數(shù)據(jù)的推斷
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)和數(shù)據(jù)集市(Data Mart)產(chǎn)品
包括數(shù)據(jù)轉(zhuǎn)換、管理和存取等方面的預(yù)配置軟件,通常還包括一些業(yè)務(wù)模型,如財(cái)務(wù)分析模型
聯(lián)機(jī)分析處理(OLAP)12條準(zhǔn)則 作為一類產(chǎn)品同聯(lián)機(jī)事務(wù)處理(OLTP)明顯區(qū)分開(kāi)來(lái)
當(dāng)今的數(shù)據(jù)處理大致可以分為兩大類:
- 聯(lián)機(jī)事務(wù)處理 OLTP(On-Line Transacation Processing)是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)的主要應(yīng)用,主要是基本的、日常的事物處理
- 聯(lián)機(jī)分析處理 OLAP(On-Line Analytical Processing)是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果
OLAP 是使分析人員、管理人員或者執(zhí)行人員能夠從多角度對(duì)信息進(jìn)行快速、一直、交互的存取,從而獲得對(duì)數(shù)據(jù)的更深入了解的一類軟件技術(shù)。OLAP 的目標(biāo)是滿足決策支持或者滿足多維環(huán)境下特定的查詢和報(bào)表需求,它的技術(shù)核心是“維”這個(gè)概念。
“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分?!熬S”一般包含著層次關(guān)系,這種層次關(guān)系有時(shí)會(huì)相當(dāng)復(fù)雜。通過(guò)把一個(gè)實(shí)體的多項(xiàng)重要的屬性定義為多個(gè)維(dimension),使用戶能對(duì)不同維上的數(shù)據(jù)進(jìn)行比較。因此OLAP也可以說(shuō)是多維數(shù)據(jù)分析工具的集合。
OLAP 的基本多維分析有:
-
鉆?。╮oll up 和 drill down)改變維的層次,變換分析的粒度。
roll up 是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維度;
drill down 從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或者增加新維
切片(slice)和切塊(dice)在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維的分布。如果剩余的維度只有兩個(gè),則是切片;如果有三個(gè),則是切塊。
旋轉(zhuǎn)(pivot)變換維的方向,即在表格中重新安排維的放置(如行列互換)。
drill across
drill through
OLAP 根據(jù)存儲(chǔ)的方式可以分為:
-
ROLAP:基于關(guān)系型數(shù)據(jù)庫(kù)的 OLAP 實(shí)現(xiàn)(Relational OLAP)。
以關(guān)系數(shù)據(jù)庫(kù)為核心,以關(guān)系型結(jié)構(gòu)進(jìn)行多維數(shù)據(jù)的表示和存儲(chǔ)。ROLAP將多維數(shù)據(jù)庫(kù)的多維結(jié)構(gòu)劃分為兩類表:一類是事實(shí)表,用來(lái)存儲(chǔ)數(shù)據(jù)和維關(guān)鍵字;另一類是維表,即對(duì)每個(gè)維至少使用一個(gè)表來(lái)存放維的層次、成員類別等維的描述信息。維表和事實(shí)表通過(guò)主關(guān)鍵字和外關(guān)鍵字聯(lián)系在一起,形成了“星型模式”。對(duì)于層次復(fù)雜的維,為避免冗余數(shù)據(jù)占用過(guò)大的存儲(chǔ)空間,可以使用多個(gè)表來(lái)描述,這種星型模式的擴(kuò)展稱為“雪花模式”
MOLAP表示基于多維數(shù)據(jù)組織的OLAP實(shí)現(xiàn)(Multidimensional OLAP)。以多維數(shù)據(jù)組織方式為核心,也就是說(shuō),MOLAP使用多維數(shù)組存儲(chǔ)數(shù)據(jù)。多維數(shù)據(jù)在存儲(chǔ)中將形成“立方塊(Cube)”的結(jié)構(gòu),在MOLAP中對(duì)“立方塊”的“旋轉(zhuǎn)”、“切塊”、“切片”是產(chǎn)生多維數(shù)據(jù)報(bào)表的主要技術(shù)
HOLAP表示基于混合數(shù)據(jù)組織的OLAP實(shí)現(xiàn)的。這種方式具有更好的靈活性
根據(jù)綜合性數(shù)據(jù)的組織方式的不同,常見(jiàn)的OLAP主要有基于多維數(shù)據(jù)庫(kù)的MOLAP及基于關(guān)系數(shù)據(jù)庫(kù)的ROLAP兩種。MOLAP是以多維的方式組織和存儲(chǔ)數(shù)據(jù),ROLAP則利用現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)技術(shù)來(lái)模擬多維數(shù)據(jù)。在數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用中,OLAP應(yīng)用一般是數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的前端工具,同時(shí)OLAP工具還可以同數(shù)據(jù)挖掘工具、統(tǒng)計(jì)分析工具配合使用,增強(qiáng)決策分析功能。
三個(gè)層次
BI 的三個(gè)層次
- 低端 BI:報(bào)表系統(tǒng)
- 中斷 BI:數(shù)據(jù)分析
- 高端 BI:數(shù)據(jù)挖掘
傳統(tǒng)報(bào)表面臨的挑戰(zhàn)
- 數(shù)據(jù)太多,信息太少。
- 難以交互分析、了解各種組合
- 難以挖掘出潛在的規(guī)則
- 難以追溯歷史,數(shù)據(jù)形成孤島
多維數(shù)據(jù)庫(kù)
多維數(shù)據(jù)庫(kù)的概念并不復(fù)雜。舉一個(gè)例子,我們想描述2003年4月份可樂(lè)在北部地區(qū)銷售額10萬(wàn)元時(shí),牽扯到幾個(gè)角度:時(shí)間、產(chǎn)品、地區(qū)。這些叫做維度。至于銷售額,叫做度量值。當(dāng)然,還有成本、利潤(rùn)等。
數(shù)據(jù)分析系統(tǒng)的總體架構(gòu)分為四個(gè)部分:
- 源系統(tǒng):包括現(xiàn)有的所有 OLTP 系統(tǒng),搭建 BI 系統(tǒng)并不需要更改現(xiàn)有系統(tǒng)
- 數(shù)據(jù)倉(cāng)庫(kù):數(shù)據(jù)大集中,通過(guò)數(shù)據(jù)抽取,把數(shù)據(jù)從源系統(tǒng)源源不斷地抽取出來(lái),可能每天一次,或者每3個(gè)小時(shí)一次,當(dāng)然是自動(dòng)的。數(shù)據(jù)倉(cāng)庫(kù)依然建立在關(guān)系型數(shù)據(jù)庫(kù)上,往往符合叫做“星型結(jié)構(gòu)”的模型
- 多維數(shù)據(jù)庫(kù):數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)經(jīng)過(guò)多維建模,形成了立方體結(jié)構(gòu)。每一個(gè)立方體描述了一個(gè)業(yè)務(wù)主題,例如銷售、庫(kù)存或者財(cái)務(wù)
- 客戶端:好的客戶端軟件可以把多維立方體中的信息豐富多彩地展現(xiàn)給用戶
數(shù)據(jù)挖掘看穿你的需求
廣義上說(shuō),任何從數(shù)據(jù)庫(kù)中挖掘信息的過(guò)程都叫做數(shù)據(jù)挖掘。從這點(diǎn)看來(lái),數(shù)據(jù)挖掘就是BI。但從技術(shù)術(shù)語(yǔ)上說(shuō),數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過(guò)清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步分析決策工作。從這種狹義的觀點(diǎn)上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過(guò)程。數(shù)據(jù)挖掘往往針對(duì)特定的數(shù)據(jù)、特定的問(wèn)題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來(lái)預(yù)測(cè)、支持決策。