大數(shù)據(jù)的概念是在BI的基礎(chǔ)之上發(fā)展起來的,現(xiàn)在所講的大數(shù)據(jù)在大范圍的情況下,是廣義的機(jī)器學(xué)習(xí),業(yè)界有這樣一個(gè)公式:
機(jī)器學(xué)習(xí)=大數(shù)據(jù)+特征+模型
從如上這個(gè)等式可以看出,機(jī)器學(xué)習(xí)如果去掉了特征和模型兩個(gè)維度,那么就是傳統(tǒng)的BI,基于數(shù)據(jù)層面進(jìn)行分析、展示。
BI,商業(yè)智能,是將數(shù)據(jù)挖掘技術(shù)用于行業(yè)解決方案中去,從這點(diǎn)上來講,傳統(tǒng)的BI更象是單機(jī)版的機(jī)器學(xué)習(xí),而現(xiàn)在所提的大數(shù)據(jù)概念是在分布式數(shù)據(jù)處理、存儲(chǔ)、計(jì)算技術(shù)逐步成熟的前提下,所提出的概念。更象是要區(qū)分于以前所提BI而新起的名字。
從本質(zhì)上來講,業(yè)務(wù)層面,BI和大數(shù)據(jù)之間的差異不大,而差異大的地方在于傳統(tǒng)BI所采用的技術(shù)與現(xiàn)有的大數(shù)據(jù)采用的開源平臺(tái)技術(shù),有點(diǎn)類似于,傳統(tǒng)的BI和Microsoft類似,而大數(shù)據(jù)與Linux比較類似。
所以,大數(shù)據(jù)就是在分布式環(huán)境下的BI。梳理大數(shù)據(jù)集成工程的理論方法,可以借鑒于傳統(tǒng)BI工作開展方法,形成大數(shù)據(jù)集成工程方法論。