作為一個(gè)身處信息時(shí)代的現(xiàn)代人,我們每天都要和大量信息打交道,可以說每個(gè)人都深受“信息爆炸”之苦。同時(shí),我們現(xiàn)在又即將進(jìn)入被數(shù)據(jù)包圍的智能時(shí)代,每個(gè)人每時(shí)每刻既是數(shù)據(jù)生產(chǎn)者,又是數(shù)據(jù)消費(fèi)者。表面上看,信息和數(shù)據(jù)似乎很相似,都在某種程度上表達(dá)了對(duì)物理存在的度量。但是,它們之間到底有什么關(guān)系和不同呢?
實(shí)際上,數(shù)據(jù)、信息、知識(shí)之間的關(guān)系,有一個(gè)框架性的描述:這個(gè)框架是金字塔型的,最底層、面積最大的部分是“數(shù)據(jù)”;往上更高一層,面積比較小的是“信息”;再往上,面積更小的一層是“知識(shí)”;最頂尖上的是“智能”或者“智慧”。

也就是說,數(shù)據(jù)是形成信息、知識(shí)和智能的原材料,是最底層的原料;它和信息最大的差別是:
- 數(shù)據(jù)的量非常大,信息的量要小一些;
- 數(shù)據(jù)是非指向性、非結(jié)構(gòu)性的,信息是有指向性和結(jié)構(gòu)性的。
信息論的創(chuàng)始人香農(nóng)博士對(duì)“信息”有一個(gè)很經(jīng)典的定義:信息就是“消除了的不確定性”。也就是說,只要能夠把存在著的不確定性消除了,就是“信息”,而大量的數(shù)據(jù)本身就是不確定的。
在移動(dòng)互聯(lián)網(wǎng)繁榮發(fā)展的這十余年間,出現(xiàn)了一系列超級(jí)App,它們已經(jīng)涵蓋了每個(gè)人生活的方方面面,不但為我們提供各種資訊、商品和服務(wù),而且這些服務(wù)越來越合我們的胃口,好像就是為我們量身定做的。
其實(shí),這些超級(jí)App們就是在上述框架的指導(dǎo)下,為我們每一個(gè)人提供越來越智能的服務(wù)。首先,因?yàn)橛袛?shù)以億計(jì)的用戶每天使用這些超級(jí)App,它們理所當(dāng)然的會(huì)收集各種有用或無用的數(shù)據(jù),比如你在何時(shí)何地做了什么,看了什么,買了什么等等;接著,它們把所有數(shù)據(jù)經(jīng)過結(jié)構(gòu)化處理之后,保存在數(shù)據(jù)中心,這時(shí)就變成了有點(diǎn)使用價(jià)值,但價(jià)值還不是很大的信息;然后,在專業(yè)數(shù)據(jù)分析人員的指導(dǎo)下,從大量信息中挖掘出更加有用的知識(shí),比如小王喜歡在中午閱讀一些技術(shù)類文章,而更喜歡在晚上閱讀一些財(cái)經(jīng)類咨詢;最后,因?yàn)檎莆樟舜罅康男⊥?、小張等的個(gè)人偏好,從而抽取出更加普遍的知識(shí)——智慧或智能,因?yàn)檫@種能力是建立在無數(shù)真實(shí)有效的用戶數(shù)據(jù)之上的,所以當(dāng)它遇見一些新用戶時(shí),就可以提供各種智能服務(wù),這種智能甚至超過了用戶本人。
有人說:“在智能時(shí)代,數(shù)據(jù)是新的石油”。這其實(shí)可以理解為:石油是能源,但還有大量的化工產(chǎn)品都是從石油里頭提取的;而數(shù)據(jù)是最基本的,數(shù)據(jù)不是萬能的,沒有數(shù)據(jù)也是萬萬不能的。