再讀《智能時代》(二)

讀《智能時代》

? ? ?一、大數(shù)據(jù)的本質(zhì)是什么?

?????1、認識現(xiàn)象、數(shù)據(jù)、信息、知識的基本概念

?????(現(xiàn)象是客觀存在的世界)

?????數(shù)據(jù)的范疇是隨著文明的進展不斷變化的,在計算機出現(xiàn)以前,數(shù)據(jù)=數(shù)字,在今天,文字、語音、圖片、視頻都是數(shù)據(jù),并且以這些基礎(chǔ)數(shù)據(jù)元素承載著信息科技產(chǎn)業(yè)里最重要的數(shù)據(jù)——信件、電話、郵件、照片、電視網(wǎng)頁以及以及社交產(chǎn)品里用戶產(chǎn)生的內(nèi)容,面向未來,數(shù)據(jù)的范圍還在擴大,我們每天的行為活動、社會關(guān)系等也是數(shù)據(jù),數(shù)據(jù)無處不在。(結(jié)合信息的定義來看的話,數(shù)據(jù)的范圍被放大了,一定程度上有信息的成分,比如信件就是用來傳達信息的。)

?????信息是對世界、人或事的描述,比數(shù)據(jù)抽象,數(shù)據(jù)是信息的承載體,信息可以是人創(chuàng)造的,也可以是天然存在的事實(作者舉例地球的面積和質(zhì)量)。信息中包括著有用數(shù)據(jù)和無用數(shù)據(jù),剔除無用數(shù)據(jù),獲取有用數(shù)據(jù),并發(fā)現(xiàn)其背后的信息的能力是不斷增強的。

?????知識比信息更抽象,更系統(tǒng),通過信息總結(jié)出知識,它是人的認知的又一升級。從數(shù)據(jù)到知識的過程,是通過觀察形成數(shù)據(jù),分析數(shù)據(jù)承載的信息,建立模型并不斷進行數(shù)據(jù)驗證的過程。為了說明數(shù)據(jù)到知識的過程,作者用歷法的發(fā)展及天文學的發(fā)展過程來說明數(shù)據(jù)到知識的形成過程。(知識是人認識世界的一般性結(jié)論,在數(shù)學家眼里,模型就是知識,或者說找到模型,就完成從數(shù)據(jù)到知識的過程。在這個過程里,知識是隨著人的認知不斷升級的,所以,對待知識的態(tài)度是認識但不迷信。形成知識的過程是不斷追問本質(zhì),在教育孩子的過程中,通過提問引導思考,避免粗暴傳遞自以為是的知識)

?????認識了現(xiàn)象、數(shù)據(jù)、信息、知識的基本概念之后,如何使用數(shù)據(jù)?

?????2、使用數(shù)據(jù)的相關(guān)性獲取信息

?????相關(guān)性是使用數(shù)據(jù)(間接獲取信息) 的有效手段,尤其是在無法直接獲取信息時,如果發(fā)現(xiàn)兩類數(shù)據(jù)之間的極大相關(guān),可以獲得相對準確的認識。

? ? ?認知世界,很多時候,我們無法直接獲得對事物的準確認識(一手信息),但是可以通過相關(guān)性間接獲取相對準確的信息(通過幾個事件相互佐證的信息,或者從一件事嚴密推理出其他信息)。這種相關(guān)性,一般也是先假設(shè)或者想象吧(科學有時就是源于想象) 然后再進行驗證。

?????3、統(tǒng)計學,點石成金的魔棒

?????統(tǒng)計學是建立在概率論基礎(chǔ)上的,通過收集數(shù)據(jù)、分析數(shù)據(jù)、找到數(shù)據(jù)內(nèi)在的關(guān)聯(lián)性和規(guī)律性的學科。統(tǒng)計學對輸入的數(shù)據(jù)有量和質(zhì)的要求,要得到準確的結(jié)果,樣本的數(shù)量要盡量大,樣本要具有代表性。如果這兩個條件不滿足,統(tǒng)計結(jié)果常常出錯。

? ? ?我理解大數(shù)據(jù)可以看著統(tǒng)計學的延伸,或者可以認為大數(shù)據(jù)是統(tǒng)計學在量和質(zhì)上的變化。

? ? ?統(tǒng)計學是找數(shù)據(jù)內(nèi)在規(guī)律,那么數(shù)學模型則是要建立起數(shù)據(jù)之間的確定性的關(guān)系。

?????4、數(shù)學模型是數(shù)據(jù)驅(qū)動方法的基礎(chǔ)

? ? ?理論上只要有足夠多的具有代表性的樣本數(shù)據(jù),就可以運用數(shù)學找到一個或者多個模型,科學家們就是這么做的。但是他們形成知識有兩種情況,一是建立起嚴格的復雜的精確模型,用已有少量數(shù)據(jù)對模型進行驗證。二是先有大量的數(shù)據(jù),然后用多個簡單模型去契合數(shù)據(jù),并在數(shù)據(jù)使用過程中不斷優(yōu)化模型,后者就是數(shù)據(jù)驅(qū)動方法。數(shù)據(jù)驅(qū)動方法是大數(shù)據(jù)的基礎(chǔ)也是機器智能的核心,還是一種新的思維方式。AlphaGo就是在總結(jié)了幾十萬棋盤的數(shù)據(jù)后,得到了統(tǒng)計模型,這是典型的數(shù)據(jù)驅(qū)動方法的應用。

? ? ?數(shù)據(jù)驅(qū)動方法是機器智能的核心,機器智能是怎么來的?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容