機(jī)械思維、大數(shù)據(jù)思維與人的世界

吳軍博士的新書叫《智能時(shí)代》,副標(biāo)題是“大數(shù)據(jù)與智能革命重新定義未來”,因?yàn)檫@個(gè)智能革命恰恰源于數(shù)據(jù)驅(qū)動,與此相對應(yīng)的是機(jī)械思維驅(qū)動了工業(yè)革命。從歷史的角度來看,這似乎只是不同的發(fā)展階段,但如果從底層邏輯來看,我認(rèn)為這只是不同數(shù)據(jù)尺度的體現(xiàn)。

機(jī)械思維到大數(shù)據(jù)思維既不對立互斥也并不彼此相鄰。如果籠統(tǒng)地總結(jié),機(jī)械思維當(dāng)隸屬小數(shù)世界,大數(shù)據(jù)則隸屬大數(shù)世界,而處于兩者中間的是我們的日常更常面對的中數(shù)世界。

一、機(jī)械思維與小數(shù)世界

在當(dāng)今的我們看來,“機(jī)械思維”好像是滯后的、呆板的象征,甚至“機(jī)械”本身也成為了對某個(gè)人的形容,然而絕非褒義。然而在17世紀(jì),機(jī)械思維就像當(dāng)今的所謂互聯(lián)網(wǎng)思維一樣時(shí)髦。

機(jī)械思維的方法論如果用八字箴言來概括我覺得沒有比“大膽假設(shè)、小心求證”更合適的了。大體上就是做出假設(shè)、建構(gòu)模型、數(shù)據(jù)證實(shí)、優(yōu)化模型、預(yù)測未來。這也是沿用至今的一套思路。成果也是顯然的,比如,牛頓——他用力學(xué)三定律和萬有引力定律幾個(gè)簡單明了的公式說明了大千世界宇宙萬物的運(yùn)動規(guī)律。

這里面有三個(gè)點(diǎn),一是公式的確定,二是公式的簡明,三是公式的普適。這也是機(jī)械思維的三大特質(zhì)。

先看確定性和普適性。牛頓的定律無論應(yīng)用于什么樣的場合,都可以用一樣的公式推出相應(yīng)的確定的結(jié)論。這對于人們來說非常重要,因?yàn)楦鶕?jù)種種確定的定律和原理,世界對于我們而言成為可知,我們也可以借此預(yù)測系統(tǒng)中其他變量的反饋、預(yù)測未來。

簡明性一樣重要。牛頓所處的時(shí)代宇宙的復(fù)雜程度并不比現(xiàn)在弱,不一樣的只是思維方式?jīng)Q定的模型差異。太陽系中有成千上萬的天體,按照完全的計(jì)算,就復(fù)雜了去了。然而萬有引力定律非常簡潔優(yōu)雅,將萬千天體的作用回歸到依次考慮兩兩天體的互相作用力中。甚至更進(jìn)一步,由于太陽獨(dú)一無二的巨大質(zhì)量,牛頓將每個(gè)行星和太陽看成一個(gè)獨(dú)立的二物系統(tǒng),得到了更進(jìn)一步簡化?;貧w到兩物體系統(tǒng)自然是個(gè)“小數(shù)”,然而這個(gè)所謂的小數(shù)世界原本其實(shí)并不那么小。比如,在一個(gè)僅考慮兩物體的系統(tǒng)中,涉及到兩物體各自的情況、彼此相互作用的情況和它們所在的系統(tǒng)的情況。如果借用數(shù)學(xué)和力學(xué)概念來描述,那么兩物體系統(tǒng)涉及到孤立方程、相互作用方程和場方程共4個(gè)方程。此系統(tǒng)每增加一個(gè)物體,場方程數(shù)量保持1不變,孤立方程線性增長1個(gè),但相互作用方程數(shù)就呈指數(shù)級增長了。所以,簡化也是其核心。

二、大數(shù)據(jù)與大數(shù)世界

與上述機(jī)械思維一脈相承,蘇聯(lián)在設(shè)計(jì)武器和航天器時(shí)依賴牛逼的數(shù)學(xué)家建立復(fù)雜而精準(zhǔn)的數(shù)學(xué)模型,希望可以用之皆準(zhǔn)。美國的科學(xué)家數(shù)學(xué)底子弱一些,所以走了不同的道路——建立簡單的數(shù)學(xué)模型,但依賴于計(jì)算機(jī)和大量數(shù)據(jù)。結(jié)果是美國的路子勝出了。

吳軍博士在《智能時(shí)代》中還舉了另一個(gè)例子——德國擁有完美的光學(xué)儀器技術(shù),所以做出了高難度的非球面透鏡,儀器小巧而完美;日本缺乏這樣的技術(shù),所以用多個(gè)球面鏡組合來獲得同樣的效果,這樣的機(jī)器笨重然而容易大規(guī)模生產(chǎn)使用。二戰(zhàn)后,成為光學(xué)儀器第一大國的不是德國,而是日本。

在這兩個(gè)例子中,都通過多個(gè)簡單模型來勝過單一的精確模型。然而這樣的勝出是有前提的——基于大數(shù)據(jù)。如果說機(jī)械思維下的精美模型是純凈的晶體,那么大數(shù)據(jù)絕對是散漫無章的氣體。氣體的分子們本身是無序而復(fù)雜的,但我們卻可以預(yù)測整體的擴(kuò)散情況、確定其整體的物理性狀。這跟每一個(gè)分子的“隨機(jī)性”離不開,正是隨機(jī)性讓統(tǒng)計(jì)有了意義。如果某地有一場流感正在蔓延,我們很難判斷某個(gè)單一個(gè)體是否會感染,但谷歌甚至可以根據(jù)人們的搜索數(shù)據(jù)來計(jì)算出接下來將蔓延到哪里,至于感染率有多少就更是一個(gè)簡單的統(tǒng)計(jì)計(jì)算數(shù)字了。

在上面這個(gè)流感的例子中不難發(fā)現(xiàn),面對大數(shù)據(jù),精確的數(shù)值其實(shí)反而沒有那么重要了,我們關(guān)心的點(diǎn)也不必精確到個(gè)位數(shù)。比如運(yùn)營一個(gè)app,用戶達(dá)到千萬量級的時(shí)候,每天關(guān)注的DAU肯定就是多少萬,甚至更簡略一些就只具體到十萬位、百萬位了,個(gè)位數(shù)是幾不再重要。但面對大數(shù)據(jù),個(gè)體依然是獨(dú)一無二的,我只有感染、不被感染兩種結(jié)果。那么對于這種情況,大數(shù)據(jù)的感染率就成為了個(gè)體是否會感染的背景概率,個(gè)體自己的健康情況、活動區(qū)域燈則成為其他的調(diào)整概率項(xiàng)。

由上也可見,概率性思維的價(jià)值更凸顯了。事實(shí)上,基于大數(shù)據(jù)的思維方式不做假設(shè),只根據(jù)海量數(shù)據(jù)做出相關(guān)性分析;不care因果確定,只判斷概率大小、相關(guān)性強(qiáng)弱。

除了混雜取代精確、相關(guān)取代因果、不確定性取代確定性,大數(shù)據(jù)思維最顯而易見的就是全量取代樣本,這也就是大數(shù)據(jù)之為“大數(shù)”的原因。不用考慮怎么抽選有質(zhì)有量的隨機(jī)樣本,大數(shù)據(jù)的風(fēng)格是全量數(shù)據(jù)納入計(jì)算。正因如此,從搜索引擎到語言識別到機(jī)器翻譯,算法技術(shù)相當(dāng)?shù)那疤嵯?,谷歌卻能異軍突起——他家的數(shù)據(jù)量沉淀太可觀了。然而海量的數(shù)據(jù)只是燃?xì)?,終究受制于燃灶的處理能力。正因?yàn)橛?jì)算機(jī)的計(jì)算能力的增長趕不上數(shù)據(jù)的指數(shù)增長,服務(wù)器的數(shù)量就更趕不上,所以,面對大數(shù)據(jù),簡化的算法尤顯重要。比如馬爾可夫鏈,比如維特比算法。

三、復(fù)雜的生活與中數(shù)世界

管理上,我們或許會把一個(gè)個(gè)的個(gè)體抽象為單元,然后用機(jī)械思維統(tǒng)籌管理;決策上,我們又可能會根據(jù)大數(shù)據(jù)跑出的強(qiáng)相關(guān)性分析結(jié)果,決定下一步去打什么市場。無論是小數(shù)世界的機(jī)械思維還是大數(shù)世界的大數(shù)據(jù)思維,都是基于過去可以預(yù)測未來的假設(shè)的,目的也都是為了預(yù)測。

然而,我們現(xiàn)實(shí)生活中遇到的大多數(shù)情況既不是小數(shù)也不是大數(shù)。如果說機(jī)械思維是晶體、大數(shù)據(jù)思維是氣體,那么中間還隔著一個(gè)液體——中數(shù)的世界。某家上市公司有多少人?是個(gè)中數(shù);一臺計(jì)算機(jī)里面有多少零部件?是個(gè)中數(shù);這片森林里有多少只鳥?是個(gè)中數(shù)……生活在其中的我們是尷尬的,就像高中數(shù)學(xué)老師的吐槽——你們做物理什么沒有摩擦力,哪里沒有摩擦力?還勻加速運(yùn)動,你勻加速一個(gè)我看看!

小數(shù)、中數(shù)、大數(shù)本身并不是在量級上有一個(gè)數(shù)字清晰的劃分,事實(shí)上這種劃分是抽象的、概念式的。對于身處其中的中數(shù)世界,我認(rèn)為可以采取的應(yīng)對方式之一是根據(jù)不同的情況,或者靠攏小數(shù)世界借鑒機(jī)械思維,或者靠近大數(shù)世界借鑒大數(shù)據(jù)思維。

先看靠近小數(shù)世界和機(jī)械思維。假設(shè)-求證-應(yīng)用的方法論應(yīng)用場景其實(shí)非常廣闊。比如,這兩年非常熱的精益創(chuàng)業(yè),精益思維最核心的點(diǎn)就在于最小化可行性驗(yàn)證。由于現(xiàn)實(shí)生活中我們的成本是有限的,不可能有個(gè)主意就全量鋪開,這也是不經(jīng)濟(jì)的。我們需要用最小的成本先行測試驗(yàn)證某一想法,就創(chuàng)業(yè)者而言就需要用最小的成本在真實(shí)場景中驗(yàn)證用戶是否真的有此需求。但此時(shí)得出的歸納性結(jié)論并不是機(jī)械定律般確定性的、因果明晰的,事實(shí)上,歸納無法確立因果,只能提供強(qiáng)相關(guān)、弱相關(guān)或不相關(guān)的參考。

再看靠近大數(shù)世界。國人愛好讀史,歷史本身何嘗不是大數(shù)據(jù)。但我們閱讀的史書只能是寥闊史料中挑選過的非隨機(jī)樣本(中數(shù)),即便如此,依舊是“太陽底下沒有新鮮事”——基于過去預(yù)測未來一定程度上確實(shí)是有應(yīng)用價(jià)值的。過去給我們對于未來的預(yù)測提供了一個(gè)外部視角,可以作為我們做具體預(yù)測的背景概率(曾看到有人戲稱經(jīng)驗(yàn)是人類的大數(shù)據(jù),我覺得蠻有意思,但個(gè)人經(jīng)驗(yàn)遠(yuǎn)達(dá)不到“大數(shù)據(jù)”的程度,充其量只是中數(shù),然而已經(jīng)可以為今后的預(yù)測和決策提供一個(gè)背景概率)。所以,大數(shù)思維對于日常生活最大的借鑒價(jià)值我認(rèn)為是提供一個(gè)外部視角的背景概率。當(dāng)面對具體的情況的時(shí)候,在這個(gè)背景概率的基礎(chǔ)上,分析具體情況做各個(gè)獨(dú)立的概率修正。

我們的知識要么源于自身和他人(同時(shí)代或歷史上)的經(jīng)驗(yàn),要么源于前人已經(jīng)提煉出來的原理。

對于自身和他人的經(jīng)驗(yàn),有兩種借鑒方式——一是直接復(fù)制,二是追究因果(雖然大多時(shí)候只是相關(guān)關(guān)系)予以應(yīng)用。都會覺得第二種好,但現(xiàn)實(shí)中大多數(shù)情況我們都在不自覺地按照第一種思路應(yīng)用,因?yàn)榈诙N不僅難,而且違背直覺——也就是說,大多人(包括我在內(nèi))大多時(shí)候是達(dá)不到機(jī)械思維的標(biāo)準(zhǔn)的。

對于前人已經(jīng)提煉出來的原理,也有兩種應(yīng)用方式——一是一元思維模型,二是多元思維模型。查理·芒格說過,如果你只有錘子,那么在你眼里什么都是釘子。因?yàn)槿绻粋€(gè)人只有一兩個(gè)思維模型,那么當(dāng)他思考現(xiàn)實(shí)的時(shí)候就不得不扭曲現(xiàn)實(shí)來符合自己的思維模型。這個(gè)時(shí)候,模型越精確具象,對一個(gè)人的思維限制就越厲害。所以查理·芒格指出,我們必須有多元思維模型,且這些模型必須來源于各個(gè)不同的學(xué)科(在這個(gè)學(xué)科細(xì)分的世界,永遠(yuǎn)別指望在一個(gè)院系中發(fā)現(xiàn)世間全部真理)。這種多元思維模型其實(shí)跟數(shù)據(jù)驅(qū)動下的多個(gè)簡單模型勝過單一精確模型是一樣的。即使我們面對的數(shù)據(jù)量很多時(shí)候達(dá)不到“大數(shù)”的層面,但一個(gè)人建立多元思維模型的前提就是比一元思維模型的人吸收了不同量級的底層數(shù)據(jù)。因?yàn)槊恳粋€(gè)模型都源于不少的經(jīng)驗(yàn)數(shù)據(jù)得出的原理,多個(gè)模型背后就是不同維度、不同量級的數(shù)據(jù)。這樣的多元模型容錯(cuò)性高,面對具體問題的分析也真正可以從不同側(cè)面不同維度得出盡量貼近真實(shí)的結(jié)論和對未來的預(yù)測。


本文參考書籍:

1、吳軍《智能時(shí)代》

2、吳軍《數(shù)學(xué)之美》

3、維克托《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》

4、溫伯格《系統(tǒng)化思維導(dǎo)論》

5、查理《窮查理寶典》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容