分享《數(shù)學(xué)之美》

大家好,我是八爪魚(yú),今天給大家分享的書(shū)籍是《數(shù)學(xué)之美》

這個(gè)題目估計(jì)會(huì)把人嚇跑一半,是的,這是一本科普書(shū)。

雖然是科普書(shū),確把我看得熱淚盈眶,不是書(shū)寫(xiě)的多么感人,而是,這本書(shū)實(shí)在是相見(jiàn)恨晚。當(dāng)然這么說(shuō)好像是有些夸張,但這本書(shū)確實(shí)是讓我感覺(jué)應(yīng)該早一些看看就好了。因?yàn)榘俗︳~(yú)雖然是正宗的理工男,但真的非常討厭數(shù)學(xué),更認(rèn)為自己沒(méi)有數(shù)學(xué)天賦,導(dǎo)致自己一路走來(lái),雖然也算披荊斬棘,但每次只要是跟數(shù)學(xué)有關(guān)的考試,都大敗而歸。

在八爪魚(yú)看來(lái),每次一說(shuō)到數(shù)學(xué)就頭大,腦海里就會(huì)浮現(xiàn)一大堆枯燥無(wú)聊的符號(hào)。有人說(shuō),數(shù)學(xué)是上帝的語(yǔ)言,是什么什么理解自然的鑰匙。自己千辛萬(wàn)苦從學(xué)校蹦出來(lái)后,勉強(qiáng)認(rèn)為算是拿到了幾把鑰匙,但這么多年來(lái)真的不知道那扇門(mén)在哪,鑰匙也就銹跡斑斑了。

而自從看完這本書(shū),我越來(lái)越認(rèn)為,自己的數(shù)學(xué)殘疾完全是因?yàn)閷W(xué)校里講數(shù)學(xué)太爛了、數(shù)學(xué)教材太爛了。如果八爪魚(yú)上高中的時(shí)候能看到這本書(shū),現(xiàn)在的八爪魚(yú)也許能從理工男變身于it男,金融男,能天天品著茶、大把大把數(shù)著鈔票。。。唉,反正至少不會(huì)像現(xiàn)在這么苦逼吧。。

所以,我強(qiáng)烈建議教育部,把高中數(shù)學(xué)教材換成這本《數(shù)學(xué)之美》,把數(shù)學(xué)老師的考核方式改為背誦本書(shū)中的名言警句。把高考高考解題變?yōu)閷?xiě)本書(shū)讀后感,來(lái)拯救哪些本來(lái)像我這么稟賦過(guò)人,但深受傳統(tǒng)教育毒害的同學(xué)們。

你可能問(wèn),說(shuō)你這么討厭數(shù)學(xué),怎么會(huì)找著買(mǎi)這本書(shū)呢,這里插句題外話,就是京東實(shí)在太壞了。這本書(shū)是劉強(qiáng)東硬送我的,東哥他們是在是大大的奸商,非常的狡猾奸詐,我已經(jīng)被他們誘騙兩次了。第一次很多年前是買(mǎi)了幾套專(zhuān)業(yè)書(shū),然后送了我《明朝那些事》第一本,結(jié)果看完第一本后吊足了我的胃口,就毫不猶豫的買(mǎi)了第二本,接著是第三本、第四本。。。一趟下來(lái)本來(lái)預(yù)算只有100元,結(jié)果從我口袋里奪走三四百大洋。

這次也一樣,京東送了我這本《數(shù)學(xué)之美》,后來(lái)我發(fā)現(xiàn)作者竟然還寫(xiě)了《浪潮之巔 上下》、《文明之光》、《大學(xué)之路》,于是跟明朝那些事一樣,我咬牙切齒又買(mǎi)了第二本、第三本。。。

不過(guò),話說(shuō)回來(lái),寫(xiě)的真心是不錯(cuò)。和八爪魚(yú)之前分享的從零到一類(lèi)似,本書(shū)一開(kāi)始是作者在谷歌黑板報(bào)上的一系列文章,獲得了大量的點(diǎn)擊量后在編制成書(shū)。

作者吳軍是谷歌的早期員工之一,谷歌資深研究員,畢業(yè)于清華大學(xué)和美國(guó)霍普金斯大學(xué),是谷歌中文搜索引擎的主要設(shè)計(jì)者,曾任騰訊搜索引擎副總裁,霍普金斯大學(xué)校董。

他把數(shù)學(xué)后面的本質(zhì)思維寫(xiě)的生動(dòng)透徹,文字引人入勝,吳軍的筆下,數(shù)學(xué)不再是一堆深?yuàn)W的符號(hào),而是實(shí)實(shí)在在的在源于生活的有趣的現(xiàn)象和思想的延伸,讓人驚嘆。

那么從作者的角度數(shù)學(xué)之美到底美在哪里呢,又能帶給我們什么啟發(fā)呢。

一直以來(lái),我們認(rèn)為數(shù)學(xué)主要是跟工科理科類(lèi)的專(zhuān)業(yè)聯(lián)系在一起,比如天文學(xué)學(xué)、工程學(xué)、經(jīng)濟(jì)學(xué)、力學(xué)、物理、化學(xué),甚至生物學(xué),和語(yǔ)言學(xué)幾乎是沒(méi)有交集的。而本書(shū)也是作者借助在語(yǔ)言和信息領(lǐng)域的工作經(jīng)驗(yàn)。從語(yǔ)言和數(shù)學(xué)的關(guān)系方面切入進(jìn)來(lái),讓我感到很新穎。

我們大概都明白語(yǔ)言的產(chǎn)生過(guò)程,早期人類(lèi)需要了解和傳播的信息是很少的,因此他們并不需要語(yǔ)言,隨著人類(lèi)進(jìn)步和文明的發(fā)展,表達(dá)的信息越來(lái)越多,語(yǔ)言也就自然而然產(chǎn)生,而且隨著歷史的推進(jìn),語(yǔ)言越來(lái)越豐富,越來(lái)越抽象。當(dāng)語(yǔ)言和詞匯多到一定程度,人類(lèi)僅靠大腦已經(jīng)記不住所有詞匯了,于是記錄信息的需求就產(chǎn)生了,這便是文字的起源。比如,公元前3200年的古埃及,文字的數(shù)量大約也就500多個(gè),到了公元前500至700年,文字的數(shù)量增加到了5000多個(gè),而后到現(xiàn)在文字的數(shù)量就不再增加,應(yīng)為一般而言我們根本記住不這么多文字。就漢語(yǔ)來(lái)說(shuō),我們常用的也是這5000多字。但是文明繼續(xù)發(fā)展,需要表達(dá)的信息越來(lái)越多,于是我們發(fā)明了歸納和分類(lèi),我們用同一個(gè)字在不同的場(chǎng)合表達(dá)不同意思,當(dāng)然隨之而來(lái)歧義也就產(chǎn)生。

而在記錄文字的過(guò)程中,人們也發(fā)明了很多有意思的方法,比如,在沒(méi)有印刷術(shù)之前,西方的圣經(jīng)主要依靠人工抄寫(xiě)傳播,但人工抄寫(xiě)就免不了會(huì)出錯(cuò),尤其每每寫(xiě)道上帝這個(gè)詞時(shí),抄書(shū)的人要虔誠(chéng)的洗個(gè)手祈禱一下,等回過(guò)神來(lái),就想,我靠,我剛才抄到第幾行了,這樣錯(cuò)誤就更多了。于是猶太人想了個(gè)辦法,每個(gè)字母都用一個(gè)數(shù)字表示,這樣每行文字加起來(lái)就是一個(gè)特別的數(shù)字,數(shù)字錯(cuò)誤就代表抄錯(cuò)了。聽(tīng)到這里,搞it的人已經(jīng)笑了,這不就是校驗(yàn)碼嗎,是的,這個(gè)古老的方法直到今天都在我們生活中廣泛的應(yīng)用,比如我們電腦拷貝文件的時(shí)候,再比如我們額身份證最后一位校驗(yàn)碼的應(yīng)用。

可以看到,文字可以看做是數(shù)字編碼,如果我們用不同的數(shù)字來(lái)代替獨(dú)立的文字,再來(lái)用計(jì)算機(jī)來(lái)處理這些數(shù)字編碼再合適不過(guò)了。于是我們?cè)O(shè)想,機(jī)器能不能懂得自然語(yǔ)言呢,能不能翻譯工作呢,能不能自己寫(xiě)作呢,現(xiàn)實(shí)已經(jīng)告訴我們答案是肯定的,而且做的相當(dāng)不錯(cuò)。

當(dāng)然我們一開(kāi)始走了很多彎路。開(kāi)始的時(shí)候,大家都認(rèn)為,如果要讓機(jī)器明白我們的語(yǔ)言,就必須讓機(jī)器跟我們有一樣的思維方式,有一樣的智能。為什么,很簡(jiǎn)單,因?yàn)槲覀兙褪沁@么做的,我們自然而然就想到了這個(gè)。

這順利成章的讓我們想到如果我們語(yǔ)法概括的越全面,計(jì)算機(jī)速度只要足夠快,就能讓計(jì)算機(jī)理解語(yǔ)言,于是我們想只要分析好語(yǔ)法規(guī)則就好了。而對(duì)于計(jì)算機(jī)這樣的嚴(yán)謹(jǐn)?shù)臋C(jī)器最擅長(zhǎng)的就是根據(jù)擬定好的程序運(yùn)行,可以說(shuō)最喜歡東西就是固定的規(guī)則,于是那個(gè)時(shí)候涌現(xiàn)出了一大堆語(yǔ)言學(xué)家開(kāi)始研究語(yǔ)法和他們的應(yīng)用。就拿翻譯來(lái)說(shuō),所要做的就是不斷的總結(jié)歸納語(yǔ)法,然后把每個(gè)句子應(yīng)該應(yīng)用哪條語(yǔ)法規(guī)則找出來(lái),換成另一個(gè)語(yǔ)言的語(yǔ)法,再把詞換掉,就算完成了。

但是這幫語(yǔ)言學(xué)家整了幾十年,發(fā)現(xiàn)即使是總結(jié)了幾萬(wàn)條的語(yǔ)法規(guī)則,也不過(guò)只能覆蓋生活中不到20%的真實(shí)語(yǔ)句。而用計(jì)算機(jī)計(jì)算時(shí),分析每一句話計(jì)算及需要在幾萬(wàn)個(gè)規(guī)則里尋找到可用的一個(gè),即使是用現(xiàn)在的最新i7電腦,分析一個(gè)三十個(gè)詞的長(zhǎng)句也要好幾分鐘的時(shí)間,效果就可想而知。

早年的翻譯軟件,比如金山快譯用的就是這個(gè)方法的簡(jiǎn)化版。

直到1970年IBM花生實(shí)驗(yàn)室的一名叫賈里尼克的人,開(kāi)發(fā)語(yǔ)音識(shí)別的軟件時(shí),發(fā)現(xiàn)根本沒(méi)有必要分析句子的語(yǔ)法,而是只要統(tǒng)計(jì)統(tǒng)計(jì)類(lèi)似的文章,看看一個(gè)單詞、或一個(gè)句子,在類(lèi)似的上下文中這個(gè)單詞或句子出現(xiàn)的概率是否大就萬(wàn)事大吉了。這個(gè)發(fā)現(xiàn)一下子把語(yǔ)音識(shí)別的準(zhǔn)確率從70%提高到了90%以上,并且計(jì)算量得到了大大降低。賈里尼克甚至幽默的說(shuō),他每開(kāi)除一個(gè)語(yǔ)言學(xué)家,語(yǔ)音識(shí)別率就會(huì)提高一點(diǎn)。

到現(xiàn)在,這個(gè)通過(guò)概率統(tǒng)計(jì)方法被大量的用在了語(yǔ)音識(shí)別、手寫(xiě)識(shí)別、文字識(shí)別,語(yǔ)言翻譯等等各種各樣的場(chǎng)合。所以別被所謂的現(xiàn)在的人工智能?chē)樀?,現(xiàn)在計(jì)算機(jī)還沒(méi)真正的智能,只是通過(guò)計(jì)算或是比較以前的樣本,告訴你最有可能對(duì)的結(jié)果而已。

看到這里,曾經(jīng)認(rèn)為概率論跟我一毛錢(qián)關(guān)系都沒(méi)有,大學(xué)概率學(xué)曾經(jīng)拿過(guò)近乎零分的我,一下子豁然開(kāi)朗,感覺(jué)復(fù)雜的問(wèn)題一下子簡(jiǎn)單化了,這里我看到了概率的魅力,數(shù)學(xué)的魅力。也展現(xiàn)了解決問(wèn)題的一個(gè)思路, 就是換一個(gè)方向,效率可能更高。

如同我們發(fā)明飛機(jī)之前,我們?cè)鴩L試各種通過(guò)模仿鳥(niǎo)兒飛行來(lái)制造飛機(jī),都以失敗告終。但實(shí)際上,我們并沒(méi)有模仿出鳥(niǎo)兒的飛行,而是是通過(guò)空氣動(dòng)力學(xué)解出的方程發(fā)明了飛機(jī)。能突破自己的固有思維,也許我們面臨的最大的障礙。

接著剛才說(shuō)的語(yǔ)言分析,其實(shí)可以發(fā)現(xiàn),實(shí)際的語(yǔ)法是無(wú)限條的,換句話說(shuō),任何文字文學(xué)都有語(yǔ)法覆蓋不到的地方,而其實(shí)正是這些例外或是不精確不確定性,讓我們的語(yǔ)言和文學(xué)更加的豐富多彩。比方說(shuō)我們的散文、和詩(shī)歌吧,如果按照語(yǔ)法檢查,我相信大家一定能找到很多病句,但可能就是這些病句反而成為了很多經(jīng)典。

剛才我們?cè)f(shuō)道文字從誕生到現(xiàn)在我們常用的也只有5000多字,但需要表達(dá)的不同意思確卻遠(yuǎn)遠(yuǎn)大于這些字,所以免不了會(huì)產(chǎn)生歧義,怎樣消除歧義的影響呢?接下來(lái),作者將不確定性的思路反過(guò)來(lái),引出了書(shū)中一個(gè)很唬人但最重要的概念,就是信息熵。

當(dāng)我們需要搞清楚一件非常非常不確定的事,或是說(shuō)我們一無(wú)所知的事,就需要了解大量的信息,而對(duì)某件事已經(jīng)了解很多,則不需要了解太多的信息就能搞清楚??梢哉f(shuō),信息量就等于不確定性的多少,信息熵其實(shí)就是信息量的定量表示。信息熵是可以計(jì)算的,單位是比特,一個(gè)漢字的信息量大約是5比特,比如一本50萬(wàn)字的書(shū)籍,信息熵大約就是250萬(wàn)比特。一本很厚的英語(yǔ)小說(shuō),翻譯成漢語(yǔ),會(huì)薄很多,也就是說(shuō)相同量漢語(yǔ)的信息熵比英語(yǔ)要高,信息量更大。而信息的作用就是消除這些不確定度。

進(jìn)一步延伸下去其實(shí)我們所做的很多事,甚至所有人類(lèi)活動(dòng),都可以理解為消除不確定性。而我們追求的就是通過(guò)高效的方法,更少的信息量來(lái)消除不確定性。比如,我們使用某個(gè)軟件覺(jué)得非常方便好用,實(shí)際就是軟件將大多數(shù)不確定度都幫我們消除了,消除剩余的不確定度我們花的代價(jià)越小,就覺(jué)得越方便。再比如我們學(xué)習(xí)某項(xiàng)技能、我們使用搜索引擎,我們進(jìn)入某個(gè)特定的領(lǐng)域等等都是消除不確定度的體現(xiàn)。

消除不確定性成為了作者在本書(shū)中的主要觀點(diǎn)之一,生活中也有非常的受用,作者提到的賈里尼克告訴他最多的就是怎樣的方法不好,而不是應(yīng)該怎么去做,這實(shí)際上就是在消除不確定度。這一點(diǎn)也和股神巴菲特告誡投資者們,我不告訴你們應(yīng)該做什么,只告訴你們不要去做什么的套路不謀而合。

從信息的不確定度和熵的概念,作者又進(jìn)一步引出了更為深?yuàn)W最大熵原理,簡(jiǎn)單講就是當(dāng)我們遇到不確定性的時(shí)候,要保留各種可能性才能獲得更好的結(jié)果,有些類(lèi)似不要把所有的雞蛋放在一個(gè)籃子里。在自然界,我們盡力保護(hù)每一中生物不被滅絕,我想也是這個(gè)道理。這么講看似簡(jiǎn)單,但應(yīng)用確不那么容易,據(jù)說(shuō)目前世界上能有效實(shí)現(xiàn)最大熵算法的不到一百人。而上面講到的賈里尼克離開(kāi)IBM后,應(yīng)用最大熵計(jì)算模型的在金融領(lǐng)域獲得了巨大的成功,成立了世界上最成功的對(duì)沖基金公司之一,其能量可見(jiàn)一斑。不知大家是否想試試。

熵是在是非常神奇的東西,在八爪魚(yú)的所學(xué)工程專(zhuān)業(yè)中一個(gè)重要的概念,與信息熵一樣也蘊(yùn)含著很深的哲學(xué)思想,比如所有事情一定會(huì)自發(fā)的朝著熵增加的方向發(fā)展,如同我們中國(guó)道的概念。待有機(jī)會(huì)八爪魚(yú)給大家分享分享,看看能不能給講明白。

除了信息熵,作者還講述了信息加密及破解、內(nèi)容的分類(lèi)、智能推薦、搜索引擎、以及最近比較火的大數(shù)據(jù)、人工智能的背后原理等等。也講了很多古典數(shù)學(xué)發(fā)展及現(xiàn)代信息大師的很多故事,比如哥白尼怎么發(fā)現(xiàn)的日心說(shuō),現(xiàn)代歷法是怎么精確計(jì)算出每年是365天,以及很多的小感悟等等,非常的有趣。

最后,需要告訴大家本書(shū)雖然是通俗的講解數(shù)學(xué),但一些內(nèi)容仍有一點(diǎn)點(diǎn)的專(zhuān)業(yè)度,需要一定的數(shù)學(xué)基礎(chǔ)。如果覺(jué)得挑戰(zhàn)實(shí)在有些大,可以看看作者的另外一本書(shū),智能時(shí)代,寫(xiě)的更加通俗一些。

另外作者的另外幾套套書(shū)浪潮之巔, 文明之光、大學(xué)時(shí)代也超級(jí)棒,一套是講硅谷的創(chuàng)業(yè)史,一套是高等教育的發(fā)展和思考,尤其是文明之光、大學(xué)之路,非常值得一讀,希望未來(lái)有機(jī)會(huì)向大家分享。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容