《智能簡史》9:語言的誕生
1.語言是機緣巧合之下多個因素共同作用的結(jié)果。我們能因為語言而變成人,開啟文明,是一場各種因素合力形成正反饋造成的完美風暴。
2.語言是后天學習的結(jié)果,在直立人的社交互動中產(chǎn)生的,是一種刻意的、非自發(fā)的表達。因為我們是社會動物,所以我們才有了語言。
3.輪換式溝通、共同注意力和會提問,是三種人類大腦預裝的學習語言的先天能力。
大腦的第五次,也是目前為止的最后一次突破,那就是語言。
語言是怎么產(chǎn)生的呢?中國古代有句話叫「鸚鵡能言,不離飛鳥;猩猩能言,不離禽獸」,那人的語言跟黑猩猩、猴子的語言又有什么不同呢?
簡單說,語言是機緣巧合之下多個因素共同作用的結(jié)果。我們能因為語言而變成人,開啟文明,是一場各種因素合力形成正反饋造成的完美風暴。
?
大約一千五百萬年前,我們跟黑猩猩共同的祖先,一種開啟了心智理論、會搞政治的靈長類動物,是主要以吃果子為生。他們生活在非洲大陸,當時的非洲全是森林,有很多果子可吃,可以說是很不錯的生活。
如果日子一直就這樣過下去,今天的我們還是黑猩猩。
但幸運的是,又或者說對當時的祖先不幸的是,從大約一千萬年前開始,非洲的環(huán)境發(fā)生了變化。地殼運動造成在相當于今天的埃塞俄比亞的那個地方,形成了一個新的地形,叫「東非大裂谷(Great Rift Valley)」。


大裂谷把非洲分成了東西兩側(cè):西邊這一側(cè)還是森林,東邊這一側(cè)面積很小,卻是慢慢地樹都死了,變成了一片草原。
等到大約六百萬年前,大裂谷周圍長出了新的山脈,把東西兩側(cè)就給隔絕開了。于是當初那個靈長類動物,也就被分成了東西兩個族群。西邊這個族群因為還是森林環(huán)境不變,所以他們也沒什么大變化,就演化成了今天的黑猩猩。
而我們的祖先,屬于東邊這個族群。

我們現(xiàn)在沒有果子可吃,必須適應草原環(huán)境。
到距今四百萬年前,我們開始直立行走。為啥直立行走就有利于適應草原環(huán)境,現(xiàn)在有多種說法??赡苁钦镜酶咴诓輩仓芯涂吹眠h,也可能是皮膚被太陽曬的面積更小,誰也說不準。雖然是直立行走,但此時的我們并不比黑猩猩聰明很多,我們的大腦跟他們差不多大,我們用的工具也不高級。
等到距今兩百五十萬年前,東部草原這個環(huán)境中演化出了很多大型哺乳動物,有大象、斑馬、長頸鹿、野豬,更有食肉的獅子、豹、劍齒虎等等。在這種環(huán)境里肉食才是王道!我們也開始加大肉食比例,升級自己的生態(tài)位。黑猩猩的食物中只有10%是肉類,而此時我們祖先的食物中已經(jīng)有30%是肉類。
這其實很不容易,因為我們吃肉并不方便。人家獅子老虎都有鋒利的牙和爪子,我們可沒有。當時我們打獵的技能很一般。研究表明,我們吃的主要是……腐肉。也就是老虎獅子吃飽離開了,我們默默地走過去把剩下的肉再吃一吃。我們會用石頭工具剝皮,特別是可以把骨頭砸開,吃里邊營養(yǎng)豐富的骨髓。我們就這么卑微地逐步變成了一個食肉物種。
?
到距今五十萬年前,我們終于演化成了「直立人(Homo Erectus)」。注意這只是一個學術名稱,其實我們早就直立行走了,只是之前不叫這個名。直立人成長為草原上最高端的物種。我們的食物中有85%都是肉類,因為我們掌握了高級打獵技術。此時的我們已經(jīng)如此厲害,以至于把一些大型食肉動物,像什么劍齒虎,給屠殺滅絕了。

我們的打獵技術好,部分原因在于我們發(fā)明了各種新工具。我們學會了投擲武器,甚至用上了長矛。

更重要的是,我們的身體發(fā)生了變化。腿變長了,這有利于奔跑。特別是我們的皮膚退掉了動物那身毛,還長出了汗腺,這使得我們可以用全身出汗的方式散熱。而你要知道其他所有哺乳動物降溫都只能靠喘氣。
這就使得我們能在長途奔跑中保持涼爽。事實上,直立人是動物王國中耐力最好的選手。羚羊什么的短跑速度比我們快得多,但是耐力不行。所以我們打獵的絕招就是長時間地追蹤。我們善于識別動物的蹤跡,只要盯上了就能一直追到底,等獵物終于跑不動了,就變成了我們的食物。
我們的大腦進入了快速升級通道,直立人的大腦是黑猩猩的兩倍那么大。

直立人的下顎和內(nèi)臟都變小了,長得更像現(xiàn)代人而不像黑猩猩??蛇@是怎么做到的呢?按理說我們的大腦比以前大了一倍,身體也更大了,那我們必定需要更多的能量啊,怎么吃飯的關鍵部位還變小了呢?唯一合理的推斷是,我們學會了用火,開始吃熟肉。


吃熟肉比吃生肉能多吸收30%的營養(yǎng),而且消化時間要短得多。直立人用上了火,比現(xiàn)代人用上冰箱可重要多了。
當然,這一切的好處也帶來了一些不方便。最大的不方便就是直立人的腦袋太大。本來直立行走就使得直立人的臀部變小,于是帶來一個問題:小孩出生時,頭部難以通過產(chǎn)道。我們解決的辦法是提前出生。
其他動物都是在媽媽肚子里長成了再出生,比如說牛出生幾個小時就會走路……而人類的寶寶都屬于早產(chǎn),得出生一年后才能走路。這就意味著他必須始終有人照料。像黑猩猩那樣靠媽媽一個人撫養(yǎng)孩子已經(jīng)變得不現(xiàn)實,于是直立人進入了以一夫一妻制為主的社會形態(tài),父親必須照料家庭。
接下來的問題是,直立人會說話嗎?
?
學者們推測,語言就是在直立人的社交互動中產(chǎn)生的。
最早應該是起源于父母和子女之間的對話。直立人要制造復雜的工具,有語言的幫助教學會容易得多。但學者關心的是,我們?yōu)槭裁匆獙ψ约杭胰艘酝獾娜苏f話呢?
這個關鍵在于,你跟別人說話,幾乎總是對對方有好處。你或者是告知一個什么事情,或者是教他一個什么東西 —— 使用語言是一種利他行為??晌覀?yōu)槭裁匆獛椭H屬以外的人?
可能是因為群體選擇。群體生活鼓勵利他行為。昨天打獵的時候誰救了你一命,前天你幫了誰一個忙,這樣的事情應該得到表揚,這個群體的競爭力才能增加。反過來說如果有人做損人利己的事,我們應該批評。
那我們怎么鼓勵利他,懲罰利己呢?辦法恰恰就是通過語言。非親屬關系的人坐在一起聊天,最主要的場景就是說些「閑言碎語」,也就是gossip —— 也可以說是流言蜚語,反正肯定是對別人說三道四、說長道短。其實現(xiàn)在我們也是這樣,大家聚在一起說閑話最愛議論別人,傳播個小道消息之類……這可不叫造謠傳謠,這叫輿論監(jiān)督。
正是因為老百姓私下的議論,社區(qū)才能表彰利他,譴責利己。所以語言促進了群體內(nèi)部的合作。而群體合作增加,又進一步讓語言變得有意義,現(xiàn)在我們更愿意跟人說話了,于是我們的語言能力就會提高。這是一個正反饋過程!語言就這樣得以傳播。
到大約十萬年前,我們正式擁有了語言。
?
那人的語言是大腦中的什么特殊結(jié)構帶來的嗎?乍一看似乎是的。
人的大腦幾乎就是放大版的黑猩猩大腦,只有一點點不同,但不是結(jié)構上的不同。我們的新皮層的左側(cè)有兩個區(qū)專門用于語言功能:一個叫布洛卡區(qū)(Broca's Area),用于輸出語言;一個叫韋尼克區(qū)(Wernicke's Area),用于理解語言。這像是硬件設定,但其實不是。要知道新皮層是通用的,很多人的語言功能不出現(xiàn)在這兩個區(qū)域,放在別處也可以。

再者,只有人有喉嚨和聲帶能發(fā)出復雜的聲音,黑猩猩沒有這個能力,所以黑猩猩怎么教都學不會說話。但這個限制也不是決定性的:事實上你可以教黑猩猩用手語和圖形說話,它們也能表達一些簡單的意思,只是不能形成復雜的語法而已。不會用嗓子說話,不等于沒有語言能力。
人跟黑猩猩的語言到底差在哪呢?關鍵似乎不是解剖學上的區(qū)別,而是一些更細微的東西。真正的區(qū)別是,人的語言是個需要學習的系統(tǒng),而黑猩猩雖然也會發(fā)聲交流,但它們那只是一個反射性的情緒表達系統(tǒng)。
比如你看到好笑的事情會大笑,難過了會哭,這些都是情緒的反射,是自發(fā)的,這不用學。反射性情緒表達的特點是所有人都一樣,全世界所有的人的自發(fā)表情是一樣的。黑猩猩也是如此。黑猩猩遇到各種事情會發(fā)出長短不一的叫聲,那些全都是自發(fā)情緒反射,所有族群的表達方式都一樣,沒有方言和外語。哪怕一只黑猩猩從小不跟其他猩猩生活在一起,它的本能反應也還是一樣。
而人和黑猩猩的區(qū)別在于,我們在反射性表達之外,還有一種刻意的表達。你明明覺得這件事不好笑,也可以做出一副正在笑的表情。這個表情,可就不是人人都一樣的了。這就解釋了為什么不同文化的微表情不一樣,以至于用表情測謊是靠不住的。
我們的語言,恰恰就是一種刻意的、非自發(fā)的表達。這就是人類語言和黑猩猩的叫聲根本的不同。

語言不是天生的東西。
?
語言一定是后天學習的結(jié)果。這就是為什么不同地區(qū)、不同族群使用的語言那么不同。
當然演化必須先在我們的大腦中預裝一點什么東西,我們才能有學語言的能力。這就如同小鳥剛出生的時候不會飛,它必須得學,才能飛 —— 但它的基因的確準備了一個能讓它學飛的系統(tǒng),比如會蹦跳,才行。
那人預裝的能讓我們學語言的系統(tǒng)是什么呢?它不在新皮層,推測可能是隱藏在杏仁核和腦干這些古老區(qū)域深處的一些東西。這個系統(tǒng)給了人三個本能,是黑猩猩所沒有的 ——
第一個本能是輪換式的溝通。嬰兒和母親會以一種對話式的方式溝通,也就是你說一句我說一句,哪怕只是發(fā)出一個聲音也好,但一定有回應有互動。
第二個本能是共同的注意力。母親指向一個什么東西,說你看那里!孩子就會去看那里。母親說這是一朵花,孩子就明白了。這種雙方共同注意同一個地方的能力,是學語言的關鍵。
第三個本能是提問。這聽起來有點驚人,但是結(jié)論很清楚:一切動物之中只有人會提問。
有了這三個先天能力,我們就可以在后天學習語言了。
?
以前聽說是某個基因突變讓人有了語言,現(xiàn)在看來不是那么簡單。如果說大腦的前四次突破是發(fā)生在個體身上,語言這個第五次突破,卻是具有明顯的社會意味。因為我們是社會動物,所以我們才有了語言。
語言讓大腦和大腦聯(lián)網(wǎng)。以前的我們是單獨的個體,現(xiàn)在我們是網(wǎng)絡中的一個個節(jié)點。這使得我們的知識能夠突飛猛進……
《智能簡史》10:文明之旅
1.語言帶給我們的不只是一項個人能力,更是一項積累知識和建設文明的能力。
2.語言把想象的模型壓縮成一條條精煉的「知識」,從此讓知識容易傳承,可以積累,讓我們的思想復雜度指數(shù)增加,而且因為有了語言,有了神話,有了共同的想象,現(xiàn)在我們的合作人數(shù)上限是無窮大。
3.大腦的演化遠遠沒有結(jié)束,智能可以說是剛剛開始,將來必定還會有其他的突破。第六次突破,也許我們不再受制于自然選擇,會更主動地變革。
語言是人類特有的能力,也是人腦目前為止掌握的最后一項新能力,在大約十萬年前達到成熟。我們的祖先 —— 以及我們自己 —— 是直立人的一個分支,叫「智人(Homo Sapiens)」,我們在七萬年前走出非洲,最終殺死了其他所有的人類分支,成為地球唯一的主人。
我們今天的大腦,跟十萬年前并沒有區(qū)別 —— 但我們的文明卻是天差地別。這是因為語言帶給我們的不只是一項個人能力,更是一項積累知識和建設文明的能力。
?
語言能讓說話的人把自己內(nèi)心想象的場景和動作,傳遞給聽話的人。這個功能大大提高了交流的效率。
比如你是個直立人,在野外發(fā)現(xiàn)一具羚羊尸體,自己扛不動,就回住的地方叫人。有了語言,你只要說:“快跟我來,東邊兩英里處有一具羚羊尸體?!边@就是傳遞一個場景。如果沒有語言,你怎么表達這個場景?方向可以用手比劃,可是距離怎么比劃?你又如何說明那是一頭羚羊,而且已經(jīng)死了?
再比如說,你和另一個獵手正在伏擊一只羚羊。你對他說:“我吹三聲口哨之后,我們就一起動手?!边@就是把你對動作的想象傳遞給對方。
這個傳遞想象的能力,是又一次學習的革命?!吨悄芎喪贰愤@本書講了四種學習方式 ——
1. 脊椎動物的強化學習,也就是試錯,是從自己的行動中學習;
2. 哺乳動物的模擬學習,是從自己的想象中學習;
3. 有了心智理論,靈長類動物可以通過模仿另一個人做事來學習,也就是從他人的行動中學習;
4. 而有了語言,我們則能夠從他人的想象中學習。
從他人的想象中學習,有兩個好處。
一個是容易領會意圖。單純旁觀別人做事總有一個問題,就是你不知道他哪些動作是有意的、必要的,哪些動作是無意的、多余的。黑猩猩能跳過無關的動作,只模仿有用的步驟 —— 但有時候任務特別復雜,你搞不清楚哪個動作有用哪個沒用。
人類兒童旁觀大人做事的時候,會把老師的每一個動作都模仿下來。這其實是比黑猩猩更聰明、更謹慎的做法……這樣學習的畢竟效率低??墒侨绻蠋熞贿呑鲞€能一邊講,給個解說,直接告訴學生每個動作的意圖是什么,學生立即就知道哪些動作是有用的,學習效率就大大提高了。
另一個好處是語言能把信息大大地濃縮起來。長輩告訴晚輩:“這片森林里有兩種蛇,紅色的會咬人,有毒;綠色的不咬人,是安全的。”有這一句話,孩子立即就掌握了其中的因果關系模型。而如果沒有語言,你得旁觀多少次人與蛇的遭遇,才能領悟到這個模型呢?
有了語言,我們就把想象的模型壓縮成了一條條精煉的「知識」。
?
語言不但讓知識變得容易傳承,更讓知識成了可積累的東西。這里特別想用一個詞叫「可縮放」,也就是scalable??煽s放就意味著這個東西可以不斷地增長而不用擔心邊際效益遞減,意味著它的上限高。
黑猩猩也有教學能力,能傳承一點技能。但是因為旁觀學習的效率太低,它有一個很低的天花板。而語言讓人類可以傳承多得多的知識,以至于這些知識可以一代一代積累起來,正反饋增長。
可縮放之后,知識與知識之間就會發(fā)生化學反應。高級知識必須建立在更底層知識的基礎之上。
比如說,考古發(fā)現(xiàn)早在十萬年前,人類就已經(jīng)會縫制衣服了。這是一個綜合性的技能。你首先得有皮革,這意味著你得會剝動物的皮,還得懂得晾曬皮革的方法;然后你得會制作針和線,線是某種繩索,針是用骨頭做的。而所有這些,又依賴你要先有非常鋒利的石器。

必定是某一代人發(fā)明了石刀,某一代人發(fā)明了制皮,某一代人發(fā)明了骨針,所有這些發(fā)明都被后面一代代的人繼承下來,才能有人發(fā)明縫制衣服。
到了這一步,知識已經(jīng)不只是存在于人腦*之中*,更是存在于人腦*之間*,成了某種近乎獨立的存在。人腦只是知識的載體而已,知識本身好像有了生命力。就像凱文·凱利在《科技想要什么》這本書中說技術是有自己的生命的……又或者用理查德·道金斯的說法,知識就如同基因一樣,成了「meme(模因)」,自己就有傳播力。
從直立人到智人,到近代,又發(fā)生了四件事,使得知識的傳播力更強了 ——
1. 大腦擴容,智人的大腦比直立人還要大得多,單個大腦能傳承的知識量增加了;
2. 人與人之間有了分工,這樣每個人只需要負責一部分知識:有的人專門研究打獵,有的人專門制作武器,有的人專門縫衣服,知識變得專業(yè)化;
3. 人口規(guī)模擴大,更多的大腦就可以存儲更多的知識;
4. 最重要的一步,是我們發(fā)明了文字。
文字的出現(xiàn)把知識增長的天花板推到了無限高,至此知識的增長已經(jīng)完全可縮放了。我們的知識突破了所有人頭腦總和的限制,可以被近乎永久性地存儲在“云端”的書籍之中,后人想學只需要下載就行。
那是爆炸式的知識增長。
現(xiàn)在我們說拐點、說奇點,說的是AI帶來的智能加速增長 —— 但事實上,人類歷史上已經(jīng)發(fā)生過一次奇點,那就是語言帶來的想法大爆炸:有了語言,我們的思想的復雜度指數(shù)增加。

當然用今天的標準看,那是一個歷時十萬年的緩慢過程。但是用演化的尺度看,十萬年只是一瞬間。
?
從以前以個體大腦為本,到現(xiàn)在以知識為本,我們所能合作的人數(shù)也變得可縮放了。
這是尤瓦爾·赫拉利《人類簡史》一書中的招牌學說,不過這個思想最早來自美國語言哲學家約翰·希爾勒(John Searle)。
有了語言,一個人可以把自己純粹想象出來的東西傳遞給另一個人,而這可以是任何東西。是個神話故事也好,是個信念也好,都可以跟人共享。用赫拉利的說法,能共同相信一個虛構的事物,是智人的超能力。
宗教就是這么來的。兩個本來沒有關系,互相不認識的人,因為信仰同一個宗教,就可以被動員起來,一起出去打仗,一見面就是戰(zhàn)友,就能親密無間地合作。其他動物可沒有這個能力。
從有語言那一天起,對人類來說,虛擬的東西就已經(jīng)比真實的東西更高級了……脫實向虛才是文明之旅。
宗教是虛構的,難道金錢就不是虛構的東西嗎?為什么你相信這個貝殼、這塊銀子或者這張紙幣有價值呢?因為那是全民共同的信念,也就是一個共同的想象。同樣道理,國家、公司這些事物本質(zhì)上也是虛構的。你說公司到底是個什么東西,是你們公司所在的那座大樓嗎?是來來走走的員工嗎?是產(chǎn)品嗎?又或者只是一個圖章?都不是。公司只存在于我們的想象之中,因為我們共同相信它存在,所以它存在。
如果沒有共同的想象,靈長類動物就只能跟與自己有線下互動關系的人合作,合作的上限很低,由各自大腦新皮層的大小決定 ——

獼猴只能跟30個熟人合作,黑猩猩的合作上限是50,人類的熟人上限也只有150 —— 也就是所謂的「鄧巴數(shù)」。但是因為有了語言,有了神話,有了共同的想象,現(xiàn)在我們的合作人數(shù)上限是無窮大。
?
總結(jié)來說,《智能簡史》這本書講了大腦演化史上的五次突破 ——
第一次突破是出現(xiàn)了第一個大腦。哪怕是個線蟲,也有聯(lián)想學習的能力,也就是條件反射,它會自動地趨利避害。
第二次突破是脊椎動物的強化學習。這意味著一定的預測能力,多巴胺能感覺到往哪里去會得到獎勵。
第三次突破是哺乳動物獲得新皮層,會在大腦中建立一個模型對世界進行模擬。
第四次突破是心智化,靈長類能理解他人在想什么,有了模仿學習。
第五次突破是語言。
對比一下AI的發(fā)展,現(xiàn)在的生成性AI,也就是大語言模型,有語言能力,會聯(lián)想學習和強化學習,但是它有世界模型嗎?它有心智理論嗎?
大語言模型似乎抓住了訓練語料背后那個真實世界的投影,它可以進行常識推理,對世界有理解力。再者,現(xiàn)在你問ChatGPT一道數(shù)學題,它能忍住不給你脫口而出的答案,它會主動調(diào)用一個數(shù)學工具來計算,已經(jīng)表現(xiàn)出一定的系統(tǒng)2思維能力。但你要說大語言模型是不是真的有世界模型,現(xiàn)在的確還有爭議。
而在心智化方面,AI可能還有更大的問題。人們對AI的一個常見擔心是所謂「回形針問題(paper-clip problem)」,這是瑞典哲學家尼克·博斯特羅姆(Nick Bostrom)在他2014年出版的《超級智能:路徑、危險、戰(zhàn)略》(Superintelligence: Paths, Dangers, Strategies)一書中提出的一個思想實驗。
博斯特羅姆說,假設你給AI下了一個命令,讓它去「最大限度地生產(chǎn)回形針」,你猜AI會怎么做?這取決于AI如何理解“最大限度”這個詞。
如果是字面意義上的最大限度,那么AI就不但會改進工廠的工藝流程,而且會設法征集所有的原材料,甚至地球上所有的資源都用來生產(chǎn)回形針,并且準備向宇宙進發(fā)……這顯然不是我們想要的。
這個難題的意思是語言問題不僅僅是語言問題,我們有很多盡在不言中的默契,而AI必須有心智能力,能理解那些背后的默契,才能跟人良好互動。當老板說“最大限度地生產(chǎn)回形針”時,他的意思是在合理范圍內(nèi)增加產(chǎn)量,而肯定不是要把整個宇宙的資源都用來生產(chǎn)回形針。這就如同朋友建議你“今晚吃頓好的”,他的意思不是讓你去吃世界上最好吃的飯,而是在合理范圍內(nèi)吃頓好的??墒鞘裁唇小昂侠矸秶鷥?nèi)”呢?這就需要常識、需要對世界有真實的理解。
在班尼特寫《智能簡史》這本書的大部分時間內(nèi),GPT-4還沒有出來;等到GPT-4出來,他已經(jīng)幾乎完稿了。他有點低估了當前大模型的能力 —— 但是他對心智化的強調(diào)是非常合理的。
有了班尼特這本書,現(xiàn)在我們就更知道未來努力的方向在哪。
?
地球上有生命的歷史大概有40億年,大腦的演化歷史還不到6億年,我們當前這個大腦定型才10萬年。如果一直平安無事,我們大概還可以在地球上繼續(xù)生活50億年,太陽才會變成紅巨星。而如果我們能在那之前成為一個沖出太陽系的星際文明,這個宇宙未來還有幾萬億年的時間供我們繼續(xù)演化……
如果這樣想,那么大腦的演化遠遠沒有結(jié)束,智能可以說是剛剛開始,將來必定還會有其他的突破。
班尼特認為第六次突破必定是人腦和AI的結(jié)合。怎么個結(jié)合法現(xiàn)在不好說,但我們肯定不再受制于自然選擇,我們會更主動地變革。
歷史經(jīng)驗表明,大變革總是跟外部環(huán)境的變化有關,常常伴隨著一些犧牲……所以我們大概不應該盲目期待,但是我們的確有理由感到樂觀。