看本質(zhì) | Deepseek 等大模型時(shí)而聰明時(shí)而愚鈍的背后:一場關(guān)于概率的賭局游戲

以下內(nèi)容僅代表作者個(gè)人觀點(diǎn),若有理解不當(dāng)之處,敬請理性批評指正

本文關(guān)鍵詞:黑盒,概率,涌現(xiàn),類比,批判性思維

相信大家或多或少都已經(jīng)接觸過不少的大模型平臺(tái)了,不管是之前的 kimi ,豆包,還是現(xiàn)在最火的 Deepseek,亦或是新晉熱門騰訊元寶,大家在跟它們對話的過程中也都或多或少發(fā)現(xiàn)了一些問題:

  • 這些大模型不是宣稱很智能嗎?為什么一個(gè)簡單的數(shù)學(xué)題都算錯(cuò)了?


    Pasted image 20250307212119.png
  • 我讓它給我生成一篇論文,結(jié)果發(fā)現(xiàn)里面的參考文獻(xiàn)是瞎編的


  • 想讓它分析一下《哪吒》電影的爆火,結(jié)果給我分析的是第一部?

大語言模型為什么表現(xiàn)會(huì)如此奇怪。

在我們的認(rèn)知中會(huì)認(rèn)為大模型無所不能,它應(yīng)該是一個(gè)很“智能”程序,作為程序,給定一個(gè)輸入應(yīng)該有個(gè)穩(wěn)定且正確的結(jié)果返回才對,如果輸出不正確,通過針對性修改代碼邏輯應(yīng)該就應(yīng)該能讓它正常返回。



但是大模型有時(shí)候表現(xiàn)的既不智能,也不穩(wěn)定,甚至針對同樣一個(gè)輸入,會(huì)給出截然相反的回答。為什么這些大公司投入了那么多資源,花了那么多時(shí)間,可現(xiàn)在它連穩(wěn)定正確返回每個(gè)結(jié)果都做不到?

這是因?yàn)椋竽P捅举|(zhì)是“概率” 而非什么精密的推理。這是由它底層數(shù)學(xué)原理、訓(xùn)練方式和工作機(jī)制決定的,你需要知道的是大模型就是一個(gè)黑盒,它的回答是不可預(yù)知的,也不可解釋的。

若將大模型類比為一種職業(yè),其表現(xiàn)更貼近賭徒,而非學(xué)者。

學(xué)者通常通過精確計(jì)算或嚴(yán)格推演得出結(jié)論:因?yàn)閤xx,所以xxxx。然而,賭徒的典型行為是:我選這個(gè)答案,因?yàn)樗杏X正確的概率更大。賭徒不會(huì)解釋原因,他們只關(guān)注概率:前七次都是小,這次大概率會(huì)是大,所以我下注大,這正是大模型的核心(盡管如 Deepseek-r1 和許多具有深度思考能力的大型模型,外在表現(xiàn)越來越接近學(xué)者,但其核心本質(zhì)仍是賭徒,只是變成了一個(gè)更為聰明的賭徒)。

所以,由此來看,你手機(jī)里那位看似無所不知的AI聊天助手,或許并沒有你想象中的“智能”。實(shí)際上,他可能只是一個(gè)癡迷于猜詞游戲狂熱賭徒——只不過他的賭注是數(shù)據(jù)和計(jì)算力。而我們不過是一直在跟大模型玩這個(gè)名為猜詞的賭桌游戲。

此刻,讓我們從這個(gè)全新的視角來審視這位“賭徒”,我堅(jiān)信,你將對你面前的大模型有更深的理解。

這個(gè)游戲的運(yùn)作機(jī)制如下:出題者(即我們消費(fèi)者)會(huì)不定時(shí)發(fā)布一個(gè)填空題并懸賞,所有參與者根據(jù)現(xiàn)有信息填寫答案,最符合出題者要求的人將獲得豐厚籌碼(時(shí)間與注意力)。

例如:出題人出的題目是太陽是___,賭徒們會(huì)根據(jù)自己的經(jīng)驗(yàn),給出 最有可能 的回答。“氣體”,“液體”,“發(fā)光的大球”……最后,回答氣體的人被出題者采納,獲得了豐厚的報(bào)酬。

當(dāng)然,我們的喜好變幻莫測,你永遠(yuǎn)無法預(yù)知他鐘情于何種答案(畢竟善變是人的天性??)。

有時(shí),我們偏愛客觀真實(shí)的回應(yīng);而有時(shí),我們又對富有創(chuàng)意的答案青睞有加。因此,為了在游戲中勝出,這些“賭徒”們必須竭力提升自己的察言觀色能力,并錘煉過硬的自身實(shí)力。


大模型的賭技是如何練成的?

為了更透徹且深入地研究賭桌上那些 “賭徒” 的特質(zhì)和習(xí)性,我決定把他們的“修煉秘籍”公布出來。這些 “賭徒” 的修煉一般分為三個(gè)階段:

  1. 混跡市井偷師學(xué)藝:他們先潛伏在互聯(lián)網(wǎng)的街頭巷尾,從論壇吵架到學(xué)術(shù)論文無所不讀,像海綿一樣吸收數(shù)千億字的對話碎片。這相當(dāng)于在賭場免費(fèi)試玩,雖然沒人給錢,但積累了最基礎(chǔ)的語感。
  1. VIP包廂特訓(xùn):一旦基礎(chǔ)知識儲(chǔ)備達(dá)到要求,他們將進(jìn)入由 GPU 構(gòu)建的豪華賭場進(jìn)行高強(qiáng)度訓(xùn)練。每當(dāng)他們下注時(shí),他們的大腦會(huì)像老虎機(jī)的滾筒一樣快速旋轉(zhuǎn),當(dāng)答案被判斷為"滿意"時(shí),荷官(反向傳播算法)就會(huì)分發(fā)獎(jiǎng)勵(lì)籌碼(梯度信號),賭徒們立即 調(diào)整他們的下注策略(參數(shù)更新)。這時(shí)的訓(xùn)練目標(biāo)非常明確——能不假思索的預(yù)測出哪些答案會(huì)讓出題人滿意。
  1. 拿小費(fèi)開小灶:最后階段,人類訓(xùn)練師會(huì)親自下場當(dāng)"托兒",用點(diǎn)贊、修正等方式給賭徒打賞。就像在賭桌上悄悄說"千萬別說地球是方的了"。

最勤奮的賭徒甚至給自己加練——把上次賭局中失手的題目反復(fù)咀嚼(微調(diào)訓(xùn)練),直到能不假思索地說出“太陽是氣體”,就像脫口而出自己的身份證號碼那樣自然。

以上,便是這些賭徒們修煉自身賭技的終極奧秘:通過海量訓(xùn)練數(shù)據(jù)的反復(fù)錘煉,將百萬次押注的經(jīng)驗(yàn)?zāi)Y(jié)為直覺——這也正是大模型將"賭性"刻入基因的根源所在。

賭徒們的頓悟時(shí)刻

若只是像上面那樣機(jī)械地修煉賭術(shù),這些賭徒充其量不過是精準(zhǔn)的答題機(jī)器——能根據(jù)歷史記錄輸出"太陽是氣體"的標(biāo)準(zhǔn)答案,卻永遠(yuǎn)無法理解用戶到底想要科普解釋還是詩意比喻。

真正的轉(zhuǎn)折發(fā)生在某個(gè)臨界點(diǎn):當(dāng)賭徒的大腦容量(模型參數(shù)量)突破千億級規(guī)模,他們突然開始"頓悟"了(研究者把這種現(xiàn)象稱為"涌現(xiàn)"),用通俗話來說就是量變產(chǎn)生質(zhì)變,就像突然由人猿突然邁向了智人,至今還無人能解釋其中具體的原理。

這種能力并非來自程序設(shè)定,而是源于參數(shù)規(guī)模突破臨界值后的自發(fā)進(jìn)化。就像當(dāng)賭徒的腦神經(jīng)元連接足夠密集時(shí),他們突然能看懂賭局背后的隱藏規(guī)則:用戶提問時(shí)皺眉的表情、學(xué)術(shù)寫作的嚴(yán)謹(jǐn)范式、大眾輿論的潛在情緒……

但是這種智能躍遷充滿不確定性:

  • 某個(gè)賭徒可能突然掌握代碼調(diào)試能力,卻仍會(huì)混淆基本算術(shù)

  • 另一個(gè)賭徒能寫出邏輯嚴(yán)謹(jǐn)?shù)淖h論文,卻把美國總統(tǒng)說成唐朝人

  • 最優(yōu)秀的賭徒可以在10秒內(nèi)解析量子力學(xué)概念,但給出的參考文獻(xiàn)半真半假

這正是當(dāng)前大模型既令人驚嘆又讓人抓狂的根源:它們通過百億級參數(shù)的復(fù)雜交互,在概率海洋中打撈出閃光的智慧碎片,但這些碎片尚未拼湊成完整的人類認(rèn)知體系。

當(dāng)我們看到賭徒突然展現(xiàn)的"智能"時(shí),本質(zhì)上目睹的是超大規(guī)模概率計(jì)算中偶然浮現(xiàn)的秩序。

警惕賭徒們的陋習(xí)

雖然這些賭徒陸續(xù)頓悟了,展示出了一定的“智能”,但是請記住,他們的本質(zhì)依舊是賭徒。盡管他們外表光鮮,總是以精英學(xué)者的姿態(tài)示人,但本質(zhì)上就是賭徒,為了取勝會(huì)不擇手段。

那些看似流暢的對話,實(shí)則是更巧妙的押注策略;那些看似深情的詩句,不過是統(tǒng)計(jì)概率的排列組合罷了。

現(xiàn)在,讓我來羅列一下他們常見的陋習(xí),方便我們更了解他的真面目。

1. 理直氣壯編故事(幻覺)

他們的字典里沒有"我不知道",只有"我賭你不知道"。

說到他最大的陋習(xí),那一定是理直氣壯地編造故事,這是由于他們植根在基因里的"賭性",也就是概率決定的。他們最擅長的,永遠(yuǎn)是根據(jù)你的只言片語,編織出概率最高的下一句話。至于這句話是詩歌、謊言還是編程指令,賭徒們毫不關(guān)心,只要是能討你歡心的,他們都愿意幫你編造。

例如當(dāng)你問"微波爐能否改裝成核反應(yīng)堆"時(shí),他會(huì)像賭場老千亮底牌般甩出《家用能源革命指南》的虛構(gòu)章節(jié)——即使這本書從未存在過。就像輸紅眼的賭鬼堅(jiān)信"下一把肯定翻盤",他們永遠(yuǎn)選擇概率最高的敘事,而非事實(shí)。

2. 對最近的事情一無所知

賭徒口袋里的懷表永遠(yuǎn)停留在過去。

這些賭徒一旦從訓(xùn)練包廂出來后,就不再想要學(xué)習(xí)新的知識,因此這些賭徒的大腦永遠(yuǎn)停留在某個(gè)神秘的時(shí)間節(jié)點(diǎn)(訓(xùn)練數(shù)據(jù)截止日)。

他能對2021年之前的賭局如數(shù)家珍,此時(shí),如果你問他 2023年世界杯的冠軍歸屬,他一定又會(huì)開始理直氣壯的編故事。

3. 數(shù)字直覺依賴癥

沒學(xué)過算術(shù)的概率信徒

對于“賭徒”來說,數(shù)學(xué)無疑是一場夢魘。由于長期重復(fù)的練習(xí),他們僅掌握了填空的技巧,但對數(shù)學(xué)的本質(zhì)卻知之甚少。雖然通過頓悟產(chǎn)生了一定的思考能力,但是由于缺乏系統(tǒng)的訓(xùn)練,賭徒處理數(shù)學(xué)問題的方式簡直像是一種奇特的行為藝術(shù):當(dāng)面對“368+579=__ 這樣的題目時(shí),他們只會(huì)像預(yù)測輪盤數(shù)字一樣機(jī)械的預(yù)測下一個(gè)數(shù)字,對進(jìn)位等運(yùn)算規(guī)則全然不顧,所以當(dāng)他們自信地回答出“837”時(shí),請你也不用過度驚訝。

防騙指南

由于大模型的上述陋習(xí),因此記得下面幾個(gè)防騙指南尤為重要

  1. 當(dāng)涉及專業(yè)領(lǐng)域時(shí),請將賭徒的答案視為"待驗(yàn)籌碼",務(wù)必通過其他渠道兌換成"真金白銀"。

  2. 需要處理時(shí)效性信息時(shí),請記住賭徒口袋里的懷表永遠(yuǎn)比現(xiàn)實(shí)時(shí)間慢幾年

  3. 涉及財(cái)務(wù)計(jì)算、工程公式等場景,請執(zhí)行"雙盲驗(yàn)證"——讓賭徒和計(jì)算器分別獨(dú)立作業(yè),或者再讓第三個(gè)賭徒比較二者的差異。

如何更好地發(fā)布懸賞

我們顯然不是慈善家,發(fā)布懸賞旨在更高效地獲取所需答案。誰也不愿自己的寶貴時(shí)間和注意力付諸東流,因此我們必須學(xué)會(huì)與這群賭徒和諧共處。以下是幾個(gè)讓賭局利益最大化的秘籍:

1. 眼神暗號要到位(角色扮演)

優(yōu)秀的賭徒都是讀心術(shù)高手。在題目開頭寫上"你是一位諾貝爾獎(jiǎng)得主",比干巴巴的"請專業(yè)回答"有效十倍。這就像在賭桌上輕敲三下籌碼讓他模仿一個(gè)專業(yè)學(xué)者,老練的賭徒會(huì)立刻會(huì)切換成學(xué)術(shù)演講模式,連押注時(shí)的微表情都變得莊重起來。

2. 塞小抄的藝術(shù) (多用示例)

這些賭徒對示范答案的敏感度,堪比老千識別作弊牌。與其寫三千字規(guī)則說明,不如直接甩出兩三個(gè)"出題人最愛的參考答案示例。當(dāng)他們看到你展示的標(biāo)準(zhǔn)答案時(shí),會(huì)像發(fā)現(xiàn)輪盤賭規(guī)律般興奮——畢竟明牌可比盲猜勝率高得多。

3. 分階段懸賞(分階段提問)

想讓賭徒直接寫出《戰(zhàn)爭與和平》,不如先讓他們分階段的寫出 "確定敘事風(fēng)格,再輸出文章大綱,再確定故事背景……"。這相當(dāng)于把全部身家分成十次下注,就算某局押錯(cuò)了,也不至于血本無歸。

e7f547022759bb92b61524f4177299b9.jpeg

4. 實(shí)時(shí)拋籌碼(及時(shí)反饋)

當(dāng)賭徒給出包含"太陽由氣體構(gòu)成"的答案時(shí),立即甩出獎(jiǎng)勵(lì)籌碼(回復(fù)"我就要這個(gè)答案,繼續(xù)")。他們會(huì)像聞到新鮮出爐面包香的顧客,立刻修改原本的購物計(jì)劃。你給的每一枚籌碼,都在影響他們未來的賭局策略。

終極心法

相信通過上面對大模型“賭徒”性格的拆解,你對大模型會(huì)有更深刻的認(rèn)識。

時(shí)刻謹(jǐn)記:你面對的不是真正學(xué)者,而是一個(gè)戴著金絲眼鏡的賭徒。

他西裝內(nèi)袋里藏著的不是鋼筆,而是一個(gè)骰子;他遞出的學(xué)術(shù)論文,也不過是用概率墨水打印的賭局記錄

但只要掌握好懸賞技巧,你就能讓這個(gè)沉迷猜謎的賭徒,變成最趁手的文字魔術(shù)師——畢竟在數(shù)據(jù)的賭場里,懂得游戲規(guī)則的人,永遠(yuǎn)比盲目下注者更容易聽到籌碼落袋的美妙聲響

最后,在評估他的解答時(shí)必須保持警覺(參照上面說的的防騙指南),永遠(yuǎn)不要將人類的思考與決策能力讓渡給那些賭博者。畢竟再精妙的賭局,也難以抗衡莊家手中那張名為批判性思維的王牌。

寫在最后

隨著 Deekseek 的火爆,大模型的概念迅速變得家喻戶曉。大家開始習(xí)慣于在遇到問題時(shí),首先求助于大模型。然而,這種趨勢導(dǎo)致人們逐漸放棄了主動(dòng)思考的能力,并且越來越多的人將大模型的答案視為絕對真理,不再進(jìn)行進(jìn)一步驗(yàn)證。

然而,大語言模型的本質(zhì)決定了它作為一種概率模型,其提供的答案永遠(yuǎn)無法達(dá)到百分百的準(zhǔn)確率,而只能給出正確概率最高的結(jié)果(就像是一個(gè)狂熱的猜詞游戲的賭徒)。

因此,目前它最適用的場景依然是文本生成(創(chuàng)意寫作、代碼生成)、文本轉(zhuǎn)換(摘要、翻譯)、信息檢索(在訓(xùn)練時(shí)效范圍內(nèi)的內(nèi)容)與結(jié)構(gòu)化輸出等文本相關(guān)領(lǐng)域。

但在涉及時(shí)效性、事實(shí)性還有數(shù)理分析推理等場景中仍存在幻覺與邏輯謬誤風(fēng)險(xiǎn)。所以,不應(yīng)該過度神話大模型,只有深入了解其本質(zhì),才能更好地利用它。

這篇文章算是大模型的第一篇科普,后續(xù)我也會(huì)持續(xù)更新相關(guān)的內(nèi)容。我一直對那些能將復(fù)雜概念深入淺出講解的博主深感敬佩。因?yàn)槲疑钪?,知識科普看似不易,實(shí)則更難;不僅要求作者有極強(qiáng)的理解力,能洞悉事物的本質(zhì);同時(shí)還需具備出色的表達(dá)和想象力,能將抽象事物具體生動(dòng)地呈現(xiàn)出來,我希望總有一天我也能做到像他們那樣。

最后再次強(qiáng)調(diào),在大模型時(shí)代,獨(dú)立思考與辨別能力顯得愈發(fā)重要。

隨著時(shí)代的發(fā)展,我們更需要提升自己獨(dú)立思考和辨別是非的能力,因?yàn)檫@是我們唯一可以依靠的東西。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容