戰(zhàn)國(guó)時(shí)期,墨家學(xué)派的創(chuàng)始人墨子以“兼愛非攻”理念聞名于世。面對(duì)楚國(guó)欲用云梯攻宋的危局,墨子孤身赴楚都,以“守城九術(shù)”破解攻城之法。他不僅展示了高超的防御工事設(shè)計(jì),更通過沙盤推演證明:真正的戰(zhàn)略優(yōu)勢(shì)不在于資源堆積,而在于以巧破力的創(chuàng)新思維。這場(chǎng)博弈最終迫使楚國(guó)罷兵,成為中國(guó)古代科技智慧戰(zhàn)勝蠻力的經(jīng)典案例。
兩千年后的今天,當(dāng)中國(guó)人工智能公司DeepSeek以2000塊顯卡訓(xùn)練出對(duì)標(biāo)OpenAI的模型震撼硅谷時(shí),歷史仿佛以另一種形式重演。這家由對(duì)沖基金轉(zhuǎn)型而來的企業(yè),在算力被美國(guó)芯片出口限制“卡脖子”的困境中,憑借算法創(chuàng)新與開源戰(zhàn)略,實(shí)現(xiàn)了“四兩撥千斤”的突圍。其創(chuàng)始人梁文峰甚至受邀參與中國(guó)政府工作報(bào)告的討論,被外界視為中國(guó)科技戰(zhàn)略轉(zhuǎn)型的象征。這場(chǎng)逆襲不僅顛覆了全球AI競(jìng)爭(zhēng)格局,更打破了人們習(xí)以為常的“算力為王”的認(rèn)知,從而帶來了一系列深刻影響。接下來我們先看看DeepSeek是怎么發(fā)展起來的。
一、突圍密碼:在算力圍城中開辟新戰(zhàn)場(chǎng)
(1)算力困局催生“極限優(yōu)化”
美國(guó)自2022年起實(shí)施的芯片出口管制,將中國(guó)AI企業(yè)置于“算力荒漠”。DeepSeek雖手握10000塊A100顯卡的早期儲(chǔ)備,但相比OpenAI動(dòng)輒數(shù)萬(wàn)塊H100的算力規(guī)模,其硬件劣勢(shì)如同冷兵器對(duì)陣火器。然而正是這種壓迫,倒逼團(tuán)隊(duì)研發(fā)出多模態(tài)潛在注意力機(jī)制(MLA)和專家混合架構(gòu)(MoE),通過算法重構(gòu)將訓(xùn)練成本壓縮至競(jìng)品的十分之一。這種“在螺螄殼里做道場(chǎng)”的極致優(yōu)化,甚至讓Meta工程師在拆解其代碼后感嘆“仿佛看到魔法”。
(2)開源戰(zhàn)略的“陽(yáng)謀”
DeepSeek-R1模型全面開源,一方面是技術(shù)共享的理想主義,另一方面能快速構(gòu)建生態(tài)。當(dāng)美國(guó)企業(yè)因商業(yè)利益封閉技術(shù)時(shí),中國(guó)團(tuán)隊(duì)通過開放源代碼快速構(gòu)建開發(fā)者生態(tài),形成“用全球智慧對(duì)抗美國(guó)算力”的格局。這種策略既符合年輕科研者“解決世界級(jí)難題”的抱負(fù),又巧妙規(guī)避了硬件劣勢(shì)——正如墨子當(dāng)年用沙盤推演替代實(shí)戰(zhàn)消耗。
(3)金融基因的降維打擊
DeepSeek團(tuán)隊(duì)來自國(guó)內(nèi)的頂級(jí)量化基金幻方,真金白銀的廝殺讓DeepSeek擁有獨(dú)特的“數(shù)據(jù)煉金術(shù)”。其團(tuán)隊(duì)將金融市場(chǎng)高頻交易中的分布式計(jì)算優(yōu)化與概率模型壓縮技術(shù)跨界移植到AI訓(xùn)練,創(chuàng)造出“用2000塊顯卡實(shí)現(xiàn)行業(yè)標(biāo)桿性能”的奇跡。這種將金融工程思維注入基礎(chǔ)科研的路徑,打破了傳統(tǒng)互聯(lián)網(wǎng)公司“堆資源換性能”的慣性。
DeepSeek最開始可能也沒想到,它推出一個(gè)新模型居然給了世界一些不小的“中國(guó)沖擊”。
(1)從“尾燈戰(zhàn)略”到“換道超車”
不可否認(rèn),過去十年中國(guó)科技企業(yè)多遵循“跟隨創(chuàng)新”模式,在既有技術(shù)路線上追趕西方。而DeepSeek選擇在模型架構(gòu)底層發(fā)起變革:其無(wú)監(jiān)督強(qiáng)化學(xué)習(xí)框架繞過了OpenAI依賴的人類反饋微調(diào)(RLHF),直接從數(shù)據(jù)海洋中提煉認(rèn)知邏輯。這種突破恰似墨子放棄城墻加高策略,轉(zhuǎn)而設(shè)計(jì)可移動(dòng)拒馬與連弩機(jī)括——本質(zhì)是對(duì)游戲規(guī)則的重新定義。
(2)科研組織的“輕騎兵模式”
與傳統(tǒng)大廠“人海戰(zhàn)術(shù)”不同,DeepSeek團(tuán)隊(duì)不足10人,核心成員多為清北應(yīng)屆博士。梁文峰堅(jiān)信“解決世界難題才是頂級(jí)人才的興奮劑”,通過提供自由探索環(huán)境與充足算力,激發(fā)年輕學(xué)者將論文成果快速工程化。這種“精銳小隊(duì)+飽和資源”的配置,在硅谷巨頭以及一眾大公司層層審批的官僚體系中幾乎不可能實(shí)現(xiàn)。
(3)技術(shù)民族主義的雙刃劍
美國(guó)芯片管制意外激活了中國(guó)科技的“應(yīng)激創(chuàng)新”能力。當(dāng)西方企業(yè)沉迷于“暴力計(jì)算”時(shí),中國(guó)團(tuán)隊(duì)被迫發(fā)展出更精巧的算法外科手術(shù)——正如戰(zhàn)國(guó)工匠在青銅時(shí)代造出超越鐵器的復(fù)合弓。但這種突破也加劇了舊有路線集團(tuán)的反撲:Anthropic CEO呼吁加強(qiáng)出口管制,而Meta科學(xué)家則適時(shí)地開始擔(dān)憂開源生態(tài)失控。
很多人在研究了DeepSeek及其背后的團(tuán)隊(duì)之后,直接斷言說中國(guó)國(guó)運(yùn)的轉(zhuǎn)折已經(jīng)到來,新文明形態(tài)已經(jīng)破曉。
(1)創(chuàng)新范式的代際更替
DeepSeek現(xiàn)象揭示了一個(gè)殘酷現(xiàn)實(shí):當(dāng)算力軍備競(jìng)賽達(dá)到物理極限時(shí),算法創(chuàng)新效率將成為決定性變量。其模型訓(xùn)練成本僅600萬(wàn)美元,都不如一個(gè)硅谷大公司高管的年薪,卻實(shí)現(xiàn)了95%的性能價(jià)格比優(yōu)勢(shì)。這種“窮人的智慧”可能顛覆現(xiàn)有產(chǎn)業(yè)格局,如同指南針雖簡(jiǎn)陋,卻開啟了地理大發(fā)現(xiàn)時(shí)代。
(2)科技話語(yǔ)權(quán)的重新洗牌
梁文峰受邀參與政府工作報(bào)告研討,標(biāo)志著中國(guó)開始將“原創(chuàng)性基礎(chǔ)研究”納入國(guó)家戰(zhàn)略。這與墨子受宋國(guó)重用的歷史形成呼應(yīng)——當(dāng)防御需求催生技術(shù)創(chuàng)新時(shí),工匠階層開始進(jìn)入權(quán)力中樞。DeepSeek的突圍證明:在芯片、操作系統(tǒng)等傳統(tǒng)賽道外,中國(guó)完全可以在算法層構(gòu)建新的標(biāo)準(zhǔn)體系。
(3)文明競(jìng)爭(zhēng)的本質(zhì)回歸
美國(guó)將DeepSeek崛起比作“AI界的斯普特尼克時(shí)刻”,卻忽視了更深層隱喻:正如蘇聯(lián)衛(wèi)星刺激了阿波羅計(jì)劃,當(dāng)前中美的競(jìng)爭(zhēng)可能推動(dòng)人類整體突破。梁文峰關(guān)于“語(yǔ)言即思維”的哲學(xué)思考,暗示著AI發(fā)展正從技術(shù)競(jìng)賽升維至文明認(rèn)知重構(gòu)。在這場(chǎng)關(guān)乎人類存在方式的革命中,任何國(guó)家的單極霸權(quán)都是偽命題。
回望墨子守城的故事,真正的啟示不在于某次技術(shù)勝利,而在于揭示競(jìng)爭(zhēng)的本質(zhì):當(dāng)資源不對(duì)稱時(shí),智慧與創(chuàng)新才是破局關(guān)鍵。DeepSeek的突圍不應(yīng)簡(jiǎn)單解讀為“中國(guó)崛起VS美國(guó)衰落”,而應(yīng)視為人類智能進(jìn)化史上的共同財(cái)富。
在這個(gè)算力與算法交織的新戰(zhàn)國(guó)時(shí)代,或許我們需要重溫墨家的古老智慧:最好的防守不是筑起更高的城墻,而是創(chuàng)造讓攻城失去意義的全新規(guī)則。當(dāng)DeepSeek將模型訓(xùn)練成本壓縮90%時(shí),它不僅在改寫科技競(jìng)爭(zhēng)規(guī)則,更在重塑人類對(duì)“可能性”的認(rèn)知邊界——這才是超越國(guó)族敘事的真正轉(zhuǎn)折點(diǎn)。