開源,撐不起大模型了

最近一兩年,大模型圈有一個現(xiàn)象越來越明顯:真正站在行業(yè)頂端、掌握話語權(quán)的公司,幾乎全部選擇閉源;而不斷開源的公司,反而大多做不出真正的商業(yè)閉環(huán)。這不是簡單的價值觀差異,而是重視商業(yè)的價值。

當(dāng)我們把OpenAl、Gemini、Claude,和LLaMA、Qwen、GLM、DeepSeek、MiniMax、Kimi放在一起看,會發(fā)現(xiàn)一個非常殘酷的事實:大模型越是燒錢,越不應(yīng)該開源。

一、大模型是一個"極端燒錢"的行業(yè)

OpenAl、Google、Anthropic正在做的事情,本質(zhì)上是一場資本密集型軍備競賽:

1、人才成本,Meta億級別的年薪挖人

2、算力成本,百萬量級的高端顯卡,甚至要考慮核能發(fā)電

3、數(shù)據(jù)/流量成本,對高質(zhì)量數(shù)據(jù)、反饋閉環(huán)、推理優(yōu)化的長期投入

4、生態(tài)成本,動輒幾十億的生態(tài)收購

這些公司瘋狂融資,同樣也瘋狂砸錢,并不是因為它們沖動,而是因為這個賽道的勝負(fù)本身就是靠資本、規(guī)模和閉環(huán)堆出來的。

在這樣的前提下,如果一家公司還選擇把模型能力以開源的方式釋放出去,本質(zhì)上等于把最昂貴、最稀缺、最難復(fù)現(xiàn)的資產(chǎn),直接送出。而且是送給整個行業(yè),包括潛在競爭對手。

二、大模型的商業(yè)價值,不只是"錢",還有更稀缺的東西

把耗費巨資訓(xùn)練的模型免費給出去,其成本不僅僅是技術(shù)、人力、算力。

大模型時代,比起這些更容易用錢衡量的成本,其實給出去的是更貴的東西:用戶反饋。用戶反饋正在成為比收入更稀缺的資產(chǎn)。閉源公司(如OpenAl、Claude、Gemini)最大的隱性優(yōu)勢,并不只是API收入,而是:

1、海量真實用戶

2、高頻交互

3、持續(xù)可控的反饋數(shù)據(jù)

4、完整的模型改進(jìn)閉環(huán)

這套反饋系統(tǒng),才是它們模型快速迭代、持續(xù)領(lǐng)先的根本原因。而一旦選擇開源:

1、模型被部署在無數(shù)第三方環(huán)境

2、使用方式、數(shù)據(jù)分布、反饋路徑完全失控

3、模型能力被"消耗",但改進(jìn)紅利卻無法回流

損失的不是短期收入,而是模型長期進(jìn)化能力。

三、為什么"以前開源軟件很成功",但今天不適用了?

這是一個經(jīng)常被用來為大模型開源辯護(hù)的論點,然而以往很多成功的軟件開源項目,具備以下特征:

1、研發(fā)成本主要是人力,長期攤銷

2、邊際復(fù)制成本接近0

3、開源版≠商業(yè)版

4、可以靠授權(quán)、服務(wù)、企業(yè)版賺錢

而大模型:

1、訓(xùn)練是一次性巨額資本支出,必須不停的訓(xùn)練新模型才能保證代差,行業(yè)極度內(nèi)卷,每次都從0開始,邊界效益極低。

2、模型權(quán)重本身就是"最終產(chǎn)品",競爭對手能做到真正的拿來即用,甚至比你做得更好。

3、開源即等于交付核心能力,當(dāng)然可以開源閹割版,然而現(xiàn)狀是大量開源的旗艦版,而且經(jīng)濟(jì)實用的flash/mini的版本更是毫無保留。

這不是同一個時代的商業(yè)模型。

四、LLaMA的結(jié)局,其實早就寫好了

LLaMA 4 之前,Meta作為"大模型開源成功的代表",在業(yè)界的口碑一致好評,就如現(xiàn)在的QWen和Kimi等一眾國產(chǎn)模型一樣。

但如果站在商業(yè)角度看,我反而認(rèn)為:LLaMA的失敗,幾乎是必然。

原因很簡單:

1、Meta并不是一家以模型能力直接變現(xiàn)為核心的公司

2、LLaMA的開源,并沒有反哺Meta的核心業(yè)務(wù)

3、模型能力被整個行業(yè)吸收,卻沒有形成Meta的獨占優(yōu)勢

在其開源初期還宣揚LLaMA的開源為其節(jié)約了大量的研發(fā)成本,然而那點成本遠(yuǎn)不及持續(xù)的人力算力投入,即便"有錢任性",在這樣一個燒錢的賽道里,持續(xù)承擔(dān)研發(fā)成本,卻無法形成價值回流,本身就是不可持續(xù)的。

五、DeepSeek看起來很成功,但它不是答案

很多人會提到DeepSeek,認(rèn)為它"通過開源獲得了巨大的影響力"。這個判斷并不錯誤,但它只說對了一半。

DeepSeek的確通過開源獲得了:

1、技術(shù)聲譽

2、行業(yè)關(guān)注

3、極高的討論

但問題在于:

這些并沒有直接轉(zhuǎn)化為可持續(xù)的商業(yè)收益。DeepSeek可以選擇這樣成功,畢竟DeepSeek本身的目標(biāo)就不是"靠模型賺錢"。從技術(shù)和模型的角度說,DeepSeek是成功的,甚至帶火了一眾套殼廠商、云廠商和硬件廠商。但是從商業(yè)上看,我并不認(rèn)為DeepSeek是成功的,尤其是用戶反饋數(shù)據(jù)的缺失,大大的削弱了DeepSeek真正的價值。

商業(yè)價值和技術(shù)價值是相輔相成的,沒有商業(yè)的反饋,技術(shù)很容易迷路。

六、很多開源,是"技術(shù)型PR"

在當(dāng)前階段,很多公司選擇開源,其真實動機往往并不是商業(yè),而是:

1、向投資人/老板證明"我們真的有模型能力"

2、向行業(yè)證明"我們不是套殼"

3、在缺乏場景、流量和收入時,交付一個"可展示成果"

從短期看,這是可以理解的,但長期看,這是一種透支未來商業(yè)談判能力的做法。

當(dāng)你的模型能力已經(jīng)免費開源,市場會自然追問一個問題:那你憑什么賺錢?

七、大模型時代,開源不再是"中立選擇"

我認(rèn)為在當(dāng)前的大模型競爭格局下,基礎(chǔ)模型的完全開源,已經(jīng)從"理想主義選擇",變成一項高風(fēng)險、低回報,甚至是負(fù)回報的決策。

這不是反對開源精神,而是承認(rèn)現(xiàn)實:

1、成本結(jié)構(gòu)變了

2、競爭邏輯變了

3、價值捕獲方式也必須隨之改變

在一個極端燒錢、強規(guī)模效應(yīng)、強反饋閉環(huán)的賽道里,過早交出核心能力,往往不是慷慨,而是戰(zhàn)略自殘。在這個內(nèi)卷的時代,在這個最燒錢的賽道,一個公司如果創(chuàng)造了價值而卻無法從商業(yè)上進(jìn)行回收,那長期也不可能具備強的競爭力,從這個角度看,閉源真的可能跑的比開源快。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容