AI創(chuàng)業(yè)的下一站:做微信,還是做手機(jī)?

01

上個(gè)月,我把一個(gè)做了三個(gè)月的Agent項(xiàng)目砍掉了。

不是什么技術(shù)難題,是我想通了一個(gè)問(wèn)題:如果GPT-4明天更新一個(gè)版本,把我的能力都覆蓋了,我剩下什么?

答案是:一堆Prompt,幾個(gè)API調(diào)用記錄,和一個(gè)寂寞。

這不是我一個(gè)人的困境。過(guò)去半年,我看了不下50個(gè)Agent項(xiàng)目路演,90%的PPT都在講同一件事:“我們用大模型+提示詞,做了一個(gè)垂直領(lǐng)域的智能助手?!?/p>

然后呢?

然后就是無(wú)盡的同質(zhì)化競(jìng)爭(zhēng)。你做法律咨詢,我也做;你做旅行規(guī)劃,我也做。最后比的不是誰(shuí)更聰明,而是誰(shuí)更便宜。

02

后來(lái)我換了個(gè)角度看這個(gè)問(wèn)題。

想想智能手機(jī)時(shí)代,誰(shuí)是贏家?

蘋(píng)果和谷歌做了操作系統(tǒng),其他人都在上面做應(yīng)用。微信、抖音、美團(tuán),沒(méi)有一個(gè)試圖自己做個(gè)“手機(jī)”,但它們都成了這個(gè)生態(tài)里不可或缺的一部分。

Agent也是同理。

用戶不會(huì)為了“只懂法律咨詢”專門(mén)買(mǎi)一個(gè)Agent硬件或App。用戶要的是一個(gè)通用的智能體,然后在上面裝上各種“技能”——就像在手機(jī)上裝App一樣。

所以問(wèn)題來(lái)了:你是想做那個(gè)操作系統(tǒng),還是想做那個(gè)殺手級(jí)應(yīng)用?

絕大多數(shù)創(chuàng)業(yè)者的答案是:操作系統(tǒng)。

但這是一個(gè)危險(xiǎn)的答案。

03

為什么?

因?yàn)椴僮飨到y(tǒng)的核心競(jìng)爭(zhēng)力是通用推理能力。這東西有多難,看看百度的文心一言和OpenAI的GPT-4的差距就知道了。這不是砸錢(qián)就能短期追上的,這是人才、數(shù)據(jù)、算力的三重壁壘。

而垂直領(lǐng)域的優(yōu)勢(shì)是什么?是對(duì)行業(yè)的深度理解,是多年積累的業(yè)務(wù)數(shù)據(jù),是客戶信任帶來(lái)的獨(dú)家狀態(tài)。

拿行業(yè)知識(shí)去硬抗通用推理能力,是用自己的短板打別人的長(zhǎng)板。

正確的姿勢(shì)應(yīng)該是:讓通用大模型做它擅長(zhǎng)的事(理解意圖、推理規(guī)劃),讓垂直應(yīng)用做自己擅長(zhǎng)的事(提供專業(yè)狀態(tài)、執(zhí)行業(yè)務(wù)邏輯)。

04

說(shuō)到“狀態(tài)”,這是很多Agent創(chuàng)業(yè)者忽略的核心概念。

我問(wèn)過(guò)很多做Agent的朋友:你的Agent,用一次和用一百次,有什么本質(zhì)區(qū)別?

大部分人的回答是:記住用戶偏好,回答更個(gè)性化。

這叫“記憶”,不叫“狀態(tài)”。

真正的狀態(tài)是什么?

是一個(gè)法律案件進(jìn)行到第30天,積累的所有證據(jù)、文書(shū)、對(duì)方策略;是一個(gè)投資組合經(jīng)歷三次調(diào)倉(cāng)后,形成的完整持倉(cāng)邏輯和風(fēng)險(xiǎn)敞口;是一個(gè)項(xiàng)目管理進(jìn)行到中期,沉淀下來(lái)的任務(wù)依賴和團(tuán)隊(duì)配合模式。

這些東西,換一個(gè)模型,換一個(gè)Agent,它帶不走。

因?yàn)樗辉谀P偷膮?shù)里,不在Prompt里,而在你的數(shù)據(jù)庫(kù)里、你的業(yè)務(wù)流程里、你的用戶資產(chǎn)里。

沒(méi)有狀態(tài)的服務(wù),本質(zhì)就是公益事業(yè)。

別人今天抄你,明天優(yōu)化你,后天價(jià)格比你低一半。

05

還有一個(gè)被低估的問(wèn)題:Agent的“精神分裂癥”。

為什么你不能讓同一個(gè)Agent既當(dāng)律師又當(dāng)管家還當(dāng)健身教練?

想象你的大腦里同時(shí)跑著三個(gè)線程:一個(gè)在背《民法典》,一個(gè)在算卡路里,一個(gè)在比價(jià)機(jī)票。結(jié)果是什么?訂酒店的時(shí)候想起了前妻的離婚協(xié)議,點(diǎn)外賣(mài)的時(shí)候推薦了減肥禁品。

這就是Agent的物理瓶頸:上下文容量有限,注意力帶寬有限。

杯子裝不下海,一心不能多用。

所以Agent必須學(xué)會(huì)“卸載”——把專業(yè)的事,交給專業(yè)的應(yīng)用去做。Agent OS只負(fù)責(zé)理解用戶想要什么,然后把具體怎么做的問(wèn)題,分發(fā)給那些擁有領(lǐng)域狀態(tài)的Agent-native應(yīng)用。

06

那么,什么是Agent-native應(yīng)用?

它不是傳統(tǒng)的App,也不是簡(jiǎn)單的API封裝。它有三個(gè)特征:

第一,有領(lǐng)域狀態(tài)。 每一次交互都在積累業(yè)務(wù)上下文,都在沉淀資產(chǎn)。用的人越多,它越懂這個(gè)領(lǐng)域,越難被替代。

第二,有基礎(chǔ)設(shè)施投入。 持續(xù)優(yōu)化的垂直模型、不斷更新的知識(shí)庫(kù)、實(shí)時(shí)接入的數(shù)據(jù)管線。這不是寫(xiě)幾行Prompt就能搞定的,這是真金白銀的投入。

第三,有規(guī)模效應(yīng)。 用戶越多,單位成本越低。后來(lái)者想追,得先燒同樣的錢(qián)。

07

最近我越來(lái)越認(rèn)同一句話:The best context is no context.

Agent越輕,表現(xiàn)越好。不要試圖讓它記住所有事情,不要試圖把所有邏輯塞進(jìn)它的上下文。真正的智能,不是大而全,而是懂得分工和卸載。

大廠會(huì)做出那個(gè)操作系統(tǒng)——它可能叫GPT-5,可能叫Gemini 2.0,也可能叫別的什么。

而我們,應(yīng)該去做那個(gè)殺手級(jí)的應(yīng)用——那個(gè)讓用戶愿意為了它打開(kāi)那個(gè)操作系統(tǒng)的存在。

08

最后,留個(gè)問(wèn)題給自己,也給看到這里的你:

如果今天從頭做一個(gè)Agent-native應(yīng)用,你的第一行代碼會(huì)寫(xiě)在哪里?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容