字節(jié)今天又發(fā)了新一代的大模型,豆包seed 2.0。
很多人也在討論。
本來(lái)真的不想卷了,花了點(diǎn)時(shí)間看完了技術(shù)報(bào)告,然后火山上也上了,我就把我項(xiàng)目里的所有seed 1.8都升級(jí)到了2.0后,測(cè)試了些任務(wù),我覺(jué)得還是有點(diǎn)超我預(yù)期的。
所以回家路上手機(jī)碼字碎碎念幾句。
首先,這次發(fā)的Seed 2.0,定位是多模態(tài)通用模型,三個(gè)規(guī)格,Pro、Lite、Mini,外加一個(gè)專(zhuān)門(mén)寫(xiě)代碼的Code。
細(xì)節(jié)就不詳細(xì)展開(kāi)了,手邊沒(méi)電腦一些數(shù)據(jù)也記不太清了,我簡(jiǎn)單總結(jié)一下:
Seed 2.0是個(gè)原生多模態(tài)模型,多模態(tài)能力全球SOTA,在視覺(jué)理解、視頻理解上基本就是No.1,從火山上接了一下API,用我最?lèi)?ài)用的blender教程視頻,測(cè)了一下目前做的都不太好的視頻理解能力,體感上應(yīng)該就是當(dāng)今最強(qiáng)的,比Gemini 3 Pro還要強(qiáng)。
本體代碼能力確實(shí)普通,但是跟OpenAI一樣,代碼單獨(dú)用Code模型去做,而不用自己的主模型去卷,主模型是給普羅大眾用的,這個(gè)思路沒(méi)問(wèn)題。
然后還有兩個(gè)有意思的特點(diǎn)我覺(jué)得對(duì)普通人也很有用,但是沒(méi)啥人提。
一個(gè)是基于視覺(jué)理解的非結(jié)構(gòu)化文檔理解,比如各種亂七八糟的復(fù)雜的文件和PDF,都是那種掃描版或者圖片,用大模型提取信息的能力,目前Seed 2.0應(yīng)該也是SOTA,對(duì)于所有的辦公場(chǎng)景都非常的實(shí)用。
另一個(gè)就是搜索Agent這塊,這個(gè)非常重要,我自己之前一直都是用GPT-5.2來(lái)作為的搜索引擎,這半年來(lái)我用它搜索幾乎都已經(jīng)不去驗(yàn)證數(shù)據(jù)源了,幻覺(jué)率極低,是我體感是最強(qiáng)的,全球沒(méi)有一個(gè)能追上,幾乎是把Claude和Gemini摁在地上打。
這次seed 2.0在最核心的評(píng)測(cè)集BrowseComp上,居然直接打平GPT-5.2,我自己下午隨便試了下,在國(guó)產(chǎn)環(huán)境下,我甚至覺(jué)得比GPT 5.2還要準(zhǔn)一點(diǎn),這個(gè)屬實(shí)是在我意料之外的。
而且,在這些能力的提升下,Seed 2.0的人味不像很多其他模型,居然沒(méi)有降低,這個(gè)更離譜。
我個(gè)人下午體驗(yàn)下來(lái),覺(jué)得反而在通用場(chǎng)景下,是有些超預(yù)期的,因?yàn)槲抑雷止?jié)內(nèi)部有一個(gè)硬性規(guī)定,就是不準(zhǔn)蒸餾,所以這個(gè)能力是實(shí)打?qū)嵉?,在沒(méi)蒸餾的情況下,把這些能力做到這種程度,屬實(shí)不易。
在國(guó)內(nèi),這可能就是你日常工作中能比肩GPT 5.2在擬人化上比肩GPT4o的水桶模型。
有時(shí)候,為了絕大多數(shù)場(chǎng)景和用戶考慮,可能會(huì)更重要更普惠一些。在這個(gè)思路上,字節(jié)跟OpenAI倒是如出一轍。
國(guó)產(chǎn)大模型卷到這個(gè)程度,作為用戶是真的幸福。
而從業(yè)者,也是真的天天過(guò)年。
最后,就說(shuō)到這吧。
真的祝大家新年快樂(lè)啦~
聊聊有點(diǎn)被低估的豆包Seed 2.0。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 在連續(xù)發(fā)布Seedance 2.0視頻模型、Seedream 5.0 Lite圖像模型之后,2月14日,字節(jié)跳動(dòng)宣...
- 12月17日,AiPy發(fā)布《大模型適配度測(cè)評(píng)第六期報(bào)告》。距上次測(cè)評(píng)發(fā)布已2個(gè)多月,全球Al大模型領(lǐng)域經(jīng)歷了持續(xù)快...
- 1. 本周概覽 本周大模型領(lǐng)域持續(xù)涌現(xiàn)創(chuàng)新成果,數(shù)學(xué)、編程和多模態(tài)能力均出現(xiàn)顯著進(jìn)展。字節(jié)推出數(shù)學(xué)模型Seed P...
- 文|魏琳華 編|王一粟 大模型又迎來(lái)新一波的迭代周期。 近日,從Open AI發(fā)布GPT-5,到國(guó)內(nèi)的昆侖萬(wàn)維、商...
- 翻譯自Xipeng Qiu*,School of Computer Science, Fudan Universi...