大模型榜單周報(2026/01/10)

1. 本周概覽

本周大模型領域多項技術突破引人注目,包括NVIDIA發(fā)布Rubin平臺大幅降低成本、OpenAI推出健康垂直領域功能,以及上海AI Lab開源Yume1.5世界模型實現(xiàn)效率飛躍。同時,OpenRouter模型調用量排名出現(xiàn)顯著變化,Claude Sonnet 4.5超越Grok Code Fast 1成為整體調用量冠軍,行業(yè)格局正在發(fā)生微妙調整。

2. 重點關注事件

  • NVIDIA于1月5日發(fā)布Rubin平臺,對六款全新芯片采用軟硬件極致協(xié)同設計,將推理token成本最多降低至NVIDIA Blackwell平臺的十分之一,在MoE模型訓練中使用的GPU數量僅為Blackwell平臺的四分之一,大幅提升了AI計算經濟性。

  • OpenAI于1月7日發(fā)布ChatGPT健康功能,在ChatGPT中擁有獨立空間,對話、已連接的應用和文件均與其他聊天內容隔離存儲,標志著AI在垂直領域應用的進一步深化。

  • DeepSeek R1論文于1月8日更新,增加64頁內容,v2版本論文披露了R1訓練全路徑、「Aha Moment」的數據化驗證、自適應算力分配、失敗總結等核心技術細節(jié)。

  • 上海AI Lab于1月9日聯(lián)合多家機構開源Yume1.5世界模型,在長視頻生成中實現(xiàn)了近似恒定計算成本的全局記憶訪問,模型推理效率提升70倍,推動了世界模型技術發(fā)展。

3. 榜單變化

  • OpenRouter模型調用量排名:整體調用量方面,Claude Sonnet 4.5超越Grok Code Fast 1排名第一;Gemini 3 Flash Preview由第6名上升2名到第4名;MiMo-V2-Flash(free)下降兩名,排名第5。編程調用量方面,Grok Code Fast 1保持第1;Claude Opus 4.5排名第2,上升2名;MiniMax M2.1新上榜排名第3。

  • OpenRouter公司市占率排名:Google繼續(xù)保持第1;Anthropic市占率上升4.3%(12.9% → 17.2%),排名升至第2;xAI、OpenAI分別位列第3、4名,OpenAI市占率上升3.1%(8.0% → 11.1%);DeepSeek份額下降4.5%(13.3% → 8.8%),排名相應下降3名位列第5;小米、MistralAI、z-AI保持第6、7、9名;MiniMax上升到第8名,替代上周Qwen的位置。

  • 圖像編輯能力榜單:在Image Edit Arena中,qwen-image-edit-2511新上榜排名第9;在Artificial Analysis Image Editing Leaderboard中,Wan 2.6超過Nano Banana到榜單第5位。

  • GPQA榜單:GPT-5.1 High、GPT-5 Medium新上榜,并列第6位。

  • GAIA榜單:Nvidia的Nemotron-ToolOrchestra-0106和Nemotron-ToolOrchestra-0107新上榜,排名前兩位。

4. OpenRouter排行榜

測評類型 第一名 第二名 第三名
模型調用量 Claude Sonnet 4.5 Grok Code Fast 1 Gemini 2.5 Flash
公司市占率 Google Anthropic xAI
編程模型調用量 Grok Code Fast 1 Claude Opus 4.5 MiniMax M2.1

各公司按不同能力領域排名匯總

測評類型 領先公司
大語言模型 Text Arena Google、xAI、Anthropic、OpenAI、百度、智譜、阿里巴巴、月之暗面
編程能力 LMArena Anthropic、OpenAI、Google
編程能力 LiveCodeBench OpenAI、Anthropic、Google
代碼工程任務能力 SWE-benchLite 基于Claude、Gemini、GPT、Qwen、DeepSeek開發(fā)的開源系統(tǒng)
圖像編輯和生成能力 Image Edit Arena OpenAI、Google、字節(jié)、Reve
文生圖能力 Text-to-Image Arena OpenAI、Google、Black Forest Labs、騰訊、字節(jié)
圖像編輯和生成能力 Image Editing Leaderboard OpenAI、Google、字節(jié)、Black Forest Labs、阿里巴巴、Reve
文生圖能力 Text to Image Leaderboard OpenAI、Google、Black Forest Labs、字節(jié)、ImagineArt
GPQA OpenAI、Google、xAI、Anthropic、阿里巴巴
FrontierMath OpenAI、Google、月之暗面、Anthropic、xAI
Humanity's Last Exam Google、OpenAI、Anthropic
GAIA Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等

關注我,第一時間掌握更多AI前沿資訊!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容