1. 本周概覽
本周大模型領域多項技術突破引人注目,包括NVIDIA發(fā)布Rubin平臺大幅降低成本、OpenAI推出健康垂直領域功能,以及上海AI Lab開源Yume1.5世界模型實現(xiàn)效率飛躍。同時,OpenRouter模型調用量排名出現(xiàn)顯著變化,Claude Sonnet 4.5超越Grok Code Fast 1成為整體調用量冠軍,行業(yè)格局正在發(fā)生微妙調整。
2. 重點關注事件
NVIDIA于1月5日發(fā)布Rubin平臺,對六款全新芯片采用軟硬件極致協(xié)同設計,將推理token成本最多降低至NVIDIA Blackwell平臺的十分之一,在MoE模型訓練中使用的GPU數量僅為Blackwell平臺的四分之一,大幅提升了AI計算經濟性。
OpenAI于1月7日發(fā)布ChatGPT健康功能,在ChatGPT中擁有獨立空間,對話、已連接的應用和文件均與其他聊天內容隔離存儲,標志著AI在垂直領域應用的進一步深化。
DeepSeek R1論文于1月8日更新,增加64頁內容,v2版本論文披露了R1訓練全路徑、「Aha Moment」的數據化驗證、自適應算力分配、失敗總結等核心技術細節(jié)。
上海AI Lab于1月9日聯(lián)合多家機構開源Yume1.5世界模型,在長視頻生成中實現(xiàn)了近似恒定計算成本的全局記憶訪問,模型推理效率提升70倍,推動了世界模型技術發(fā)展。
3. 榜單變化
OpenRouter模型調用量排名:整體調用量方面,Claude Sonnet 4.5超越Grok Code Fast 1排名第一;Gemini 3 Flash Preview由第6名上升2名到第4名;MiMo-V2-Flash(free)下降兩名,排名第5。編程調用量方面,Grok Code Fast 1保持第1;Claude Opus 4.5排名第2,上升2名;MiniMax M2.1新上榜排名第3。
OpenRouter公司市占率排名:Google繼續(xù)保持第1;Anthropic市占率上升4.3%(12.9% → 17.2%),排名升至第2;xAI、OpenAI分別位列第3、4名,OpenAI市占率上升3.1%(8.0% → 11.1%);DeepSeek份額下降4.5%(13.3% → 8.8%),排名相應下降3名位列第5;小米、MistralAI、z-AI保持第6、7、9名;MiniMax上升到第8名,替代上周Qwen的位置。
圖像編輯能力榜單:在Image Edit Arena中,qwen-image-edit-2511新上榜排名第9;在Artificial Analysis Image Editing Leaderboard中,Wan 2.6超過Nano Banana到榜單第5位。
GPQA榜單:GPT-5.1 High、GPT-5 Medium新上榜,并列第6位。
GAIA榜單:Nvidia的Nemotron-ToolOrchestra-0106和Nemotron-ToolOrchestra-0107新上榜,排名前兩位。
4. OpenRouter排行榜
| 測評類型 | 第一名 | 第二名 | 第三名 |
|---|---|---|---|
| 模型調用量 | Claude Sonnet 4.5 | Grok Code Fast 1 | Gemini 2.5 Flash |
| 公司市占率 | Anthropic | xAI | |
| 編程模型調用量 | Grok Code Fast 1 | Claude Opus 4.5 | MiniMax M2.1 |
各公司按不同能力領域排名匯總
| 測評類型 | 領先公司 |
|---|---|
| 大語言模型 Text Arena | Google、xAI、Anthropic、OpenAI、百度、智譜、阿里巴巴、月之暗面 |
| 編程能力 LMArena | Anthropic、OpenAI、Google |
| 編程能力 LiveCodeBench | OpenAI、Anthropic、Google |
| 代碼工程任務能力 SWE-benchLite | 基于Claude、Gemini、GPT、Qwen、DeepSeek開發(fā)的開源系統(tǒng) |
| 圖像編輯和生成能力 Image Edit Arena | OpenAI、Google、字節(jié)、Reve |
| 文生圖能力 Text-to-Image Arena | OpenAI、Google、Black Forest Labs、騰訊、字節(jié) |
| 圖像編輯和生成能力 Image Editing Leaderboard | OpenAI、Google、字節(jié)、Black Forest Labs、阿里巴巴、Reve |
| 文生圖能力 Text to Image Leaderboard | OpenAI、Google、Black Forest Labs、字節(jié)、ImagineArt |
| GPQA | OpenAI、Google、xAI、Anthropic、阿里巴巴 |
| FrontierMath | OpenAI、Google、月之暗面、Anthropic、xAI |
| Humanity's Last Exam | Google、OpenAI、Anthropic |
| GAIA | Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等 |
關注我,第一時間掌握更多AI前沿資訊!