
頭條
Claude's new constitution
https://www.anthropic.com/news/claude-new-constitution
Anthropic發(fā)布了Claude的新constitution。該文件詳細(xì)描述了Anthropic對(duì)Claude價(jià)值觀和行為的愿景,解釋了Claude運(yùn)營(yíng)的背景和公司希望Claude成為的實(shí)體類(lèi)型。Constitution是模型訓(xùn)練過(guò)程的關(guān)鍵部分,其內(nèi)容直接影響Claude的行為。本文描述了新constitution的內(nèi)容以及塑造Anthropic方法的一些考慮因素。
OpenAI的CEO 中東投資者會(huì)面,為至少500億美元的融資輪次籌集資金
OpenAI的首席執(zhí)行官薩姆·阿爾特曼最近與中東的投資者會(huì)面,為可能達(dá)到至少500億美元的新投資輪次籌集資金。他最近訪問(wèn)了該地區(qū),與阿布扎比的一些主要國(guó)有基金進(jìn)行了交談。這些會(huì)談還處于早期階段,金額可能會(huì)改變。OpenAI最近還與亞馬遜進(jìn)行了會(huì)談,以籌集至少100億美元。
Meta的新AI團(tuán)隊(duì)本月內(nèi)部交付了首批關(guān)鍵模型
Meta的人工智能實(shí)驗(yàn)室已經(jīng)內(nèi)部交付了其首批高調(diào)模型。公司的首席技術(shù)官安德魯·博斯沃思表示,這些模型顯示出很大潛力。在這些模型能夠以可用的方式交付給內(nèi)部員工和消費(fèi)者之前,還需要大量的后期訓(xùn)練工作。Meta正在從其2025年的重大賭注中看到有利的回報(bào)。未來(lái)兩年對(duì)于推出面向消費(fèi)者的產(chǎn)品至關(guān)重要。
前沿
Pass@K基本上是無(wú)稽之談
https://brooker.co.za/blog/2026/01/21/pass-k.html
Pass@k是k個(gè)不同嘗試中至少有一個(gè)成功的概率。這是用于代理的最常用指標(biāo)之一。這個(gè)指標(biāo)的問(wèn)題在于它是指數(shù)級(jí)寬容的,而與代理交互的人類(lèi)并沒(méi)有那么寬容。Pass@k應(yīng)該是很少使用的指標(biāo),并且每次使用時(shí)都需要仔細(xì)論證。
使用SGLang進(jìn)行GLM4-MoE推理
https://lmsys.org/blog/2026-01-21-novita-glm4/
Novita AI推出了使用SGLang對(duì)GLM4-MoE模型的性能優(yōu)化,實(shí)現(xiàn)了更快的首次令牌時(shí)間和更好的令牌生成速度,適用于代理編碼工作負(fù)載。
Claude Code #3
https://thezvi.substack.com/p/claude-codes-3
這篇文章包含了一個(gè)關(guān)于Claude Code的新聞、教程、技巧和文章的精選列表。它涵蓋了最近的升級(jí)、補(bǔ)充Claude Code的工具等。該文章提供了如何通過(guò)Claude Code提升技能的建議,以及對(duì)該技術(shù)發(fā)展方向的預(yù)測(cè)。
研究
1150位高級(jí)技術(shù)和業(yè)務(wù)領(lǐng)導(dǎo)者關(guān)于AI和自動(dòng)化的分享
https://camunda.com/state-of-agentic-orchestration-and-automation/
AI無(wú)處不在,但有些東西阻礙了組織在生產(chǎn)環(huán)境中擴(kuò)展和管理它們。超過(guò)1000位高級(jí)技術(shù)和業(yè)務(wù)領(lǐng)導(dǎo)者向Camunda分享了他們的挑戰(zhàn)。在這份報(bào)告中,你會(huì)看到團(tuán)隊(duì)是如何管理風(fēng)險(xiǎn)并改進(jìn)編排以交付可靠的AI代理的。
Devon Review:AI停止糟糕代碼
https://cognition.ai/blog/devin-review
Devon Review是一個(gè)使用AI和用戶(hù)體驗(yàn)來(lái)擴(kuò)大人類(lèi)對(duì)復(fù)雜代碼差異理解的代碼審查工具。目前免費(fèi),適用于任何公共或私有的GitHub PR。該工具在PR流程的每個(gè)步驟都有幫助。它允許開(kāi)發(fā)人員在不離開(kāi)審查的情況下討論更改。
MCP不是問(wèn)題,而是你的服務(wù)器:構(gòu)建MCP服務(wù)器的最佳實(shí)踐
https://www.philschmid.de/mcp-best-practices
當(dāng)模型上下文協(xié)議(MCP)一年前爆發(fā)時(shí),每個(gè)人都急于構(gòu)建MCP服務(wù)器。一年后,大多數(shù)MCP服務(wù)器令人失望。雖然開(kāi)發(fā)者將問(wèn)題歸咎于協(xié)議,但企業(yè)采用卻講述著不同的故事。公司正在部署MCP服務(wù)器,集成也已上線(xiàn)。本文分析了MCP服務(wù)器失敗的原因,構(gòu)建有效MCP服務(wù)器的最佳實(shí)踐,以及Skill和MCP如何互補(bǔ)。
多路徑思維用于推理任務(wù)
https://github.com/GMLR-Penn/Multiplex-Thinking
這個(gè)實(shí)現(xiàn)引入了令牌級(jí)別的分支合并推理,以實(shí)現(xiàn)更具表達(dá)力的多路徑計(jì)算,同時(shí)保持令牌表示緊湊。
速讀
蘋(píng)果計(jì)劃將Siri打造成AI聊天機(jī)器人
https://techcrunch.com/2026/01/21/apple-plans-to-make-siri-an-ai-chatbot-report-says/
蘋(píng)果計(jì)劃將Siri轉(zhuǎn)變?yōu)榱奶鞕C(jī)器人,類(lèi)似于ChatGPT,預(yù)計(jì)將在iOS 27中集成。經(jīng)過(guò)改造的Siri,代號(hào)為"Campos",將支持語(yǔ)音和文本輸入,標(biāo)志著由于競(jìng)爭(zhēng)壓力的戰(zhàn)略轉(zhuǎn)變。蘋(píng)果在評(píng)估了OpenAI和Anthropic等選項(xiàng)后,選擇了Google的Gemini作為其AI合作伙伴。
Notion正在開(kāi)發(fā)自定義MCPS、Workers和計(jì)算機(jī)使用功能
https://www.testingcatalog.com/notion-testing-custom-mcps-workers-and-computer-use-agent/
Notion正在擴(kuò)展其自定義代理平臺(tái),包括Slack集成,并計(jì)劃為自動(dòng)化開(kāi)發(fā)日歷和郵件連接器。與第三方服務(wù)如Cursor、Linear和Ramp的集成正在開(kāi)發(fā)中,以增強(qiáng)項(xiàng)目管理和金融任務(wù)。新的部分如Feed、Library和Workers將使開(kāi)發(fā)人員能夠創(chuàng)建自定義集成,而AI功能如AI協(xié)作者則增強(qiáng)了生產(chǎn)力。