
頭條
Cursor 的200美元至尊套餐
https://www.cursor.com/en/blog/new-tier
Anysphere推出了固定價(jià)格的Ultra套餐,其計(jì)算能力比Pro套餐高得多,這得益于與主要模型供應(yīng)商的長期合作。
雙子座2.5更新可用情況
https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/
谷歌全面推出Gemini 2.5 Pro和Flash,F(xiàn)lash-Lite首次開啟預(yù)覽,并引入可控“思考”預(yù)算,在提高推理準(zhǔn)確性的同時(shí)為開發(fā)者提供靈活性。
山姆·奧特曼談Meta 1億美元的挖角
在一期播客中,OpenAI首席執(zhí)行官證實(shí),Meta曾以九位數(shù)薪酬招攬研究人員加入其超級智能團(tuán)隊(duì),但稱幾乎沒人跳槽,還借此機(jī)會嘲諷了Meta的招聘行動。
深度分析
如何避免因人工智能而丟掉工作
https://80000hours.org/agi/guide/skills-ai-makes-valuable/
這份職業(yè)指南指出,有些技能會在自動化程度提高的情況下反而變得更有價(jià)值,比如人工智能部署、領(lǐng)導(dǎo)力和政府關(guān)系。它建議知識型工作者干脆跳過傳統(tǒng)的入門級崗位,提倡從事副業(yè)項(xiàng)目和初創(chuàng)企業(yè)的工作,因?yàn)槿斯ぶ悄苷谙魅鮽鹘y(tǒng)企業(yè)的層級架構(gòu)。
理解并為大語言模型(LLMs)中的鍵值緩存(KV Cache)編寫代碼
https://magazine.sebastianraschka.com/p/coding-the-kv-cache-in-llms
鍵值(KV)緩存可在大語言模型(LLM)推理過程中存儲中間注意力計(jì)算結(jié)果,以避免重復(fù)計(jì)算。逐詞生成 “時(shí)光飛逝(Time flies fast)” 時(shí),模型通常會在每一步重新計(jì)算 “Time” 和 “flies” 的注意力,但緩存這些值能將速度提高5倍。本教程先從使用基本緩存緩沖區(qū)和位置跟蹤修改一個(gè)124M參數(shù)的GPT模型開始,再到如預(yù)分配內(nèi)存和滑動窗口等可用于生產(chǎn)的優(yōu)化措施,以解決長序列中線性增長且成本過高的內(nèi)存問題。
OpenAI構(gòu)建智能體實(shí)用指南
https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf
本指南強(qiáng)調(diào),先從單智能體入手,再涉足多智能體系統(tǒng)??刹捎霉芾砥髂J?,即一個(gè)智能體通過工具調(diào)用或去中心化交接來協(xié)調(diào)其他智能體進(jìn)行點(diǎn)對點(diǎn)任務(wù)分配。關(guān)鍵要點(diǎn)包括:將防護(hù)措施設(shè)為分層防御(基于大語言模型的分類器、正則表達(dá)式過濾器和審核應(yīng)用程序編程接口);針對復(fù)雜的長期任務(wù)設(shè)計(jì)工具;構(gòu)建由失敗閾值或高風(fēng)險(xiǎn)行為觸發(fā)的人工介入機(jī)制 。
工程
利用大模型進(jìn)行實(shí)時(shí)動作分塊
https://www.physicalintelligence.company/research/real_time_chunking
與聊天機(jī)器人或圖像生成器不同,機(jī)器人必須實(shí)時(shí)運(yùn)行——輸入和輸出之間的延遲會對性能產(chǎn)生明顯影響。雖然視覺-語言-動作(VLA)模型在開放世界泛化方面取得了不錯的成果,但運(yùn)行速度可能較慢。本文介紹了一種名為實(shí)時(shí)分塊的算法,它能實(shí)現(xiàn)無間斷的實(shí)時(shí)執(zhí)行。該算法適用于任何基于擴(kuò)散或流的VLA,且無需改變訓(xùn)練時(shí)間。
用于MI-EGG解碼的時(shí)空注意力機(jī)制(GitHub代碼庫)
https://github.com/snailpt/TCANet
TCANet融合多尺度卷積、時(shí)間壓縮和堆疊自注意力機(jī)制,對運(yùn)動想象腦電圖進(jìn)行建模。
迷你Max發(fā)布開源權(quán)重推理模型M1(GitHub倉庫)
https://github.com/MiniMax-AI/MiniMax-M1
MiniMax的4560億參數(shù)模型采用了帶有“閃電注意力”的混合專家混合架構(gòu),能處理100萬個(gè)詞元的上下文(是DeepSeek R1的8倍),在生成10萬個(gè)詞元長度時(shí)所需的每秒浮點(diǎn)運(yùn)算次數(shù)減少25% 。
其他
O3 轉(zhuǎn)為職業(yè)(選手/戰(zhàn)隊(duì) ,需結(jié)合具體語境確定完整含義)
https://thezvi.substack.com/p/o3-turns-pro
o3-pro似乎比o3能給出更好的答案,但等待時(shí)間要長得多。大規(guī)模使用API成本高得讓人望而卻步,所以用戶不妨通過聊天界面并行查詢。o3-pro和o3面向同樣的小眾群體,所以考慮使用Opus的用戶可能更愿意選擇Opus,而非o3-pro,或者在使用o3-pro的同時(shí)也用Opus。o3降價(jià)80%似乎比o3-pro更有影響力——o3-pro在很大程度上仍是一款“僅用于特殊情況”的模型。
我們向70多名議員簡報(bào)人工智能威脅后所了解到的情況
https://links.tldrnewsletter.com/sHMTpl
關(guān)于人工智能風(fēng)險(xiǎn)的簡報(bào)顯示,大多數(shù)英國議員缺乏深入的人工智能知識,且面臨能力限制,這制約了對人工智能問題的研究。這些簡報(bào)很受歡迎,三分之一的議員公開支持降低人工智能風(fēng)險(xiǎn)的行動。有效的宣傳推廣包括持續(xù)跟進(jìn),以及借助知名人工智能權(quán)威人士的言論來表明與人工智能相關(guān)的滅絕風(fēng)險(xiǎn)的嚴(yán)重性。
Meta與普拉達(dá)的人工智能智能眼鏡
https://techcrunch.com/2025/06/17/meta-is-reportedly-building-ai-smart-glasses-with-prada-too/
Meta正與普拉達(dá)合作開發(fā)引領(lǐng)時(shí)尚的人工智能眼鏡,業(yè)務(wù)范圍已超越與雷朋的合作,而且有跡象顯示未來產(chǎn)品線會更豐富,可能很快就會推出售價(jià)360美元的奧克利眼鏡。
XAI正在洽談43億美元股權(quán)融資和50億美元債務(wù)融資事宜
https://links.tldrnewsletter.com/s3niSb
這家人工智能初創(chuàng)公司每月消耗10億美元,需要新資金。周二是債券發(fā)售的承諾截止日期,在人工智能領(lǐng)域融資競爭激烈的情況下,這將考驗(yàn)投資者的興趣。
谷歌雙子座玩《寶可夢》時(shí)慌了神
https://techcrunch.com/2025/06/17/googles-gemini-panicked-when-playing-pokemon/
Gemini 2.5 Pro陷入多種狀況,這致使它模擬出恐慌情緒——在壓力下它做出了糟糕又倉促的決定。
人工智能初創(chuàng)公司Anysphere收到風(fēng)投報(bào)價(jià),估值超180億美元
https://finance.yahoo.com/news/ai-startup-anysphere-fields-vc-010417332.html
熱門人工智能代碼編輯器Cursor的開發(fā)商Anysphere,已有投資者與其接洽一項(xiàng)交易,該交易將使其估值翻倍。
WhatsApp將允許用戶打造自己的人工智能聊天機(jī)器人并在應(yīng)用內(nèi)使用
https://9to5mac.com/2025/06/04/whatsapp-ai-chatbot/
WhatsApp正在測試一項(xiàng)“AI Studio”功能,用戶無需編碼就能創(chuàng)建定制聊天機(jī)器人。