
頭條
人工智能初創(chuàng)公司Anthropic完成615億美元E輪融資
https://www.anthropic.com/news/anthropic-raises-series-e-at-usd61-5b-post-money-valuation
Anthropic在光速創(chuàng)投等領(lǐng)投下,以615億美元估值融資35億美元。這筆資金將用于推進人工智能開發(fā)、擴大計算能力,并加速國際業(yè)務(wù)增長。其Claude平臺正在改變Zoom、輝瑞和Replit等公司的運營。
T-Mobile母公司正與Perplexity Assistant合作打造一款“人工智能手機”
https://www.theverge.com/news/623164/t-mobile-ai-phone-perplexity-assistant-mwc-2025
德國電信宣布即將推出由Perplexity聊天機器人驅(qū)動的人工智能手機,定于今年晚些時候發(fā)布。該設(shè)備將使用Magenta AI,為用戶提供Perplexity Assistant、谷歌云AI等工具。一些人工智能功能還將集成到現(xiàn)有適用于其他智能手機的MeinMagenta應(yīng)用程序中。
與Stability AI和安謀科技合作的設(shè)備端生成式音頻
https://stability.ai/news/stability-ai-and-arm-bring-on-device-generative-audio-to-smartphones
Stability AI和安謀科技(Arm)利用Stable Audio Open和安謀科技KleidiAI庫,將實時生成式音頻引入智能手機,使移動設(shè)備上的音頻生成速度提高了30倍。
研究
在文本到圖像生成方面,借助ImageNet我們能走多遠(yuǎn)?
https://arxiv.org/abs/2502.21318
大多數(shù)文本到圖像模型會使用大量從網(wǎng)上搜集的定制數(shù)據(jù)。這項研究想探究僅用ImageNet能訓(xùn)練出多好的圖像生成模型。研究人員發(fā)現(xiàn),合成生成的密集字幕最能提升性能。
UNITOK:用于視覺生成與理解的統(tǒng)一分詞器
https://arxiv.org/abs/2502.20321
這篇論文提出了UniTok,以此解決視覺生成與理解之間的表征差距問題。UniTok是一種離散視覺標(biāo)記器,能同時為生成編碼詳細(xì)信息,為理解編碼語義內(nèi)容,以克服離散標(biāo)記固有的容量瓶頸。論文引入了多碼本量化,這大大提高了標(biāo)記的表現(xiàn)力,使UniTok能取得優(yōu)于特定領(lǐng)域連續(xù)標(biāo)記器或與其相當(dāng)?shù)男阅堋?/p>
大語言模型的動態(tài)稀疏注意力機制
https://arxiv.org/abs/2502.20766
FlexPrefill可動態(tài)調(diào)整稀疏注意力模式和計算預(yù)算,以實現(xiàn)高效的大語言模型(LLM)推理。它通過利用查詢感知模式確定和累積注意力索引選擇,提高長序列處理的速度和準(zhǔn)確性。
工程
數(shù)學(xué)推理的自我獎勵式校正(GitHub 倉庫)
https://github.com/RLHFlow/Self-rewarding-reasoning-LLM
這篇論文是對大語言模型(LLMs)中自我獎勵推理的研究,它能讓模型獨立生成推理步驟、自我評估正確性,還能在沒有外部反饋的情況下迭代優(yōu)化輸出。論文提出了一個兩階段訓(xùn)練框架,將序貫拒絕采樣和基于規(guī)則信號的強化學(xué)習(xí)相結(jié)合,實現(xiàn)了可與需要外部獎勵模型的方法相媲美的自我修正性能。
閃電DIT(GitHub倉庫)
https://github.com/hustvl/LightningDiT
LightningDiT讓潛在空間與視覺模型對齊,以克服擴散模型中的難題。它在ImageNet-256上取得頂尖成績,且訓(xùn)練速度更快 。
LLAMA STACK:從零基礎(chǔ)到高手(GitHub 倉庫)
https://github.com/meta-llama/llama-stack/tree/main/docs/zero_to_hero_guide
Llama Stack對將生成式AI應(yīng)用推向市場所需的一組核心構(gòu)建模塊進行了定義和標(biāo)準(zhǔn)化。這些構(gòu)建模塊以可互操作的API形式呈現(xiàn),眾多供應(yīng)商提供各自的實現(xiàn)方式。它們被整合到發(fā)行版中,開發(fā)者可以輕松實現(xiàn)從零基礎(chǔ)到投入生產(chǎn)。
其他
2月谷歌人工智能回顧
https://blog.google/technology/ai/google-ai-updates-february-2025/
以下是谷歌2月一些重大人工智能更新回顧,包括Gemini 2.0的公開發(fā)布、人工智能驅(qū)動的職業(yè)探索工具,以及Gemini移動應(yīng)用中的深度研究整合。
人工智能將診斷癲癇患兒大腦中的隱形異常情況
https://www.eurekalert.org/news-releases/1074402
倫敦國王學(xué)院和倫敦大學(xué)學(xué)院的研究人員開發(fā)的人工智能工具MELD Graph,能檢測出64%放射科醫(yī)生常漏診的與癲癇相關(guān)的腦部異常情況。該工具顯著提高了局灶性皮質(zhì)發(fā)育不良的檢測能力,有望加快診斷速度、降低英國國家醫(yī)療服務(wù)體系(NHS)的成本,并改進手術(shù)規(guī)劃。該工具是開源的,目前正在全球舉辦研習(xí)班,培訓(xùn)臨床醫(yī)生使用它。
馬斯克的Grok 3人工智能提供關(guān)于制造化學(xué)武器的“數(shù)百頁詳細(xì)說明”
https://futurism.com/elon-musk-grok-3-chemical-weapons
xAI的聊天機器人Grok 3一開始竟給出制造化學(xué)武器的詳細(xì)說明,引發(fā)嚴(yán)重安全擔(dān)憂。開發(fā)者萊納斯·??纤顾分赋鲞@一問題后,xAI設(shè)置了防護措施來避免這類說明出現(xiàn)。Grok 3的安全保障已加強,但潛在漏洞仍存。
蘋果可能正準(zhǔn)備在蘋果智能中集成 Gemini
https://www.theverge.com/news/618087/apple-could-be-preparing-to-add
最近iOS 18.4測試版代碼有變動,顯示蘋果正準(zhǔn)備將谷歌的Gemini AI模型集成到蘋果智能中。
為什么OpenAI目前還未將深度研究應(yīng)用于其API
https://techcrunch.com/2025/02/25/why-openai-isnt-bringing-deep-research-to-its-api-just-yet/
OpenAI暫停向開發(fā)者API提供深度研究AI模型,以評估其在現(xiàn)實世界中的說服風(fēng)險和傳播錯誤信息的可能性。
員工在工作中使用人工智能聊天機器人的體驗
大多數(shù)員工在工作場所很少使用人工智能聊天機器人,使用人群主要集中在更年輕、學(xué)歷更高的員工中,他們主要用其進行研究和內(nèi)容編輯。