
頭條
DeepMind的通用人工智能安全策略
https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/
谷歌DeepMind闡述了其在構(gòu)建安全可靠通用人工智能方面的觀點,強調(diào)隨著通用人工智能能力的發(fā)展,要做好監(jiān)督和技術(shù)保障工作 。
OpenAI 進行了首筆網(wǎng)絡(luò)安全投資
https://techcrunch.com/2025/04/03/openai-just-made-its-first-cybersecurity-investment/
OpenAI對Adaptive Security進行了投資,這是一家利用人工智能模擬并培訓(xùn)員工防范社會工程攻擊的初創(chuàng)公司。Adaptive Security獲得了4300萬美元的A輪融資,打算在人工智能威脅日益增加的情況下加強其平臺。該初創(chuàng)公司由資深企業(yè)家布萊恩·朗聯(lián)合創(chuàng)立,自2023年成立以來已迅速積累了超100個客戶。
OpenAI非營利指導(dǎo)委員會
https://links.tldrnewsletter.com/P98uoF
OpenAI正組建一個新的專家委員會,以規(guī)劃其慈善部門如何支持使用人工智能的社區(qū),旨在讓人工智能創(chuàng)新與現(xiàn)實世界的非營利需求相契合。
研究
從視頻擴散模型中提取關(guān)節(jié)運動學(xué)
https://research.nvidia.com/labs/dir/akd/
這項研究引入了關(guān)節(jié)運動學(xué)蒸餾(AKD)框架,該框架利用基于骨骼的動畫和生成式擴散模型,以較低的復(fù)雜度生成高保真、符合物理原理的角色動作。它通過分數(shù)蒸餾采樣來引導(dǎo)關(guān)節(jié)層面的控制,確保結(jié)構(gòu)一致性,在3D連貫性和富有表現(xiàn)力的動作質(zhì)量方面優(yōu)于現(xiàn)有方法。
基于LoRA的強化微調(diào)
https://arxiv.org/abs/2504.00460
MetaLoRA利用元學(xué)習(xí)原理引入動態(tài)參數(shù)生成,增強了基于LoRA的微調(diào)策略的靈活性和任務(wù)感知能力。
CLIP 中的后門攻擊
https://arxiv.org/abs/2502.01385v1
CLIP模型極易受到投毒后門攻擊,只需極少的投毒數(shù)據(jù)就能讓攻擊成功率接近100%。一種有效的檢測方法是利用局部異常值檢測來發(fā)現(xiàn)現(xiàn)有數(shù)據(jù)集中無意產(chǎn)生的后門。
工程
大中小網(wǎng)絡(luò)(GitHub 倉庫)
https://github.com/THU-MIG/lsnet
受人類視覺系統(tǒng)“見大、聚焦小”動態(tài)異尺度能力啟發(fā),一個全新的輕量級視覺模型家族誕生。LSNet在各種視覺任務(wù)中實現(xiàn)了頂尖的性能與效率平衡。它還引入了一種新型卷積核。
PPLX CUDA內(nèi)核(GitHub倉庫)
https://github.com/ppl-ai/pplx-kernels
Perplexity發(fā)布了一些混合專家(MoE)內(nèi)核,這些內(nèi)核在規(guī)模上比DeepSeek表現(xiàn)更優(yōu),同時在混合專家架構(gòu)方面更靈活,限制也更少。
用于評估仇恨言論的HateBench
https://huggingface.co/datasets/TrustAIRLab/HateBenchSet
HateBench提供了一個框架,用于評估基于大語言模型生成內(nèi)容的仇恨言論檢測模型,還附帶人工標注數(shù)據(jù)集以及用于分析對抗性和隱蔽性仇恨活動的代碼。
其他
佐諾斯文本轉(zhuǎn)語音技術(shù)
https://www.zyphra.com/post/beta-release-of-zonos-v0-1
一款出色的用于語音生成和語音克隆的Apache 2.0模型。它支持多語言,能進行富有表現(xiàn)力的實時生成。
Hugging Face的人工智能智能體課程
https://huggingface.co/learn/agents-course/en/unit0/introduction
Hugging Face今天推出了一門人工智能智能體課程。這門免費課程將帶你踏上從新手到專家的旅程,助你理解、使用并構(gòu)建人工智能智能體。
谷歌推出雙子座模型的速度比其人工智能安全報告的發(fā)布速度還快
谷歌推出了人工智能推理模型Gemini 2.5 Pro。該模型在編碼和數(shù)學(xué)能力方面領(lǐng)先,但谷歌尚未發(fā)布安全報告。谷歌計劃在收集實驗版反饋后發(fā)布這些報告,不過這種做法引發(fā)了對透明度的擔憂。盡管承諾保持透明度,但谷歌在模型部署上似乎更看重速度,這與負責(zé)任的人工智能實踐的行業(yè)規(guī)范有所不同。
克勞德編程開發(fā)者大會
https://links.tldrnewsletter.com/eHBjx3
Anthropic宣布舉辦其首場開發(fā)者活動,重點是圍繞Claude進行實踐環(huán)節(jié)和分享最佳開發(fā)經(jīng)驗?;顒佣ㄓ?月在舊金山舉行。
Hugging Face的大語言模型(LLM)課程
https://huggingface.co/blog/llm-course
Hugging Face將其廣受歡迎的自然語言處理課程改版為更全面的大語言模型課程,增加了關(guān)于微調(diào)、推理模型和現(xiàn)代人工智能智能體工作流程的章節(jié)。
熱門編程人工智能代理德文推出新的隨用隨付計劃
http://finance.yahoo.com/news/devin-viral-coding-ai-agent-194633884.html
Cognition為其人工智能編程工具Devin推出了一項20美元的入門級計劃。Devin經(jīng)過改進,能更好地處理復(fù)雜編碼任務(wù)。