2025-04-07 簡訊 : DeepMind的通用人工智能安全策略


頭條


DeepMind的通用人工智能安全策略

https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/

谷歌DeepMind闡述了其在構(gòu)建安全可靠通用人工智能方面的觀點,強調(diào)隨著通用人工智能能力的發(fā)展,要做好監(jiān)督和技術(shù)保障工作 。

OpenAI 進行了首筆網(wǎng)絡(luò)安全投資

https://techcrunch.com/2025/04/03/openai-just-made-its-first-cybersecurity-investment/

OpenAI對Adaptive Security進行了投資,這是一家利用人工智能模擬并培訓(xùn)員工防范社會工程攻擊的初創(chuàng)公司。Adaptive Security獲得了4300萬美元的A輪融資,打算在人工智能威脅日益增加的情況下加強其平臺。該初創(chuàng)公司由資深企業(yè)家布萊恩·朗聯(lián)合創(chuàng)立,自2023年成立以來已迅速積累了超100個客戶。

OpenAI非營利指導(dǎo)委員會

https://links.tldrnewsletter.com/P98uoF

OpenAI正組建一個新的專家委員會,以規(guī)劃其慈善部門如何支持使用人工智能的社區(qū),旨在讓人工智能創(chuàng)新與現(xiàn)實世界的非營利需求相契合。


研究


從視頻擴散模型中提取關(guān)節(jié)運動學(xué)

https://research.nvidia.com/labs/dir/akd/

這項研究引入了關(guān)節(jié)運動學(xué)蒸餾(AKD)框架,該框架利用基于骨骼的動畫和生成式擴散模型,以較低的復(fù)雜度生成高保真、符合物理原理的角色動作。它通過分數(shù)蒸餾采樣來引導(dǎo)關(guān)節(jié)層面的控制,確保結(jié)構(gòu)一致性,在3D連貫性和富有表現(xiàn)力的動作質(zhì)量方面優(yōu)于現(xiàn)有方法。

基于LoRA的強化微調(diào)

https://arxiv.org/abs/2504.00460

MetaLoRA利用元學(xué)習(xí)原理引入動態(tài)參數(shù)生成,增強了基于LoRA的微調(diào)策略的靈活性和任務(wù)感知能力。

CLIP 中的后門攻擊

https://arxiv.org/abs/2502.01385v1

CLIP模型極易受到投毒后門攻擊,只需極少的投毒數(shù)據(jù)就能讓攻擊成功率接近100%。一種有效的檢測方法是利用局部異常值檢測來發(fā)現(xiàn)現(xiàn)有數(shù)據(jù)集中無意產(chǎn)生的后門。


工程


大中小網(wǎng)絡(luò)(GitHub 倉庫)

https://github.com/THU-MIG/lsnet

受人類視覺系統(tǒng)“見大、聚焦小”動態(tài)異尺度能力啟發(fā),一個全新的輕量級視覺模型家族誕生。LSNet在各種視覺任務(wù)中實現(xiàn)了頂尖的性能與效率平衡。它還引入了一種新型卷積核。

PPLX CUDA內(nèi)核(GitHub倉庫)

https://github.com/ppl-ai/pplx-kernels

Perplexity發(fā)布了一些混合專家(MoE)內(nèi)核,這些內(nèi)核在規(guī)模上比DeepSeek表現(xiàn)更優(yōu),同時在混合專家架構(gòu)方面更靈活,限制也更少。

用于評估仇恨言論的HateBench

https://huggingface.co/datasets/TrustAIRLab/HateBenchSet

HateBench提供了一個框架,用于評估基于大語言模型生成內(nèi)容的仇恨言論檢測模型,還附帶人工標注數(shù)據(jù)集以及用于分析對抗性和隱蔽性仇恨活動的代碼。


其他


佐諾斯文本轉(zhuǎn)語音技術(shù)

https://www.zyphra.com/post/beta-release-of-zonos-v0-1

一款出色的用于語音生成和語音克隆的Apache 2.0模型。它支持多語言,能進行富有表現(xiàn)力的實時生成。

Hugging Face的人工智能智能體課程

https://huggingface.co/learn/agents-course/en/unit0/introduction

Hugging Face今天推出了一門人工智能智能體課程。這門免費課程將帶你踏上從新手到專家的旅程,助你理解、使用并構(gòu)建人工智能智能體。

谷歌推出雙子座模型的速度比其人工智能安全報告的發(fā)布速度還快

https://techcrunch.com/2025/04/03/google-is-shipping-gemini-models-faster-than-its-ai-safety-reports/

谷歌推出了人工智能推理模型Gemini 2.5 Pro。該模型在編碼和數(shù)學(xué)能力方面領(lǐng)先,但谷歌尚未發(fā)布安全報告。谷歌計劃在收集實驗版反饋后發(fā)布這些報告,不過這種做法引發(fā)了對透明度的擔憂。盡管承諾保持透明度,但谷歌在模型部署上似乎更看重速度,這與負責(zé)任的人工智能實踐的行業(yè)規(guī)范有所不同。

克勞德編程開發(fā)者大會

https://links.tldrnewsletter.com/eHBjx3

Anthropic宣布舉辦其首場開發(fā)者活動,重點是圍繞Claude進行實踐環(huán)節(jié)和分享最佳開發(fā)經(jīng)驗?;顒佣ㄓ?月在舊金山舉行。

Hugging Face的大語言模型(LLM)課程

https://huggingface.co/blog/llm-course

Hugging Face將其廣受歡迎的自然語言處理課程改版為更全面的大語言模型課程,增加了關(guān)于微調(diào)、推理模型和現(xiàn)代人工智能智能體工作流程的章節(jié)。

熱門編程人工智能代理德文推出新的隨用隨付計劃

http://finance.yahoo.com/news/devin-viral-coding-ai-agent-194633884.html

Cognition為其人工智能編程工具Devin推出了一項20美元的入門級計劃。Devin經(jīng)過改進,能更好地處理復(fù)雜編碼任務(wù)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容