2024-10-22 簡訊 : Meta 的最新開源發(fā)布


頭條


Meta 的最新開源發(fā)布

https://ai.meta.com/blog/fair-news-segment-anything-2-1-meta-spirit-lm-layer-skip-salsa-lingua/

Meta 發(fā)布了大量重要且有用的研究成果,包括語音轉語音模型、改進的 SAM 以及許多其他有趣的進展。

Anthropic 發(fā)布其更新的安全政策,可以使 AI 更難失控

https://venturebeat.com/ai/anthropic-just-made-it-harder-for-ai-to-go-rogue-with-its-updated-safety-policy/

Anthropic 更新了其負責任的擴展政策,其中包括對存在重大風險的 AI 模型(例如生物武器和自主 AI 研究)的能力閾值。該政策旨在通過引入 AI 安全級別來設定行業(yè)標準,這些級別要求根據模型能力采取更嚴格的保障措施。通過公開披露安全實踐并維持負責任的擴展官,Anthropic 希望在 AI 治理方面發(fā)揮領導作用并啟發(fā)整個行業(yè)采取類似的做法。


研究


捷徑模型

https://kvfrans.com/shortcut-models/

捷徑模型是一種新型一致性模型,只需很少的推理步驟即可生成連續(xù)信號。

前沿模型的破壞評估

https://www.anthropic.com/research/sabotage-evaluations

Anthropic 進行了多項新穎的評估,以確定弱點以及如何衡量大型和強大模型中的錯位。

零樣本 3D 視覺接地

https://runsenxu.com/projects/VLM-Grounder/

VLM-Grounder 是一種新的 3D 視覺落地方法,它通過使用視覺語言模型 (VLM) 和 2D 圖像克服了傳統(tǒng)方法的局限性。


工程


DeepSeek 的原生多模態(tài)模型

https://github.com/deepseek-ai/Janus

DeepSeek 已訓練并發(fā)布了一個 1.3b 的強大模型,該模型可以對交錯的文本和圖像進行操作,以生成和理解。

Meta 的 Lingua

https://github.com/facebookresearch/lingua

Meta 創(chuàng)建了一個簡單且適合研究的代碼庫,可以在 24 小時內重現(xiàn) Llama 2 7B。

將文本到圖像模型與人類價值觀對齊

https://github.com/achernarwang/LiVO

LiVO(輕量級值優(yōu)化)是一種將文本到圖像模型與人類價值觀對齊的新方法。


雜七雜八


長上下文競賽

https://www.kaggle.com/competitions/gemini-long-context/overview

Gemini 團隊已撥出 10 萬美元用于最佳利用其長上下文模型功能。

AlphaCodium 的表現(xiàn)優(yōu)于 o1 模型的直接提示

https://www.qodo.ai/blog/system-2-thinking-alphacodium-outperforms-direct-prompting-of-openai-o1/

OpenAI 的 o1 模型展現(xiàn)了系統(tǒng) 1.5 思維,與之前的 LLM 相比,其推理能力有所增強,但仍未達到完整的系統(tǒng) 2 深思熟慮的問題解決能力。AlphaCodium 通過提供指導推理和迭代細化的結構化框架,顯著提高了 o1 的編碼性能,在 Codeforces 基準測試中實現(xiàn)了更高的準確性。雖然 o1 和 AlphaCodium 共同展示了推動 AI 向更深層次推理發(fā)展的前景,但仍有許多工作要做,以將完整的系統(tǒng) 2 思維整合到 AI 模型中。

Duolingo 首席執(zhí)行官 Luis von Ahn 認為人工智能有很多東西可以教給我們

https://www.theverge.com/24267841/luis-von-ahn-duolingo-owl-language-learning-gamification-generative-ai-android-decoder

Duolingo 首席執(zhí)行官 Luis von Ahn 討論了如何利用人工智能和游戲化來增強語言學習,例如通過與人工智能化身聊天對話和人工智能生成的視頻游戲式冒險等功能。該公司最近推出了 Duolingo Max,這是一種價格更高的訂閱計劃,提供人工智能驅動的對話練習,因為人工智能生成的內容成本更低,開發(fā)速度更快。盡管人工智能在參與度方面存在局限性,但 Duolingo 仍致力于通過平衡學習效率和游戲化、娛樂性體驗來保持用戶的積極性。

易于破解的視覺語言模型

https://github.com/vikhyat/moondream/tree/main/moondream/torch

純 PyTorch 中簡單且性能卓越的 VLM 實現(xiàn)。

Amazon Ads 的 AI 生成器工具現(xiàn)在可以創(chuàng)建音頻廣告

https://www.adweek.com/commerce/amazons-ai-generator-tool-can-now-create-audio-ads/

Amazon 正在通過其自助廣告平臺擴大其生成式 AI 在創(chuàng)建音頻廣告方面的應用。

Google Shopping 正在推出‘為您量身定制’的產品信息流

https://www.theverge.com/2024/10/15/24268117/google-shopping-personalized-feed-products-ai

Google Shopping 推出了由人工智能驅動的個性化信息流,可根據用戶搜索和 YouTube 觀看次數推薦產品。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容