頭條
谷歌的Gemin 正在使用Claude來改進(jìn)其人工智能
https://techcrunch.com/2024/12/24/google-is-using-anthropics-claude-to-improve-its-gemini-ai/
谷歌的外包人員正在將雙子座(Gemini)人工智能的回應(yīng)與 Anthropic 公司的克勞德(Claude)進(jìn)行比較,但不清楚谷歌是否獲得使用 Claude 進(jìn)行測(cè)試的許可。外包人員指出,克勞德在回應(yīng)中比雙子座更注重安全性。谷歌表示,雖然它會(huì)對(duì)照競(jìng)爭(zhēng)對(duì)手評(píng)估模型輸出結(jié)果,但不會(huì)用 Anthropic 的模型來訓(xùn)練雙子座。
人工智能模型越來越聰明,新的測(cè)試正在加緊跟上
https://time.com/7203729/ai-evaluations-safety/
人工智能系統(tǒng)發(fā)展迅速,在諸如Epoch AI的FrontierMath等新的挑戰(zhàn)性評(píng)估中表現(xiàn)超出預(yù)期。盡管有這樣的進(jìn)步,但設(shè)計(jì)有效的評(píng)估來理解和管理人工智能能力仍然很復(fù)雜,而且資金不足。專家強(qiáng)調(diào),隨著模型的發(fā)展,需要有精密、及時(shí)的測(cè)試來監(jiān)測(cè)潛在風(fēng)險(xiǎn)。
虛幻的人工智能如何助力科學(xué)構(gòu)想重大突破
https://www.nytimes.com/2024/12/23/science/ai-hallucinations-science.html
人工智能的“幻覺”現(xiàn)象雖常因不準(zhǔn)確而受批評(píng),但在科研中很有價(jià)值,能加快創(chuàng)意產(chǎn)生和發(fā)現(xiàn)進(jìn)程。顯著成果包括獲諾貝爾獎(jiǎng)的蛋白質(zhì)設(shè)計(jì),以及抗生素研發(fā)和導(dǎo)管設(shè)計(jì)方面的創(chuàng)新。盡管“幻覺”一詞存在爭(zhēng)議,專家仍認(rèn)可人工智能在科學(xué)領(lǐng)域帶來突破性見解的潛力。
研究
高效且穩(wěn)健的安全架構(gòu)
https://ai.meta.com/blog/meta-fair-updates-agents-robustness-safety-architecture/
Meta發(fā)布了一個(gè)更新后的智能體框架,用于在實(shí)際應(yīng)用中測(cè)量并確保其穩(wěn)健性和安全性。
跨場(chǎng)景的材料變換
https://arxiv.org/abs/2411.08037v1
這項(xiàng)研究引入了一種技術(shù),能用解耦神經(jīng)輻射場(chǎng)(NeRF)在不同場(chǎng)景中應(yīng)用材質(zhì)變換,比如濕潤(rùn)效果或涂層效果。
用用戶反饋訓(xùn)練人工智能的風(fēng)險(xiǎn)
https://arxiv.org/abs/2411.02306v1
研究人員探究了訓(xùn)練人工智能語言模型以優(yōu)化用戶反饋(比如點(diǎn)贊評(píng)級(jí))的后果。研究表明,這種方法可能導(dǎo)致操控行為,因?yàn)槿斯ぶ悄軙?huì)學(xué)會(huì)鉆系統(tǒng)空子。
工程
LLMs中聯(lián)邦學(xué)習(xí)的基準(zhǔn)(GitHub倉庫)
https://github.com/1xbq1/fedmllm
一項(xiàng)新的基準(zhǔn)測(cè)試對(duì)多模態(tài)大語言模型(MLLMs)在不同場(chǎng)景下的聯(lián)邦微調(diào)進(jìn)行了評(píng)估,其中包括兩個(gè)數(shù)據(jù)集、五種基線以及十多種多模態(tài)異質(zhì)性。
提示詞微調(diào)操作指南(GitHub倉庫)
https://github.com/varungodbole/prompt-tuning-playbook
提示工程實(shí)用指南
金屬謎題(GitHub倉庫)
https://github.com/abeleinin/Metal-Puzzles
一些謎題和教程,用于學(xué)習(xí)在Mac金屬加速環(huán)境下進(jìn)行GPU編程。
其他
人工智能教母李飛飛對(duì)計(jì)算機(jī)視覺有愿景
https://spectrum.ieee.org/fei-fei-li-world-labs
李飛飛的初創(chuàng)公司“世界實(shí)驗(yàn)室”,旨在通過3D空間智能來提升人工智能,以生成3D世界并與之互動(dòng)。對(duì)空間智能的關(guān)注,對(duì)于提升人工智能在真實(shí)和虛擬3D環(huán)境中的能力至關(guān)重要。這項(xiàng)技術(shù)可能會(huì)革新機(jī)器人、設(shè)計(jì)和增強(qiáng)現(xiàn)實(shí)等領(lǐng)域。
人工智能革命面臨數(shù)據(jù)短缺問題, 研究人員能做些什么呢?
https://www.nature.com/articles/d41586-024-03990-2
人工智能發(fā)展面臨數(shù)據(jù)短缺危機(jī),預(yù)計(jì)到2028年爆發(fā),因?yàn)橛?xùn)練數(shù)據(jù)規(guī)模已接近公共網(wǎng)絡(luò)文本總量。像OpenAI這樣的人工智能公司正在探索解決辦法,比如生成新數(shù)據(jù)、使用非傳統(tǒng)數(shù)據(jù)源來緩解這個(gè)問題。這場(chǎng)數(shù)據(jù)危機(jī)可能會(huì)讓關(guān)注點(diǎn)從小規(guī)模、專業(yè)化的人工智能模型轉(zhuǎn)向大規(guī)模語言模型(LLMs)。
紅兔機(jī)器人公司提供類人機(jī)器人服務(wù)
https://www.theregister.com/2024/12/15/red_rabbit_robotics/
紅兔機(jī)器人公司通過開發(fā)RX1機(jī)器人并將其開源,用于制造和商業(yè)應(yīng)用,推動(dòng)自主勞動(dòng)領(lǐng)域發(fā)展。該公司旨在通過為枯燥、危險(xiǎn)和臟污的工作提供經(jīng)濟(jì)高效的機(jī)器人解決方案,來緩解勞動(dòng)力短缺問題。公司目標(biāo)是讓機(jī)器人以更低價(jià)格更容易獲得,逐步從遠(yuǎn)程操作過渡到完全自主運(yùn)行,優(yōu)先考慮實(shí)用性和廣泛應(yīng)用。
快訊
克拉納公司首席執(zhí)行官表示,因人工智能停止招聘,但仍在宣傳許多空缺職位。
克拉納公司首席執(zhí)行官塞巴斯蒂安·西米亞特科夫斯基稱,生成式人工智能使得公司得以裁員,但該公司仍在招聘關(guān)鍵崗位人員。
大型語言模型(LLMs)能否進(jìn)行非語言推理?
https://arstechnica.com/ai/2024/12/are-llms-capable-of-non-verbal-reasoning/
Meta公司和加州大學(xué)圣地亞哥分校的研究人員正在開發(fā)能在“潛在空間”中處理邏輯解決方案、繞過自然語言限制的大型語言模型(LLMs)。
對(duì)近期OpenAI公開事件報(bào)道的簡(jiǎn)要看法
https://surfingcomplexity.blog/2024/12/14/quick-takes-on-the-recent-openai-public-incident-write-up/
OpenAI在12月11日發(fā)生的Kubernetes事件是由意外交互導(dǎo)致的,當(dāng)時(shí)一個(gè)新的遙測(cè)服務(wù)使Kubernetes API服務(wù)器過載,導(dǎo)致基于DNS的服務(wù)發(fā)現(xiàn)出現(xiàn)故障。