
頭條
Segment Anything 圖像分割的重大進(jìn)步
圖像分割是提取圖像中代表特定對(duì)象(例如人或桌子)的所有像素的過程。由于幾個(gè)原因,這是一項(xiàng)艱巨的任務(wù),通常它要么需要大量預(yù)定義對(duì)象的數(shù)據(jù)集,要么需要一些的初級(jí)監(jiān)督數(shù)據(jù)。 Meta 的這個(gè)全新的、完全開源的模型感覺就像是功能上的飛躍。他們收集了大量數(shù)據(jù)集,簡(jiǎn)化了注釋功能,并創(chuàng)建了一個(gè)可以在瀏覽器中實(shí)時(shí)運(yùn)行的模型。并提供演示、代碼和論文。
谷歌展示了其最新的 A.I.超級(jí)計(jì)算機(jī),說它打敗了英偉達(dá)
谷歌開發(fā)了一種基于 TPU 的超級(jí)計(jì)算機(jī),稱為 TPU v4,它聲稱比 Nvidia 的 A100 芯片快 1.2-1.7 倍,功耗低 1.3-1.9 倍。該系統(tǒng)由 4,000 多個(gè)張量處理單元 (TPU) 組成,自 2020 年以來一直在運(yùn)行,并用于訓(xùn)練谷歌的 PaLM 模型。 AI 不斷增長(zhǎng)的功率需求繼續(xù)推動(dòng)芯片行業(yè)的創(chuàng)新,并使谷歌、微軟和亞馬遜等云提供商受益,它們出租處理能力并為初創(chuàng)企業(yè)提供資源。
研究
模型在訓(xùn)練時(shí)會(huì)發(fā)生什么?
來自 EleutherAI 的 Pythia 論文終于來了!隨著時(shí)間的推移,他們?cè)谟?xùn)練過程中發(fā)布了數(shù)百個(gè) Transformer 模型的檢查點(diǎn)。這很有用,因?yàn)橥耆磺宄S著時(shí)間的推移會(huì)獲得哪些技能模型,但現(xiàn)在人們可以檢查訓(xùn)練的動(dòng)態(tài)過程,并深入了解潛在的改進(jìn)點(diǎn)。
大型語言模型綜述
本文討論了人工智能算法語言建模的演變,重點(diǎn)關(guān)注具有數(shù)十億參數(shù)的大型語言模型 (LLM) 的最新進(jìn)展。該論文全面回顧了 LLM,包括預(yù)訓(xùn)練、自適應(yīng)調(diào)優(yōu)、利用和能力評(píng)估,并為研究人員和工程師提供了有用的資源。
AUDIT :按照 Latent Diffusion Models 的指令進(jìn)行音頻編輯
AUDIT 是一種基于潛在擴(kuò)散模型的新型指令引導(dǎo)音頻編輯模型,它可以自動(dòng)只修改必要的音頻片段,并且只需要編輯指令而不是完整的目標(biāo)音頻描述作為文本輸入。所提出的模型在多個(gè)音頻編輯任務(wù)(包括添加、刪除、替換、修復(fù)和超分辨率)的客觀和主觀指標(biāo)上都取得了最先進(jìn)的結(jié)果。
工程
LLMs 基礎(chǔ)
本教程討論大型語言模型的基礎(chǔ)知識(shí)。
Lyft2vec:Lyft Embeddings
這篇文章解釋了 Lyft 如何使用圖形學(xué)習(xí)方法來生成嵌入,這是高維信息的緊湊向量表示,以及這些嵌入如何揭示對(duì)拼車行業(yè)中的乘客、司機(jī)、位置和時(shí)間的洞察。
Vocode (GitHub Repo)
Vocode 是一個(gè)開源庫,可以輕松構(gòu)建基于語音的 LLM 應(yīng)用程序。
雜七雜八
我們的 AI 安全方法論
OpenAI 在能力研究方面處于領(lǐng)先地位,他們也是為其語言模型開發(fā)安全系統(tǒng)的強(qiáng)大參與者。他們概述了他們正在處理的幾個(gè)方向,例如真實(shí)性、兒童安全、隱私等。他們?cè)谒羞@些目標(biāo)上都取得了進(jìn)展,事實(shí)上 GPT-4 在發(fā)布前 6 個(gè)月就完成了培訓(xùn),但由于關(guān)注安全問題而退縮,這很有趣。這里最大的收獲是 GPT-4 產(chǎn)生事實(shí)錯(cuò)誤輸出的可能性比 gpt-3.5-turbo 低 40%。
AI 視頻將走向何方?
AI 生成的視頻越來越受歡迎,通常描繪超現(xiàn)實(shí)場(chǎng)景或名人模因。該技術(shù)的快速發(fā)展引發(fā)了對(duì)其在好萊塢的潛力的質(zhì)疑,例如電影選角或場(chǎng)景建模。盡管挑戰(zhàn)依然存在,但專家認(rèn)為人工智能將對(duì)內(nèi)容創(chuàng)作產(chǎn)生重大影響,但它不會(huì)很快取代電影行業(yè)的人才。
神經(jīng)網(wǎng)絡(luò):從菜鳥到老鳥 (Online Course)
Andrej Karpathy 開設(shè)的一門關(guān)于用代碼從頭開始構(gòu)建神經(jīng)網(wǎng)絡(luò)的課程。
Imagica AI (Product)
在幾分鐘內(nèi)構(gòu)建無代碼 AI 應(yīng)用程序。
Meta 將在今年推出 AI 生成的廣告
Facebook 所有者 Meta 打算在 12 月之前將其專有的生成人工智能商業(yè)化,與谷歌一起尋找該技術(shù)的實(shí)際應(yīng)用。
澳大利亞市長(zhǎng)可能起訴 ChatGPT
一位澳大利亞市長(zhǎng)威脅要起訴 OpenAI,因?yàn)?AI 說他因受賄而入獄服刑。
Snapchat 為其 AI 聊天機(jī)器人添加了新的安全措施
Snapchat 正在推出新工具,包括年齡過濾器和父母監(jiān)督,以改進(jìn)其 AI 聊天機(jī)器人。