頭條

福特宣布新的自動(dòng)駕駛部門“Latitude AI”

福特致力于自動(dòng)駕駛汽車的未來(lái)，這一聲明證實(shí)了這一點(diǎn)?？偛课挥谄テ澅さ?550 人團(tuán)隊(duì)將繼續(xù)致力于福特產(chǎn)品中的技術(shù)，同時(shí)對(duì)全自動(dòng)駕駛汽車進(jìn)行長(zhǎng)期研究。該領(lǐng)域的長(zhǎng)期領(lǐng)導(dǎo)者將以各種身份領(lǐng)導(dǎo)團(tuán)隊(duì)。

谷歌云 CEO 為持續(xù)的 AI 能力而吶喊

隨著人工智能競(jìng)賽的升溫，谷歌感受到了壓力。在最近的一次內(nèi)部會(huì)議上，谷歌云 CEO 表示“游戲永遠(yuǎn)不會(huì)在第一分鐘結(jié)束”，并敦促員工團(tuán)隊(duì)合作，繼續(xù)提高 AI 能力。他談到了歷史書籍將如何描述谷歌在這段時(shí)間的航行，并對(duì)搜索的未來(lái)表示樂(lè)觀。

研究

長(zhǎng)卷積和巧妙的令牌混合規(guī)模在 64k 令牌時(shí)快 100 倍

斯坦福大學(xué)系統(tǒng)小組的另一篇論文致力于提高長(zhǎng)上下文的語(yǔ)言建模能力。他們致力于構(gòu)建次二次注意力替代，并建立在他們最近在狀態(tài)空間模型和長(zhǎng)卷積工作中的大部分工作之上。他們引入了“Hyena Hierarchy”，這是對(duì)注意力的一種替代，同時(shí)減少了 FLOP，并改進(jìn)了長(zhǎng)上下文擴(kuò)展。這是令人興奮的下一步，值得一讀。

無(wú)限大小的擴(kuò)散恢復(fù)

該論文討論了擴(kuò)散模型在零樣本圖像恢復(fù)中的使用，并提出了處理任意大小圖像的解決方案。當(dāng)前的方法僅處理固定大小的圖像，但所提出的方法使用 Mask-Shift Restoration 來(lái)解決局部不連貫，并使用 Hierarchical Restoration 來(lái)緩解域外問(wèn)題。這些無(wú)參數(shù)方法不僅可以用于圖像恢復(fù)，還可以用于無(wú)限大小的圖像生成，使其成為擴(kuò)散模型的潛在通用工具。

StraIT：使用分層圖像變換器的非自回歸生成

該論文提出了一種稱為分層圖像變換器 (StraIT) 的非自回歸 (NAR) 生成模型，該模型在高質(zhì)量圖像合成方面優(yōu)于現(xiàn)有的自回歸 (AR) 和擴(kuò)散模型 (DM)。 StraIT 利用圖像的分層特性將視覺標(biāo)記編碼為分層級(jí)別，從而減輕建模難度并提升 NAR 模型的生成能力。實(shí)驗(yàn)表明，StraIT 在 ImageNet 上以 256×256 分辨率實(shí)現(xiàn)了 3.96 的 FID 分?jǐn)?shù)，而沒(méi)有利用采樣或輔助圖像分類器中的任何指導(dǎo)。

工程

使用擴(kuò)散模型的單眼深度估計(jì) (Github Repo)

作者提出了一種基于去噪擴(kuò)散模型的單目深度估計(jì)方法。他們引入創(chuàng)新來(lái)解決嘈雜和不完整的深度圖，并利用預(yù)訓(xùn)練進(jìn)行監(jiān)督學(xué)習(xí)。他們的 DepthGen 模型實(shí)現(xiàn)了最先進(jìn)的性能并自然地表示深度模糊。該模型的插補(bǔ)支持和零樣本性能支持簡(jiǎn)單的文本到 3D 管道。

比 ControlNet 更好的控制 (HuggingFace Space)

另一種控制文本到圖像模型的幾何輸出的新穎方法。這次可以指定多個(gè)區(qū)域進(jìn)行控制。通用代碼尚不可用，但您可以在此空間中測(cè)試模型。

拼貼擴(kuò)散：精確控制拼貼條件圖像生成

該論文提出了 Collage Diffusion，這是一種拼貼條件擴(kuò)散算法，可以精確控制生成圖像中對(duì)象的空間排列和視覺屬性。通過(guò)使用 alpha 掩碼修改文本-圖像交叉注意力并學(xué)習(xí)每層的專門文本表示，用戶可以逐層編輯生成圖像的各個(gè)組成部分并控制圖像協(xié)調(diào)。 Collage Diffusion 生成全局協(xié)調(diào)的圖像，比以前的方法更好地保持所需的對(duì)象位置和視覺特征。

雜七雜八

EleutherAI 回顧展

Eleuther 是機(jī)器學(xué)習(xí)領(lǐng)域頂級(jí)的開放科學(xué)合作組織之一，在過(guò)去一年半的時(shí)間里為該領(lǐng)域做出了許多貢獻(xiàn)。他們發(fā)表了 28 篇論文、10 種不同的模型和數(shù)十個(gè)代碼庫(kù)。許多最激動(dòng)人心的發(fā)展，如 RWKV、GPTNeo 和 AlphaFold 的開放復(fù)制都來(lái)自這個(gè)小組。在這里閱讀更多關(guān)于他們正在做什么以及接下來(lái)會(huì)發(fā)生什么的信息。

20B Flan UL2 模型發(fā)布 - 完全開源，無(wú)限制

該指令調(diào)優(yōu)模型的上下文長(zhǎng)度為 2048 個(gè)標(biāo)記，是文本生成的優(yōu)秀基礎(chǔ)模型。憑借改進(jìn)的 CoT、上下文學(xué)習(xí)和一般性能（比 FlanT5-xxl 高出 7.4%），該模型在開源語(yǔ)言模型方面向前邁出了一大步。該模型使用 UL2 目標(biāo)，它是降噪器的混合體，在通用語(yǔ)言建模方面表現(xiàn)出令人印象深刻的性能。重要的是，他們還在 Flan 指令調(diào)整過(guò)程之前通過(guò)額外的 100k 步訓(xùn)練消除了對(duì)繁瑣模式標(biāo)記的需求。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

數(shù)據(jù)科學(xué)簡(jiǎn)訊 2023-03-04

數(shù)據(jù)科學(xué)簡(jiǎn)訊 2023-03-04

頭條

福特宣布新的自動(dòng)駕駛部門“Latitude AI”

谷歌云 CEO 為持續(xù)的 AI 能力而吶喊

研究

長(zhǎng)卷積和巧妙的令牌混合規(guī)模在 64k 令牌時(shí)快 100 倍

無(wú)限大小的擴(kuò)散恢復(fù)

StraIT：使用分層圖像變換器的非自回歸生成

工程

使用擴(kuò)散模型的單眼深度估計(jì) (Github Repo)

比 ControlNet 更好的控制 (HuggingFace Space)

拼貼擴(kuò)散：精確控制拼貼條件圖像生成

雜七雜八

EleutherAI 回顧展

20B Flan UL2 模型發(fā)布 - 完全開源，無(wú)限制

OpenAI CTO Mira Murati 的崛起

羅馬尼亞推出世界首位人工智能政府“顧問(wèn)”

OpenAI 定價(jià)線程 (Twitter Thread)

PromptCraft-Robotics（GitHub Repo）

Nebullvm (GitHub Repo)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容