數(shù)據(jù)科學(xué)簡訊 2023-04-15


頭條


構(gòu)建 LLM 應(yīng)用程序

用 LLM 構(gòu)建看起來很酷的東西很容易,而讓這個看起來很酷的東西產(chǎn)生實(shí)際生產(chǎn)力卻有很多困難。許多挑戰(zhàn)來自自然語言的歧義,以及如何存儲提示。 Chip Huyen 的這篇文章給出了他對此問題的深刻的見解,并給出了一個他覺得比較有前途的 LLM 應(yīng)用程序列表。

AWS 推出 Bedrock 服務(wù)

亞馬遜宣布了一項(xiàng)名為 Bedrock 的 AWS 新服務(wù),允許客戶使用來自不同公司的基礎(chǔ)模型,例如anthropic 和stability AI。這個想法是采用開放模型加上客戶自己的書(只需將其指向 s3)。最近有很多關(guān)于數(shù)據(jù)隱私和安全的討論,有了這項(xiàng)服務(wù),人們可以在自己的 AWS 基礎(chǔ)設(shè)施中運(yùn)行模型,從隱私的角度來看這很有吸引力。亞馬遜還宣布了兩個新模型,并允許個人開發(fā)者免費(fèi)訪問他們的代碼模型。


研究


DreamPose:通過Stable Diffusion實(shí)現(xiàn)時尚圖像到視頻的合成

DreamPose 是一種基于Stable Diffusion的圖像到視頻合成模型。給定人物和姿勢序列的輸入圖像,DreamPose 會按照姿勢序列合成輸入人物的逼真視頻。

兒童動畫數(shù)據(jù)集

2021 年,Meta 發(fā)布了一個很酷的演示,演示了使用 AI 為孩子們的圖畫制作動畫。現(xiàn)在他們已經(jīng)開源了包含 100k+ 個示例、動畫代碼、姿勢查找等的數(shù)據(jù)集。它似乎獲得了版權(quán)許可,因此對那些有興趣在自動化動畫領(lǐng)域工作的人很有用。很高興看到這次Meta 在過濾數(shù)據(jù)集時采取了一些額外的努力來保護(hù)隱私。

Vicuna:一款開源聊天機(jī)器人,以 90% 的 ChatGPT 質(zhì)量給 GPT-4 留下深刻印象

本文介紹了 Vicuna-13B,這是一種開源聊天機(jī)器人,通過在用戶對話數(shù)據(jù)上 fine tuen LLaMA 得到。 Vicuna-13B 在超過 90% 的情況下優(yōu)于 LLaMA 和 Stanford Alpaca 等其他模型,同時與 OpenAI ChatGPT 和 Google Bard 相比,質(zhì)量達(dá)到 90% 他們以上。訓(xùn)練 Vicuna-13B 的費(fèi)用在 300 美元左右,代碼和演示是公開的,可用于非商業(yè)用途。


工程


使用 VidStyleODE 進(jìn)行視頻編輯

VidStyleODE 結(jié)合了 StyleGAN 和 Neural-ODEs 用于分離視頻表示,支持外觀操作、運(yùn)動操作、圖像動畫和視頻插值/外推等應(yīng)用。

Continual Diffusion

文本到圖像的 diffusion models 在使用順序概念進(jìn)行定制化時會面臨災(zāi)難性的遺忘問題,導(dǎo)致對過去概念的圖像生成效果不佳。我們提出的 C-LoRA 方法通過持續(xù)自我調(diào)節(jié)的low-rank適應(yīng)克服了這個問題,在持續(xù)擴(kuò)散中優(yōu)于baseline,并在圖像分類的 rehearsal-free 持續(xù)學(xué)習(xí)中設(shè)置了最新的最高標(biāo)準(zhǔn)。

動態(tài)視頻的自適應(yīng)人像摳圖

Adam 是一種用于動態(tài)視頻的自適應(yīng)遮罩框架,它通過同時區(qū)分前景和背景并捕獲各種非結(jié)構(gòu)化視頻中的 alpha 遮罩細(xì)節(jié)來解決無 trimap 方法的局限性。利用互連的編碼器-解碼器網(wǎng)絡(luò)和Transformer網(wǎng)絡(luò),Adam 提高了消光真實(shí)感和時間相干性,為復(fù)雜的真實(shí)世界視頻實(shí)現(xiàn)了同類模型中的最佳的通用性。


雜七雜八


Chroma 的駐場黑客

在最近的籌款活動之后,矢量數(shù)據(jù)庫初創(chuàng)公司 Chroma 希望聘請一名黑客,為期 3 個月,以構(gòu)建需要長期記憶的酷炫 AI 應(yīng)用程序。具體來說,他們希望這位黑客能夠自我驅(qū)動并構(gòu)建強(qiáng)大的應(yīng)用程序!考慮到在語言模型之上進(jìn)行 MVP 開發(fā)的便利性,我希望看到更多此類職位出現(xiàn)。

人工智能如何顛覆視頻游戲

這篇文章探討了人工智能顛覆視頻游戲行業(yè)的潛力,強(qiáng)調(diào)了機(jī)器學(xué)習(xí)和程序內(nèi)容生成方面的創(chuàng)新如何改變游戲開發(fā)、用戶體驗(yàn)和該行業(yè)的整體經(jīng)濟(jì)。

人工智能不斷增加的人力和環(huán)境成本

本文認(rèn)為,雖然生成式 AI 是一項(xiàng)令人興奮的發(fā)展,但考慮其人力和環(huán)境成本至關(guān)重要,例如增加的能源消耗、碳排放以及侵蝕創(chuàng)意專業(yè)或利用人類生成內(nèi)容的風(fēng)險。

Meta 開源了它的動畫繪圖模型

Meta 開源了一個 AI 項(xiàng)目,可以將用戶的涂鴉轉(zhuǎn)化為動畫,使開發(fā)人員和藝術(shù)家能夠使用該技術(shù)。

歐洲隱私監(jiān)管機(jī)構(gòu)創(chuàng)建 ChatGPT 工作組

歐洲數(shù)據(jù)保護(hù)委員會將在周四的會議上討論人工智能政策,強(qiáng)調(diào)在歐盟解決數(shù)據(jù)隱私、道德問題和圍繞人工智能的監(jiān)管框架越來越重要。

Midjourney AI 指南 (Notion Page)

使用 Midjourney 的指南。

EditAnything (GitHub Repo)

一個旨在編輯和生成圖像中的任何內(nèi)容的項(xiàng)目,由 Segment Anything、ControlNet、BLIP2 和 Stable Diffusion 組成。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容