我們小時候經(jīng)常有幻想,未來不用再去上班了,在工廠工作的都是機(jī)器人。在家也不用打掃衛(wèi)生,機(jī)器人可以包攬一切。不知不覺間,我們小時候的幻想已經(jīng)慢慢變成現(xiàn)實(shí),工廠里有了多種型號的機(jī)械臂,代替了部分流水線功能。家里也有了掃地機(jī)器人,不用再一遍一遍地掃地了。
這些技術(shù)實(shí)現(xiàn)的背后都有 AI 的身影,2022 年 AI 行業(yè)更是熱鬧非凡。2022 年 9 月,由 Midjourney 創(chuàng)作生成的畫作《太空歌劇院》在科羅拉多州博覽會數(shù)字藝術(shù)創(chuàng)作類比賽中獲得一等獎,AI 繪畫進(jìn)一步破圈,受到大眾關(guān)注。

什么是生成式AI?
就在大家都認(rèn)為 AI 繪畫是 AI 發(fā)展的里程碑級應(yīng)用,可就在短短 2 個多月后,ChatGPT 橫空出世,到今年 1 月,平均每天約有 1300 萬獨(dú)立訪客使用 ChatGPT,累計(jì)用戶超 1 億,創(chuàng)下了互聯(lián)網(wǎng)最快破億應(yīng)用的紀(jì)錄。而 ChatGPT 的“智慧”也再一次刷新人們對 AI 的認(rèn)知。

無論是 AI 繪畫,還是現(xiàn)在風(fēng)靡全球的 ChatGPT,它們都屬于 AI 的一個分支——生成式AI(Generative AI)。生成式 AI 可以通過讓機(jī)器學(xué)習(xí)模型研究歷史數(shù)據(jù),并且利用先進(jìn)的深度學(xué)習(xí)技術(shù)來創(chuàng)造一個全新生成的作品,這作品可以是一段文字、一張圖片、一段音頻或者是一部影片。
相較于傳統(tǒng)的 AI 模型,生成式 AI 是一種特定類型的 AI,它專注于創(chuàng)建新內(nèi)容。
生成式AI的簡單原理
生成式 AI 的工作原理,是從大量數(shù)據(jù)中集中學(xué)習(xí),并使用這些知識產(chǎn)生與訓(xùn)練數(shù)據(jù)相似的新數(shù)據(jù)。這通常是使用一種生成模型的機(jī)器算法來完成的,生成式模型有許多不同類型,每一種類型都使用不同的方法生成新數(shù)據(jù)。其中常見的生成模型類型包括 GAN、VAE 和回歸模型。
聊這些模型之前,我們先簡單說下深度學(xué)習(xí)。深度學(xué)習(xí)其實(shí)是一種模仿人腦思維過程的方法,利用多層神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),通過組合低層特征形成更加抽象的高層表述屬性類別和特征,最后作出判斷。舉個例子,你要讓 AI 認(rèn)識一只貓,需要給它提供大量的樣本學(xué)習(xí),而 AI 在學(xué)習(xí)了大量的基礎(chǔ)之后,建立起一個模型,來判斷圖片中有沒有貓。要訓(xùn)練一個 AI 能夠順利實(shí)現(xiàn)對貓的識別,可能需要上百萬張,甚至上千萬張與貓相關(guān)的圖片。
如果沒有那么多的數(shù)據(jù)該怎么辦呢?大家可能有聽過這么個玩笑,程序員對 AI 說,“你已經(jīng)是個成熟的 AI 了,應(yīng)該自己生成數(shù)據(jù),自己訓(xùn)練自己了?!边@也就是我們前面提到過生成模型 GAN 的基本原理了。
GAN 的全稱為對抗生成網(wǎng)絡(luò),最早是由著名的深度學(xué)習(xí)理論專家伊恩·古德費(fèi)洛(IanJ.Goodfellow) 在 2014 年提出的。在原理上,生成式對抗網(wǎng)絡(luò)使用兩個神經(jīng)網(wǎng)絡(luò)相互對立,一個生成器和一個判別器。生成器或生成網(wǎng)絡(luò)是一個神經(jīng)網(wǎng)絡(luò),負(fù)責(zé)生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容。判別器或判別網(wǎng)絡(luò)是負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)之間的神經(jīng)網(wǎng)絡(luò)。這兩個神經(jīng)網(wǎng)絡(luò)都經(jīng)過交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。

古德費(fèi)洛打了一個形象的比方:GAN 就像是構(gòu)造了一個警察抓小偷的游戲。小偷不想被警察抓住,因此他需要不斷揣摩警察的行為,并據(jù)此來隱藏自己是小偷這個事實(shí)。而警察則想要抓住小偷,因此他就需要不斷學(xué)習(xí)小偷的偽裝辦法,并據(jù)此調(diào)整自己的抓捕策略。這樣,經(jīng)過不斷地“斗法”,小偷的偽裝技巧和警察的抓捕策略都可以得到大幅改善,并且這種迭代的速度會非常快。
當(dāng)然,GAN 只是其中一個生成模型。以 ChatGPT 為例,GAN 難以保證回答內(nèi)容的準(zhǔn)確性。要對回答內(nèi)容準(zhǔn)確性進(jìn)行驗(yàn)證,必須依靠人力。用戶在使用 ChatGPT 的同時,其實(shí)也充當(dāng)著免費(fèi) AI 訓(xùn)練師的角色,幫助 ChatGPT 成長。這也就為什么 OpenAI 會把 ChatGPT 放到網(wǎng)上讓用戶免費(fèi)使用的原因之一。
生成式AI未來趨勢
既然生成式 AI 這么強(qiáng)大,那么它會跟文章開頭一樣取代現(xiàn)有的一些崗位嗎?針對大眾普遍擔(dān)心的失業(yè)問題,ChatGPT 有分享一篇帖子寫到:“AI 不會取代你,一個使用 AI 的人可能會取代你?!?/p>

那生成式 AI 會在未來帶來什么呢?我們來簡單暢想下:
生成式 AI 可用于創(chuàng)造很多新內(nèi)容,例如音樂、文字或者圖像,為創(chuàng)意人員提供更多的想象力。例如,作者可以使用生成式 AI 創(chuàng)造的文章,對其進(jìn)行編輯和完善,可以讓自己更專注于需要想象力和創(chuàng)作的地方。這樣創(chuàng)造出來的作品可能更上一層樓。同樣,生成式 AI 可以將創(chuàng)作者的作品轉(zhuǎn)換成任意語言,讓創(chuàng)作者的作品一開始就在全球流行。
生成式 AI 也有可能會被應(yīng)用于未來的機(jī)器人。相比較現(xiàn)在的機(jī)器人,未來的機(jī)器人在好看的皮囊下,提供類似于ChatGPT 這樣的模型對話能力,能讓未來的機(jī)器人更加聰明、智慧,更像人,也更好地陪伴、服務(wù)于人類。
生成式 AI 也有可能被應(yīng)用于游戲,創(chuàng)建新關(guān)卡和地圖,生成新的對話或故事線,以及創(chuàng)建新的虛擬環(huán)境等?,F(xiàn)在已經(jīng)有利用生成式 AI 來生成紋理和天空盒藝術(shù)。在未來,游戲可能會使用生成式 AI 模型為玩家每次玩游戲時創(chuàng)建一個全新的獨(dú)特關(guān)卡,或者根據(jù)玩家的行動為 NPC 角色生成新的對話選項(xiàng)。它可以用來增加游戲體驗(yàn)的活力和多樣性,讓玩家感到更有吸引力和沉浸感。
現(xiàn)在生成式 AI 仍然非常早期,Midjourney 和 ChatGPT 讓我們看到了未來的無限可能,相信在幾十年后,生成式 AI 將深深融入我們的工作、創(chuàng)作和娛樂方式。雖然這在現(xiàn)在看起來仍然非常不可思議,但科技進(jìn)步的速度是驚人的,上面這些遙不可及的暢想,可能用不了多少時間,就能變得觸手可及。