就在幾天前,那個(gè)開發(fā)p圖應(yīng)用photoshop的adobe公司,更新了一波新品。
還發(fā)布了首個(gè)基于深度學(xué)習(xí)的平臺(tái)——
「Adobe Sensei」
(簡單來說,這就是ai,sensei 利用了 adobe 長期積累的大量數(shù)據(jù)和內(nèi)容,從圖片到影像,能夠幫助我們解決很多問題,將重復(fù)勞動(dòng)變得自動(dòng)化)
這樣你就可以在幾分鐘內(nèi)調(diào)好一個(gè)表情 ? Sensei 可以進(jìn)行臉部自動(dòng)編輯
(它可以在照片里自動(dòng)查找到人臉以及人臉的各個(gè)部分,包括眉毛、嘴唇和眼睛,并且學(xué)習(xí)這些部位的位置,來讓設(shè)計(jì)師們調(diào)整照片上人的表情,而不會(huì)看起來不自然或者怪異)
不過,這次真正能把我點(diǎn)燃的黑科技,是它——Project VOCO
它的厲害之處。。
可以根據(jù)一個(gè)人說話的錄音,合成幾乎以假亂真的任意錄音。
首先,讓voco——
學(xué)會(huì)你的話
你丟一段大概20分鐘你的音頻讓它學(xué)。
模仿你說話
比如這句:And ur I kissed my dogs and my wife.
加新詞和換位
你在這句中,不管調(diào)換詞的位置、添加新詞,音效完全聽不出來有任何差異,幾乎接近于完美模仿原發(fā)音者。
把 wife 換成 jordan
把 my dogs 換成 thre times
這簡直就是音頻編輯領(lǐng)域里的“Photoshop”。
呃,那么這樣一來。。。真的就實(shí)現(xiàn)了“把話強(qiáng)加到別人身上了”。。。
看來柯南的變聲器差不多可以出貨了~
音頻技術(shù)能如此,那么問題就來了——
既然聲音能以假亂真,那么視頻可以無中生有么?
早在半年前,其實(shí)就已經(jīng)實(shí)現(xiàn)了。
而且效果達(dá)到了可怕的真人秀級(jí)別。。。
可以這么說——
這軟件一出,視頻即將淪陷。
注意!下面你看到的——都是假的!
這是一項(xiàng)叫「Face2Face」的技術(shù)——
能實(shí)現(xiàn)實(shí)時(shí)面部重演(Real-time Facial Reenactment)。
它可以實(shí)時(shí)捕捉使用者的表情,然后替換已有視頻中人物的表情。
把一個(gè)人的臉部RGB影像,通過算法,進(jìn)行采集。
然后與另一個(gè)人的RGB數(shù)值進(jìn)行比對(duì),測算臉部五官結(jié)構(gòu)。
最后就可以將主角的表情和口型無縫替換。
這樣就能讓他做從未做過的表情。
而你,只需要一個(gè)普通攝像頭就能實(shí)現(xiàn)。。。
甚至——
可以在家?guī)蛫W巴馬在白宮開個(gè)告別演說。
還是那句話——
你的思想有多遠(yuǎn),你就可以有多變態(tài)!
你們有沒有察覺這里面有個(gè)特別不對(duì)勁的地方。。。如果我們把voco和face2face這兩個(gè)技術(shù)合起來的話。。。
你還是你嗎?