現(xiàn)在在網(wǎng)上做一些事情真是太容易了,這就是后真相時(shí)代的生活。但是最近機(jī)器學(xué)習(xí)(ML)和人工智能(AI)的進(jìn)步使這個(gè)問(wèn)題以指數(shù)方式復(fù)雜化了。問(wèn)題已經(jīng)不再是假新聞那么簡(jiǎn)單了,而是各種媒體和消費(fèi)品現(xiàn)在都可以通過(guò)人工智能來(lái)仿制。從音頻、視頻剪輯到金融交易和假冒產(chǎn)品——甚至你自己的筆跡也能以驚人的準(zhǔn)確度被模仿。那么我們是否能夠利用制造這些假貨的的計(jì)算機(jī)系統(tǒng)來(lái)輕易揭示它們呢?
人們一直以來(lái)都在不斷地欺騙,人類歷史上充斥著虛假的先知、煽動(dòng)者、蛇油小販、小偷和騙子。問(wèn)題在于,如今任何帶有陰謀論和補(bǔ)充品牌的“二小販子”都能登上YouTube,并迅速吸引全球觀眾。雖然“事實(shí)”的定義取決于你和誰(shuí)說(shuō)話,但大多數(shù)人在今年1月20日前贊同的一件事是確鑿證據(jù)的真實(shí)性。長(zhǎng)期以來(lái),視頻和音頻記錄一直被認(rèn)為是可靠的證據(jù)來(lái)源,但是由于人工智能的最新進(jìn)展,這種情況正在改變。
2016年7月,華盛頓大學(xué)的研究人員開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)系統(tǒng),該系統(tǒng)不僅能準(zhǔn)確地合成一個(gè)人的聲音和說(shuō)話習(xí)慣,而且還能將他們的話語(yǔ)同步到視頻上?;旧?,你可以偽造任何人的聲音并制作一個(gè)視頻,讓其說(shuō)出任何你想要說(shuō)的話。以該團(tuán)隊(duì)的演示視頻為例,他們使用奧巴馬總統(tǒng)時(shí)每周講話的錄像來(lái)訓(xùn)練ML系統(tǒng)。這個(gè)遞歸神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)了把不同的聲音特征和它們各自的嘴形聯(lián)系起來(lái)。從那之后,該團(tuán)隊(duì)制作了CGI的嘴部動(dòng)作,在3D姿勢(shì)匹配的幫助下,將動(dòng)畫(huà)嘴唇移到總統(tǒng)的另一段視頻上?;旧?,只使用相關(guān)的音軌,他們就能生成一個(gè)逼真的視頻。
雖然該團(tuán)隊(duì)對(duì)這種技術(shù)的潛在濫用進(jìn)行了大量的反擊,但在團(tuán)隊(duì)眼里該技術(shù)卻有著更為普遍的用途?!皬囊纛l中生成高質(zhì)量視頻的能力可以大大減少視頻編碼/傳輸所需的帶寬(這在當(dāng)前的互聯(lián)網(wǎng)帶寬中占很大比例)”他們?cè)谘芯恐刑岬健?b>合成奧巴馬視頻的例子說(shuō)明了一個(gè)好處:從音頻中學(xué)習(xí)唇音。“對(duì)于有聽(tīng)力障礙的人來(lái)說(shuō),視頻合成可以通過(guò)電話音頻來(lái)進(jìn)行唇讀。數(shù)字人類是娛樂(lè)應(yīng)用的核心,比如電影特效和游戲?!?/p>
事實(shí)上,華盛頓大學(xué)并不是唯一一個(gè)研究這種技術(shù)的機(jī)構(gòu)。去年,斯坦福大學(xué)的一個(gè)團(tuán)隊(duì)首次推出了Face2Face系統(tǒng)。與前者可以從音頻生成視頻的技術(shù)不同,F(xiàn)ace2Face從其他視頻中生成視頻。它使用一個(gè)普通的網(wǎng)絡(luò)攝像頭來(lái)捕捉用戶的臉部表情和嘴巴形狀,然后使用這些信息改變YouTube的視頻,以最好地匹配用戶的表情和講話——所有這一切都是實(shí)時(shí)的。
以音頻為基礎(chǔ)的音頻視頻轉(zhuǎn)錄是雙向的。就在華盛頓大學(xué)的系統(tǒng)設(shè)法從音頻流中生成視頻的時(shí)候,麻省理工學(xué)院CSAIL團(tuán)隊(duì)想出了如何從無(wú)聲視頻短片中創(chuàng)建音頻。而且效果顯著,足以愚弄人類觀眾。
“當(dāng)你用手指劃過(guò)葡萄酒杯時(shí),它發(fā)出的聲音就能反映出里面有多少液體,”該論文的主要作者Andrew Owens在接受麻省理工學(xué)院的采訪時(shí)表示。“模擬這種聲音的算法可以揭示關(guān)于物體形狀和材料類型的關(guān)鍵信息,以及它們與世界相互作用的力量和運(yùn)動(dòng)。”
麻省理工學(xué)院的深度學(xué)習(xí)系統(tǒng)經(jīng)過(guò)了幾個(gè)月的訓(xùn)練,使用了1000個(gè)視頻,其中包含了46000個(gè)聲音,這些聲音來(lái)自不同的物體被戳、擊打或用鼓槌進(jìn)行刮擦。與華盛頓大學(xué)算法一樣,麻省理工學(xué)院也學(xué)會(huì)了將不同的音頻屬性與特定的屏幕動(dòng)作關(guān)聯(lián)起來(lái),并在視頻播放時(shí)合成這些聲音。當(dāng)用真實(shí)聲音進(jìn)行在線測(cè)試時(shí),人們實(shí)際上選擇假音頻的次數(shù)是真音頻次數(shù)的兩倍。
麻省理工學(xué)院的團(tuán)隊(duì)認(rèn)為,他們可以利用這一技術(shù)來(lái)幫助機(jī)器人更好地感知環(huán)境。“機(jī)器人看到人行道,可以本能地知道水泥是硬的,草地是軟的,所以知道如果踩到其中任何一個(gè)會(huì)發(fā)生什么事情?!?Owens說(shuō),“能夠預(yù)測(cè)聲音,是能夠預(yù)測(cè)機(jī)器人與世界物理互動(dòng)產(chǎn)生怎樣后果的重要第一步?!?/p>
當(dāng)然了,音頻合成的研究不僅僅限于大學(xué), 一些大公司也在研究這項(xiàng)技術(shù)。例如谷歌開(kāi)發(fā)了Wavenet,這是一種“原始音頻波形的深度生成模型”。在計(jì)算機(jī)生成的文本到語(yǔ)音(TTS)系統(tǒng)的第一個(gè)迭代中,是“連接的”TTS。這是一個(gè)記錄各種各樣的語(yǔ)音片段的地方,這些片段被輸入到數(shù)據(jù)庫(kù)中,然后通過(guò)計(jì)算機(jī)進(jìn)行重建以形成單詞和句子。問(wèn)題是,輸出聽(tīng)起來(lái)更像電影里的某個(gè)人,而不是真實(shí)的人。
另一方面,波形被訓(xùn)練成人們說(shuō)話的波形。然后該系統(tǒng)進(jìn)行采樣,系統(tǒng)采樣數(shù)據(jù)點(diǎn)的記錄每秒高達(dá)16000次。為了輸出聲音,基于之前發(fā)出的聲音波形使用了一個(gè)模型來(lái)預(yù)測(cè)下一個(gè)聲音。這一過(guò)程成本非常昂貴,但與傳統(tǒng)的TTS方法相比,它的音頻質(zhì)量更高。
將來(lái),如果這種基于人工智能的手寫(xiě)筆跡在倫敦大學(xué)學(xué)院被開(kāi)發(fā)出來(lái)后被濫用,機(jī)器人可能會(huì)在官方文件中偽造你的簽名。這個(gè)系統(tǒng)被稱為“My Text in Your Handwriting”程序,只需一個(gè)段落的輸入,它就可以精確地重現(xiàn)一個(gè)實(shí)驗(yàn)對(duì)象的筆跡。該程序基于“字形”,本質(zhì)上是每個(gè)筆跡的獨(dú)特特征。通過(guò)測(cè)量文字水平距和垂直間距、字母和書(shū)寫(xiě)紋理之間的連接等各個(gè)方面,程序可以很容易地復(fù)制樣式。
“我們的軟件有很多有價(jià)值的應(yīng)用。例如,中風(fēng)受害者能夠編寫(xiě)信件,無(wú)需擔(dān)心寫(xiě)的不清楚。或者送鮮花作為禮物的人,甚至可以在不去花店的情況下寫(xiě)一封手寫(xiě)的信?!眰惗卮髮W(xué)大學(xué)學(xué)院的計(jì)算機(jī)科學(xué)和這項(xiàng)研究的主要作者Tom Haines博士說(shuō)。“改程序也可以用在漫畫(huà)書(shū)中,書(shū)中一段手寫(xiě)的文字可以被翻譯成不同的語(yǔ)言,而不會(huì)有損作者的原創(chuàng)風(fēng)格?!?/p>
雖然這項(xiàng)技術(shù)可以用來(lái)制造贗品,但也可以很容易地利用這些技術(shù)來(lái)發(fā)現(xiàn)贗品。“偽造和法醫(yī)筆跡分析幾乎完全是手工過(guò)程?!?倫敦大學(xué)大學(xué)學(xué)院計(jì)算機(jī)科學(xué)部門的Gabriel Brostow博士說(shuō),“但是,通過(guò)把書(shū)寫(xiě)的新方法看作是文本合成,我們就可以使用我們的軟件來(lái)刻畫(huà)手寫(xiě)的特征,以量化偽造的可能性?!?/p>
偽造和偽造產(chǎn)品不會(huì)只停留在互聯(lián)網(wǎng)的邊界。經(jīng)濟(jì)合作與發(fā)展組織最近的估計(jì)數(shù)字顯示,全球假冒商品市場(chǎng)每年約為4600億美元。這就是Entrupy認(rèn)證系統(tǒng)的用武之地。(Enter Entrupy是紐約奢侈品認(rèn)證服務(wù)商)
“在理想的世界里,我們不應(yīng)該存在,”Entrupy首席執(zhí)行官Vidyuth Srinivasan感嘆道?!拔覀?cè)侥茉谑袌?chǎng)上建立信譽(yù),就越能讓商業(yè)變得更美好?!?/p>
該公司首先拍攝了各種各樣的奢侈品,并使用該數(shù)據(jù)庫(kù)幫助其客戶(通常是二手服裝商店或eBay賣家等二級(jí)零售市場(chǎng)的客戶)以大約98.5%的準(zhǔn)確率驗(yàn)證產(chǎn)品。顧客會(huì)收到一個(gè)手持顯微鏡,并對(duì)產(chǎn)品的外觀、商標(biāo)或內(nèi)襯等進(jìn)行各種圖像的拍攝。然后,這些照片輸入到移動(dòng)應(yīng)用程序中,并傳輸?shù)焦镜姆?wù)器上。在服務(wù)器上分類算法開(kāi)始工作,區(qū)分合法商品和假冒商品。如果產(chǎn)品是真實(shí)的,Entrupy將提供真實(shí)性證書(shū)給客戶。
盡管該公司的產(chǎn)品數(shù)據(jù)庫(kù)豐富多樣,但系統(tǒng)的當(dāng)前功能還是有限制的。像光學(xué)、反光或透明的物品判斷效果就不太理想,它們沒(méi)有表面的紋理,而有些東西就不適用該程序,包括瓷器、鉆石和玻璃、純塑料和裸金屬。
與討論的其他基于人工智能的系統(tǒng)不同, Entrupy系統(tǒng)被破壞或被玩弄的可能性很小。Srinivasan解釋說(shuō):“我們?cè)M造假者假裝成顧客和合法的企業(yè)來(lái)試圖購(gòu)買這個(gè)系統(tǒng),結(jié)果也沒(méi)問(wèn)題?!边@是因?yàn)橄到y(tǒng)并沒(méi)有告訴用戶他們所拍攝的圖片實(shí)際上是用來(lái)驗(yàn)證產(chǎn)品真實(shí)性的?!拔覀円罂蛻魧?duì)產(chǎn)品的不同部分進(jìn)行圖像處理,因?yàn)檫@不僅僅是用于驗(yàn)證的純材料?!彼^續(xù)說(shuō)?!斑@是對(duì)物品不同方面的整體看法——從工藝到服裝的材質(zhì)。”以及其他許多元數(shù)據(jù)的相關(guān)內(nèi)容。
此外,該系統(tǒng)還在不斷地更新新數(shù)據(jù)。一方面來(lái)源于該公司,他們假扮成秘密買家來(lái)購(gòu)買假冒商品,另一方面則來(lái)源于真正的用戶。在認(rèn)證過(guò)程中拍攝的圖像——無(wú)論是真實(shí)還是不真實(shí)——都被納入公司的數(shù)據(jù)庫(kù)中,進(jìn)一步提高了系統(tǒng)的準(zhǔn)確性。
“在不久的將來(lái),我認(rèn)為人工智能和機(jī)器學(xué)習(xí)將成為一個(gè)對(duì)抗偽造的解決方案,肯定會(huì)提高偽造這個(gè)門檻,”他總結(jié)道。“這是一種間諜與間諜的游戲,貓與老鼠的游戲?!?/p>
提高我們辨別假貨的能力將迫使造假者提高他們的“游戲水平”,用更好的質(zhì)量材料和更好的工藝。然而,這將增加這些產(chǎn)品的生產(chǎn)成本。
“任何偽造者的MO都是制造一些他們可以賣得很多的東西,這些東西可以很容易地生產(chǎn)出來(lái),而且不會(huì)花費(fèi)太多的成本”Srinivasan sid說(shuō),“否則就沒(méi)有利潤(rùn)。”
Paypal是互聯(lián)網(wǎng)頂級(jí)金融服務(wù)提供商之一,對(duì)賬戶欺詐案件采取了類似的措施。Paypal公司全球風(fēng)險(xiǎn)科學(xué)高級(jí)總監(jiān)王輝(Hui Wang)告訴Engadget:“假設(shè)我的帳號(hào)今天在舊金山被訪問(wèn),明天又在紐約被訪問(wèn),后續(xù)還顯示有其他IP地址,”這種狀況就表明了存在某種類型的帳戶接管。“為了檢測(cè)這些欺詐行為”她解釋道,“我們追蹤了我們跟蹤機(jī)器的IP,并跟蹤了網(wǎng)絡(luò)?!?/p>
該公司創(chuàng)建了一種算法,可以查看IP的IP地址和地理位置信息,然后將其與你的賬戶歷史記錄進(jìn)行比較,以查看這與以前的操作是否匹配。Paypal開(kāi)發(fā)了一種專有技術(shù),將這一IP位置與其他用戶進(jìn)行比較,看看人們?cè)诠ぷ髦惺欠駥?duì)該算法有更大的影響,或者對(duì)IP變化有合理的解釋——例如:也許你正在紐約出差,然后在機(jī)場(chǎng)禮品店買一件紀(jì)念品,然后繼續(xù)旅行。
Paypal公司的AI系統(tǒng)還試圖識(shí)別之前的每一個(gè)IP,無(wú)論是酒店的安全以太網(wǎng)連接還是機(jī)場(chǎng)的公共WiFi。Wang說(shuō):“算法從你的帳戶歷史記錄中檢索大量數(shù)據(jù),然后查看你網(wǎng)絡(luò)上的流量,就像其他人使用相同的IP一樣。”從這些原始信息中,該算法選擇特定的數(shù)據(jù)點(diǎn),并使用這些數(shù)據(jù)點(diǎn)來(lái)估計(jì)交易是否合法。
大多數(shù)這些行為及其隨后的決定——例如驗(yàn)證或拒絕支付——都是自動(dòng)執(zhí)行的。但是,如果該算法的信任值過(guò)低,操作中心的人工調(diào)查人員將手動(dòng)對(duì)該事務(wù)進(jìn)行調(diào)查。
她繼續(xù)說(shuō)道:“我們也正在確保將人工智能反饋到自動(dòng)化系統(tǒng)中,以便機(jī)器學(xué)習(xí)系統(tǒng)不斷學(xué)習(xí),改進(jìn)和提高準(zhǔn)確性?!?/p>
這些系統(tǒng),包括那些設(shè)計(jì)用于生產(chǎn)假貨的系統(tǒng),還有那些揭發(fā)假貨的系統(tǒng),目前還處于起步階段。但是在未來(lái)的幾十年里,人工智能和機(jī)器學(xué)習(xí)技術(shù)將會(huì)以我們想象不到方式繼續(xù)改進(jìn)。同時(shí),在技術(shù)上有一個(gè)非常真實(shí)的危險(xiǎn),他們也可以制造出更多的難以置信的謊言、惡作劇和假冒產(chǎn)品—— 在我們眼前。
但是,就像之前的活字印刷術(shù)、無(wú)線電和互聯(lián)網(wǎng)一樣。像這樣能夠生成真實(shí)感內(nèi)容的人工智能系統(tǒng),只會(huì)和使用它的人的意圖一樣危險(xiǎn)。這是一個(gè)可怕的想法。
作者:Andrew Tarantola
原創(chuàng)編譯:梓色揚(yáng)光
原文鏈接:https://www.engadget.com/2017/11/10/counterfeit-ai-machine-learning-forgery/
“本譯文僅供個(gè)人研習(xí)、欣賞語(yǔ)言之用,不歡迎任何轉(zhuǎn)載及用于任何商業(yè)用途。如需轉(zhuǎn)載請(qǐng)注明作者和來(lái)源。(本譯文所涉法律后果均由本人承擔(dān)。本人同意簡(jiǎn)書(shū)平臺(tái)在接獲有關(guān)著作權(quán)人的通知后,刪除文章?!保?/i>