GPT-2,嚇壞創(chuàng)造者的「深度造假寫手」

簡評: 今年二月份刷屏的 GPT-2 著實厲害,那個生成續(xù)寫故事的例子更是效果好到嚇人一跳,它到底有多厲害,本文略微講講。更詳細(xì)的信息可參考文末 OpenAI 的博客鏈接。

你能從下面這兩段文字里品味出什么區(qū)別?

「四月間,天氣寒冷晴朗,鐘敲了十三下?!?/em>
「我坐在小汽車?yán)?,前往西雅圖開始一份新工作。給車加油,插入鑰匙,讓它自己開。我沉入冥思,想象這會是怎樣的一天?!?/em>

第一段文字,是英國著名作家喬治·奧維爾(George Orwell)的傳世經(jīng)典,政治荒誕諷刺小說《1984》開篇第一句話。

第二段文字,則是將第一段文字輸入 GPT-2 程序后,這個 AI 系統(tǒng)的自動續(xù)寫。

僅僅輸入這么簡單的一句話,GPT-2 顯然就精確的抓住了喬治·奧維爾《1984》的荒誕、壓抑、恐懼和反烏托邦的筆調(diào),洋洋灑灑的續(xù)寫起來:

一百年后,2045 年, 我在中國一個貧窮農(nóng)村地區(qū)的一所中學(xué)教書。我先開始教的是中國歷史和中國科技史......

英國著名作家喬治·奧維爾(George Orwell)

▎「深度造假」

GPT-2 人工智能文字編寫程序可以寫小說、新聞、發(fā)言稿,還可以發(fā)短信推文。

程序開發(fā)者給它起了個綽號 —— 深度造假文字(deepfakes for text),精確地概括了它的功能。簡而言之,GPT-2 就是一個文字發(fā)生器。你可以文字輸入這個 AI 系統(tǒng),只言片語或者大段文字都行,之后程序會根據(jù)自己的判斷,決定接下來應(yīng)該如何寫作。

它產(chǎn)生的文字,從質(zhì)量到數(shù)量到適應(yīng)范圍,都遠(yuǎn)遠(yuǎn)超出了設(shè)計者的預(yù)期。

它的「造假能力」如此令人信服,以至于其所屬公司 Open AI 做出了一個不同尋常的決定:暫不公開 GPT-2 的技術(shù)信息,以免該技術(shù)被惡意使用。

▎以假亂真

與其它類似功能的程序相比,GPT-2 幾乎不露馬腳,比如寫著寫著忘了在寫什么,或夾雜一些莫名其妙的詞匯等。

英國《衛(wèi)報》記者把英國脫歐的一些標(biāo)題詞匯輸入 GPT-2,它寫出了這樣的一段「新聞稿」:

當(dāng)被要求對有關(guān)報道做出澄清時,梅首相的發(fā)言人說:“首相已經(jīng)明確表明,她要做的是盡快完成脫歐,這在上周的女王年度施政講話中有明確授權(quán)?!?/p>

OpenAI 的研究負(fù)責(zé)人阿莫迪(Dario Amodei)對《衛(wèi)報》說,GPT-2 從兩個方面具有革命性的突破 —— 一是它的數(shù)據(jù)儲藏能力巨大,是現(xiàn)有最前沿的 AI 文字發(fā)生器數(shù)據(jù)儲量的 12 倍。這使得它能更好地理解掌握寫作文風(fēng),筆法和意圖。這也導(dǎo)致了它的第二個突破,即它的寫作質(zhì)量和應(yīng)用的廣泛性。

而也正是它生產(chǎn)出的文字達(dá)到了真假難辨的程度,也促使 OpenAI 公司決定暫時不公開 GPT-2 的技術(shù)。他們下一步將測試使用 GPT-2 可能出現(xiàn)的任何結(jié)果,以及如何防止惡意使用。

公司表示,使用 AI 技術(shù)的道德原則是一個全新的領(lǐng)域,他們還在探索之中。


博客鏈接:Better Language Models and Their Implications
推薦閱讀:數(shù)字游戲:藝術(shù)家如何用大數(shù)據(jù)展現(xiàn)藝術(shù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容