“薩曼莎”距離我們還有多遠(yuǎn)? —— 向機(jī)器人的情感化邁進(jìn)


在2013年引起廣泛熱議的電影《Her》中,人工智能系統(tǒng)“薩曼莎”能與人類交流、理解人類并讀懂人類情緒,這種“近人類”、理解人類情感的機(jī)器人讓我們對未來充滿了無限遐想……


“薩曼莎”何時(shí)才能出現(xiàn)

在電影《Her》中,“薩曼莎”是一個(gè)能聽從你、理解你、懂得你,還擁有自主思想的一個(gè)對話系統(tǒng)。影片以主人公因收到妻子離婚協(xié)議還陷入在對過去的回憶中的不舍為開端,當(dāng)“薩曼莎”的出現(xiàn)讓主人公的心態(tài)有了很大的轉(zhuǎn)變。后來的他們互相了解和陪伴雙雙的產(chǎn)生了對彼此的愛意。

對于人們來說帶有情感理解的人工智能機(jī)器人似乎看似遙遠(yuǎn),但總是出現(xiàn)在我們生活的各個(gè)文化作品中。在我們對未來幻想的畫面中,人工智能不僅能幫助我們完成生活中的各種體力勞動(dòng)、服務(wù)于我們,還能感受人的情感并與之產(chǎn)生共鳴。被賦予情感和情緒理解的機(jī)器人可以像我們的家人一樣在你遇到困難的時(shí)候關(guān)懷你開導(dǎo)你,可以像親密無間的朋友一樣歡聲笑語無話不談,或者還可以像“薩曼莎”那樣產(chǎn)生愛的幻想。

人類社會(huì)究竟何時(shí)才能進(jìn)步到可以制造出能理解人類情感的機(jī)器人,我們不得而知,但無疑研究者們正為此努力克服一個(gè)又一個(gè)技術(shù)難題。不難理解的是,要想真正地將人類的能力復(fù)制到機(jī)器人身上,弄明白人類之間究竟是通過何種方式理解對方情感的一定會(huì)具有重大意義,而我們也就先從這一點(diǎn)上來展開。


人類之間的情緒表現(xiàn)及傳遞

情緒既是主觀感受,又是客觀生理反應(yīng),具有目的性,也是一種社交表達(dá)。

人們的這些情緒化表現(xiàn)其實(shí)都是在受到一定刺激后產(chǎn)生的,無論是外在的直接影響還是內(nèi)在的潛意識,都會(huì)影響著我們。這使得我們的各種生理表現(xiàn)也會(huì)有所反應(yīng),如心跳加速、汗液增多、面部表情、動(dòng)作幅度和音調(diào)高低等等。

首先,觀察表情。在大多數(shù)時(shí)候當(dāng)人們心情不好時(shí)并不會(huì)說很多話,但是神情形態(tài)是不會(huì)說謊的,面部表情和身姿形態(tài)會(huì)不自覺的流露出特定的表現(xiàn)。難過的時(shí)候,人會(huì)流淚;開心的時(shí)候,嘴角會(huì)上揚(yáng);驚訝的時(shí)候,你會(huì)“目瞪口呆”……無疑,通過肉眼對其他人的面部表情觀察是一種人類之間非常重要的感受相互情感的途徑。

其次,人與人之間在交談時(shí),彼此從聽覺的角度感受對方說話時(shí)的語氣和語調(diào)也是一種重要的方式。例如生氣時(shí)人們往往會(huì)提高說話分貝,同時(shí)語速變快;而反之,害羞時(shí)不但音量會(huì)比正常說話時(shí)低,同時(shí)語速也會(huì)變慢。當(dāng)雙方在交談時(shí),作為聆聽者的一方從話語間聽出另一方對某件事的不滿,這時(shí)作為聆聽者可以積極地引導(dǎo)和給出意見性的幫助,以讓對方快速走出不滿的心境。這就是通過聆聽說話內(nèi)容并感受語氣來實(shí)現(xiàn)的情緒識別。

此外,不通過當(dāng)面交流就無法得知對方情緒了嗎?并不是這樣,在社交網(wǎng)絡(luò)被人們當(dāng)做生活必需品的時(shí)代,我們是否能基于社交網(wǎng)絡(luò)去了解對方的情緒理解呢,人們通過社交軟件交流、瀏覽對方社交賬號等線上活動(dòng)能從另一面了解到對方最近的個(gè)人狀態(tài),感知對方在聊天中所使用的的詞句,這種側(cè)面的,從對方泄露出的“內(nèi)容”出發(fā),進(jìn)行判斷所得到的情感信息同樣能幫助我們了解對方的情感狀況,能幫助我們在之后與對方的交流中有效地避開對方不喜歡的話題,以及調(diào)整適當(dāng)?shù)南嗵幏绞剑@便是一種基于了解生活狀態(tài)進(jìn)行聯(lián)想而實(shí)現(xiàn)的情感識別。

可以說人類是情感豐富的動(dòng)物,情感表達(dá)和情緒變化是多種多樣的,人與人之間通過相互的眼神交流、面部表情、肢體動(dòng)作、語氣語調(diào)、言行舉止來傳遞情感和情緒表達(dá)。正如上所述,開心時(shí)手舞足蹈笑容盈盈;與人發(fā)生沖突或矛盾時(shí),語氣囂張神態(tài)激昂揮拳踢腳;分別和離開讓心情低落抑郁不振失魂落魄……可以說人類獲取對方情感信息的手段也是多種多樣的。


智能情緒理解的現(xiàn)狀

說到機(jī)算計(jì)情緒識別,其實(shí)在人工智能領(lǐng)域已經(jīng)發(fā)展了很多年。正如我們所述,如果我們想與機(jī)器人進(jìn)行互動(dòng)或者是舒適地生活在一起,機(jī)器理解人類的情緒并適當(dāng)?shù)貙@些情緒做出反應(yīng)是最為關(guān)鍵的因素。

不出所料的是,對人與人之間情感傳遞的研究確確實(shí)實(shí)為人工智能的情緒化發(fā)展提供了巨大的價(jià)值的,以至于能讓機(jī)器像我們?nèi)艘粯印澳芸吹?、能聽見和能理解”?/p>

“能看到”——面部識別

看,廣義上被稱為計(jì)算機(jī)視覺,計(jì)算機(jī)視覺是用各種成象系統(tǒng)代替視覺器官作為讀取手段,用機(jī)器來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的研究目標(biāo)就是使計(jì)算機(jī)能像人眼一樣的視覺觀察和理解世界,且具有自主適應(yīng)環(huán)境的能力。

在過去的幾十年里,科學(xué)家們已經(jīng)打造出了與人眼相匹配甚至在某種程度上超越人眼視覺的傳感器和圖像處理器。

技術(shù)的突破尤為重要,但是機(jī)器視覺系統(tǒng)的處理技術(shù)還要依賴于對圖像的處理方法。它包括圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、與理解等內(nèi)容。經(jīng)過這些方法處理,對圖片質(zhì)量做相當(dāng)程度的效果改善以便于計(jì)算機(jī)對圖像進(jìn)行分析、處理和識別。

雖然科學(xué)家們打造出了超越人眼的傳感器和圖像處理器,但是在對人臉識別的技術(shù)上看,特別是對動(dòng)態(tài)人臉識別上還存在很多的技術(shù)不足。

動(dòng)態(tài)人臉表情豐富、變化和移動(dòng)速度快并且不固定,人們在觀察事物和受到刺激時(shí)臉部做出的表情變化大到夸張小到細(xì)微,而這些細(xì)微的表情,才能真正地反應(yīng)出人的隱含情緒。

由于人臉表情變換的高頻次,使得機(jī)器無法快速精確地人臉跟蹤。而計(jì)算機(jī)要想做到精確識別面部細(xì)微肌肉變化,是需要通過大量的表情數(shù)據(jù)集、面部微動(dòng)作和眼球運(yùn)動(dòng)數(shù)據(jù)集積累訓(xùn)練才能做到精準(zhǔn)的識別。

然而以現(xiàn)在的技術(shù)來看,由于面部情緒識別還需要大量的數(shù)據(jù)集訓(xùn)練和快速的人臉表情捕捉技術(shù)才能真正有效地實(shí)現(xiàn),這也是導(dǎo)致面部識別在對人臉情緒識別的技術(shù)上一致未達(dá)到的關(guān)鍵點(diǎn)。但是在未來這將是一個(gè)指日可待的過程。

“能聽見”——語音識別

與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢寐以求的事情。讓機(jī)器聽明白我們說的內(nèi)容,就像機(jī)器有了聽覺系統(tǒng)。

在會(huì)話場景中,當(dāng)說話人處于某種情緒,如憤怒時(shí)音調(diào)會(huì)變高、說話速率會(huì)變快,這種明顯的變化在聲音特征中被稱為韻律。從聲學(xué)分析出發(fā),時(shí)長、幅度、基頻和頻譜等語音特征是一種可測量的物理量。而目前針對情緒的研究,就主要集中在基頻、強(qiáng)度、時(shí)長、特征等方法上。

雖然能通過韻律和物理量分析情緒,但情緒識別對于聲音和周圍環(huán)境的要求十分苛刻,這讓情緒分析在語音識別上的難度也就不斷加大。由于噪音、方言口音、發(fā)音習(xí)慣、多人說話、身體狀況等因素再加上現(xiàn)有設(shè)備、技術(shù)的不成熟和難準(zhǔn)確分辨等問題,導(dǎo)致了現(xiàn)在語音情緒分析的進(jìn)展緩慢。

但值得一提的是,基于情緒識別的語音庫規(guī)模正在不斷地?cái)U(kuò)充,并且目前國內(nèi)的技術(shù)水平已經(jīng)基本上與國外同步。并且有著自己特點(diǎn)與優(yōu)勢的漢語語音識別技術(shù),也同樣達(dá)到了國際先進(jìn)水平。在這種好的趨勢下,我們?nèi)孕枰3忠活w堅(jiān)持不懈的信心。

“能理解”——文本識別

比爾·蓋茨曾說過,“語言理解是人工智能皇冠上的明珠”。自機(jī)器誕生,就開始有了對人工智能的研究,而人工智能最早的研究方向之一就是自然語言處理。自然語言處理是研究人與計(jì)算機(jī)在交際中的語言問題,也就是讓計(jì)算機(jī)能夠理解、處理和運(yùn)用人類語言(如中文、英文等)。

自然語言處理是人工智能研究領(lǐng)域的重要課題之一,也是目前最前沿的科技研究熱點(diǎn)之一。這里我們重點(diǎn)研究的就是其中和文本分析相關(guān)的技術(shù):中文自動(dòng)分類、詞性標(biāo)注、文本分類、機(jī)器翻譯等等,當(dāng)然也包含基于文本的情緒分析技術(shù)。

文本情緒分析是基于自然語言處理、文本挖掘以及計(jì)算機(jī)語言學(xué)等方法來識別和提取原內(nèi)容中的主觀信息。一般而言,情緒的表達(dá)分為顯性和隱性。顯性情緒表達(dá)是直觀的, 主要呈現(xiàn)在語言形式上,而隱性情緒表達(dá)則是暗藏的, 它存在于語言表述的深層涵義中, 有時(shí)是說話者不經(jīng)意地 “言不由衷” 表述下掩蓋的真實(shí)情緒,在不同的語境中所體現(xiàn)的語義是不同的.。而要想獲取這樣的隱含信息,不得不利用機(jī)器學(xué)習(xí)方法以及大量標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練,好在當(dāng)下高速發(fā)展的神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí)技術(shù)已漸漸地讓精準(zhǔn)的情緒識別成為了可能。

相比于語音識別和面部識別,基于文本的情緒識別雖然對數(shù)據(jù)源有著特殊的要求,然而其同樣可以基于當(dāng)下最前沿的機(jī)器學(xué)習(xí)方法來實(shí)現(xiàn)。同時(shí),文本識別的數(shù)據(jù)形式相對來說更容易被機(jī)器所“學(xué)習(xí)”,它既不會(huì)隨著時(shí)間高速更新迭代(雖然也因此缺少了實(shí)時(shí)性,但增加了準(zhǔn)確率),同時(shí)也不受噪音、口音等因素的影響,所以文本情緒識別在目前的技術(shù)研究上避開了很多不必要的困擾。


現(xiàn)實(shí)中的情緒識別技術(shù)的應(yīng)用

不得不承認(rèn)的是,距離人工智能情緒識別及生成技術(shù)成熟到能夠支持如“薩曼莎”的樣的機(jī)器人誕生來說,我們?nèi)匀挥泻荛L的路要走,但科學(xué)技術(shù)的進(jìn)步亦然讓我們體驗(yàn)到了一個(gè)又一個(gè)驚喜。接下來我們就來聊聊目前智能情緒分析的三個(gè)應(yīng)用方向:輿情分析、質(zhì)檢分析、對話機(jī)器。

輿情是“輿論情況”的簡稱,企業(yè)管理者通過情緒輿情分析可以了解大眾對熱門事件的情感傾向,掌握輿論導(dǎo)向,從而更及時(shí)有效的進(jìn)行監(jiān)控。除了輿情監(jiān)控,評論分類可以讓制片人了解用戶對節(jié)目的喜好及評論,進(jìn)而有針對性的設(shè)計(jì)對應(yīng)的劇情橋段等。人物口碑追蹤,了解大眾對某一人物或公眾明顯的喜好程度。

質(zhì)檢,應(yīng)用于聊天對話、客服對話、任務(wù)型對話等。針對一段或多段對話文本,能自動(dòng)識別出當(dāng)前會(huì)話者所表現(xiàn)出的情緒。特別是在客服質(zhì)檢中,識別用戶在客服咨詢中的情緒,在自動(dòng)回復(fù)系統(tǒng)下,如檢測出用戶負(fù)面不滿情緒,則觸發(fā)人工客服介入。在人工客服場景下,可以判斷客服服務(wù)中客戶的情緒反應(yīng)也可用于監(jiān)控客服人員的服務(wù)態(tài)度。而現(xiàn)在市面上,例如語憶科技等一些企業(yè),已經(jīng)能基于人工智能技術(shù)提供較完善的客服智能質(zhì)檢及管理服務(wù)。

機(jī)器被賦予情感理解一直作為人工智能發(fā)展的長遠(yuǎn)目標(biāo),而我們現(xiàn)實(shí)中的人工智能產(chǎn)品“微軟小冰”和“竹間小影”就在不斷地朝著這個(gè)方向靠近。

“微軟小冰”是微軟(亞洲)互聯(lián)網(wǎng)工程院2014年建立的情感計(jì)算框架,小冰可作為對話式人工智能機(jī)器人、智能語音助手、人工智能創(chuàng)造內(nèi)容提供者,還能為一些垂直領(lǐng)域提供解決方案。

初代小冰除了智能對話之外,還兼具群提醒、百科、天氣、星座、交通指南、餐飲點(diǎn)評等實(shí)用技能。到現(xiàn)在的第六代小冰,不僅有貼近于人類自然交互行為的高級感官,還與萬得資訊和華爾街見聞在金融領(lǐng)域合作。

竹間小影——個(gè)人助理機(jī)器人,是一個(gè)能讀懂、看懂、聽懂、有記憶、自學(xué)習(xí),懂你的情感人工智能伴侶。它能近似于我們?nèi)艘粯?,理解談話者說話時(shí)的情感、情緒與意圖。通過自主學(xué)習(xí)用戶的喜好和習(xí)慣,能為用戶提供行程規(guī)劃、酒店預(yù)定等 30多項(xiàng)功能與服務(wù)。


展望未來

科技的進(jìn)步往往能給這個(gè)世紀(jì)帶來顛覆式改變,像“小冰”和“小影”,他們的技術(shù)性突破讓我們對未來的幻想越來越靠近,然而情緒識別的應(yīng)用空間是不可估量,或許在未來的某一天機(jī)器會(huì)被賦予像人類一樣有情感和對人類情緒的理解能力,并不再是一個(gè)冰冷的機(jī)器而是能做一個(gè)有“體溫”機(jī)器給予我們陪伴。


—— 專注于大數(shù)據(jù)與人工智能http://yuyidata.com????

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 分到青山 遇見希望 這里有純真的孩子 質(zhì)樸的老師 學(xué)校門口的楊樹開始紛紛地落葉 教室門口的紅薯還生機(jī)勃勃 臨走的時(shí)...
    董余蘭閱讀 524評論 1 2
  • 南瓜味甘,富含維生素A、B、C和果膠,適合6個(gè)月以上的寶寶,做成南瓜粥配上營養(yǎng)面包成就寶寶美味的早餐。 材料:南瓜...
    小蝸牛爸爸閱讀 278評論 0 0
  • 所有情都將在離開后逝去 所有孩子都將在清晨長大 所有身邊人都將在半途遠(yuǎn)走 所有不甘滿足都將在隔夜煙消云散 所有愛的...
    妄想超脫的瘋子閱讀 224評論 0 0

友情鏈接更多精彩內(nèi)容