人類什么時候才能聽懂動物的語言?

? ? 2018年,有一個視頻在養(yǎng)寵圈中廣泛流傳,引無數(shù)養(yǎng)寵人士潸然淚下。

? ? 視頻的主角是動物行為專家HeidiWright和一只生命即將走到盡頭的導(dǎo)盲犬,HeidiWright以她的能力為媒介,將導(dǎo)盲犬的肢體動作和聲音翻譯成人類語言,幫助它和主人進行最后的交流。在HeidiWright的轉(zhuǎn)述中,導(dǎo)盲犬表示它為無法繼續(xù)守護主人感到惋惜,還不停地呼叫另一只狗伙伴,讓它照顧好主人。

? ? 這段視頻讓人們感動的同時,也讓許多人感到遺憾,因為絕大部分人都無法像上文提及的主人那般幸運,能夠傾聽到狗的心聲。

? ? 無數(shù)人曾設(shè)想過,是否有可能出現(xiàn)一種翻譯工具,能夠?qū)櫸镎Z言轉(zhuǎn)換為人類語言呢?

? ? 人寵語言互譯并非偽命題,十年內(nèi)或可“美夢成真”

? ? Slobodchikoff教授稱,未來5到10年,人類使用一種手機大小的裝置——寵物翻譯器,便能與動物進行“對話”。


? ? 這位北亞利桑那大學(xué)的生物教授花了30年時間研究草原土撥鼠的行為,他用AI軟件記錄并分析草原土撥鼠的叫聲,將叫聲翻譯成英語后,發(fā)現(xiàn)這些草原上的小家伙們“具有語言所有方面的復(fù)雜通信系統(tǒng)”。而目前,他正試圖籌集資金來開發(fā)貓和狗的語音翻譯設(shè)備。

? ? 不過,在這條未知明暗的道路上探索的顯然不止他一人?!皩櫸锓g器”的低配版就被放上了淘寶,取得了可觀的銷量,賣家聲稱這個設(shè)備經(jīng)實測翻譯準(zhǔn)確率高達80%??v覽評論,“好玩”“有意思”“靈氣”之類的好評不在少數(shù),從中我們也可以得知消費者對寵物翻譯器的需求很大。

? ? 如果按Slobodchikoff教授所說的,這項技術(shù)或許能在十年內(nèi)成為現(xiàn)實,它能在小范圍內(nèi)滿足人與寵物的交流溝通,在大范圍內(nèi)滿足人類一統(tǒng)動物世界的夢想。

? ? 自動語音識別技術(shù)和語音翻譯技術(shù)助力,寵物情緒傳達不再是“鏡中花、水中月”

? ? 我們發(fā)現(xiàn),低配版寵物翻譯器運用的技術(shù)原理就是對狗的叫聲、動作等生物信號進行采樣,對獲取的數(shù)據(jù)進行頻譜分析,把得到的翻譯語言以中文形式語音播報出來。但是由于采樣的范圍和機器內(nèi)存等局限性,這種低配版寵物翻譯器在翻譯的準(zhǔn)確度和豐富性方面尚有待提高。

? ? 不過,現(xiàn)在也有了好消息,為實現(xiàn)人狗溝通而設(shè)計的“No More Woof”耳機就是其中之一。


? ? “No More Woof”是由北歐發(fā)明與發(fā)現(xiàn)協(xié)會(NCID)開發(fā)的,應(yīng)用的是三個不同技術(shù)領(lǐng)域的最新技術(shù)的組合,即腦電圖(EG)E傳感、微計算和專用腦—機接口(BCI)軟件,它主要由腦電圖耳機、Raspberry Pi處理器和一款便攜音箱組成。

? ? 這些傳感器是腦電圖記錄器,它可以降低讀數(shù),減少離子電流在狗腦中的電壓波動。然后由微型計算機拾取波動,在這種情況下形成一個Raspberry Pi,并對它做出解釋。

? ? 例如大腦中有一種特定的電信號用來定義疲勞感,還有一些最容易被發(fā)現(xiàn)的神經(jīng)模式:“我餓了”“我累了”“我很好奇那是誰”“我想尿尿”等。耳機中的傳感器會捕捉這種特殊的電信號,并將它們轉(zhuǎn)化為人們能夠聽懂的語言。

? ? 結(jié)合基礎(chǔ)的自動語音識別技術(shù)和語音翻譯技術(shù),計算機算法可以大致地分辨出寵物的情緒,這些是短時間內(nèi)寵物語言翻譯能實現(xiàn)的。至于要通過寵物翻譯器來了解動物伙伴們真正的內(nèi)心世界,我們還期待人類進一步的“大動作”。

? ? 如果要達到精確翻譯,還需要解決哪些問題?

? ? 動物的大腦并不如人類的大腦復(fù)雜,人腦的活動通常有一個明確的目標(biāo)導(dǎo)向,動物的大腦卻不一定。人的各種語言之間的轉(zhuǎn)換也具有相對窄范圍的對應(yīng)關(guān)系,而動物的語言與人類的語言則對應(yīng)范圍很寬。

? ? 例如狗會發(fā)出急促的叫聲,可能是因為它想要向主人乞食,也可能是因為警惕陌生人,還可能是因主人不陪自己玩而生氣。如果它想表達的是這一種情緒,而AI的翻譯器卻傳達為另一種,那么就容易使人和寵物之間的溝通誤入“歧途”,從而完全喪失寵物語言翻譯的意義。

? ? 那么是否有可能通過AI實現(xiàn)完全精準(zhǔn)的寵物語言翻譯呢?目前來說還有一定難度,在我們看來,AI在寵物語言翻譯上想要有所突破還得克服以下這些困難:

1. 數(shù)據(jù)關(guān)

? ? 要明確動物語言所表達的具體意義,我們需要先對動物的叫聲和即時腦電波動進行完整的采樣比對,再在這些數(shù)據(jù)的基礎(chǔ)上建立數(shù)據(jù)庫。

? ? 而這兩種數(shù)據(jù)都具有廣泛性和多樣性。以犬類為例,不同的犬種聲帶粗細寬窄各不相同,針對同一情景發(fā)出的叫聲分貝高低和尖細情況也不同,而刺激犬類發(fā)出叫聲的場景又是難以窮盡的,單收集犬類的聲音樣本就是一個無比巨大的工程,數(shù)據(jù)庫自然也難以完善。

2. 技術(shù)關(guān)

? ? 一個AI翻譯產(chǎn)品做到翻譯精確至少需要攻破幾個難題:形式端,拍譯要攻克圖像識別,同聲翻譯要攻克語音識別;內(nèi)容端,攻克文本語言分析、大數(shù)據(jù)。而AI還沒有發(fā)展到能夠精確地處理這些問題的階段,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷。

? ? 如搜狗搜索在2017年6月的分享會上發(fā)布了創(chuàng)新產(chǎn)品搜狗翻譯App,它應(yīng)用了基于生物學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機器翻譯(NMT)系統(tǒng),將翻譯精確度提升到了一個前所未有的高水準(zhǔn)。然而它在翻譯效果的“信、達、雅”上,仍然只達到了“信”的層面,對語言背后的幽默、情感等豐富含義的解讀和人們所期待的水準(zhǔn)還有些距離。

3. 語義關(guān)

? ? 語料積累、場景收集和副語言與文化背景成痛癢之地。AI翻譯在文本或語言的寓意分析方面做得還不夠好。與人類語言相比,動物語言都是即時信號,信息內(nèi)容全部關(guān)乎當(dāng)下,或示威,或示警,或示愛等,我們從中看不到用語言激起對過去聯(lián)想的跡象,并且單個個體能發(fā)出的聲音形式太單一了,蘊含在其中的豐富信息難以明確表達。

? ? 寵物翻譯的難點不僅在于聲音的收集,更在于聲音背后具體含義的對應(yīng)。

? ? 這種對應(yīng)是寬范圍的,難以精確判斷的,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷,無法精確理解語音所表達的內(nèi)涵,甚至在這個方面還比不上人類對動物語言的理解。人可以根據(jù)生活經(jīng)驗來理解動物語言,例如看到狗沖著陌生人叫,人們可以推測它是在防備這個陌生人,而機器可能就沒辦法很好地理解,從而導(dǎo)致判斷錯誤。

4. “歷史包袱”,AI難以跟上生命體的學(xué)習(xí)進程

? ? 狗的叫聲在一定歷史時期并不是狗的叫聲在一定歷史時期并不是一成不變的,狗憑借自身的靈性及主人的后天馴養(yǎng),具備學(xué)習(xí)能力。例如狗類中智商排名第一的邊境牧羊犬智力水平已經(jīng)相當(dāng)于6~8歲的小孩,經(jīng)過學(xué)習(xí),在放牧?xí)r,它會用不同的叫聲來驅(qū)使羊群,控制羊群走向。

? ? 還有一些寵物狗,甚至?xí)谌祟惖目桃庥?xùn)練下發(fā)出類似“媽媽”的叫聲,寵物語言在日新月異的變化,計算機卻很難去掉語言的“歷史包袱”,這些也造成了AI寵物翻譯的困境。

? ? 總之,AI能做的就是不斷改進自身的功能,我們要用科學(xué)手段完善數(shù)據(jù)庫、內(nèi)容、語料和場景,將形式和內(nèi)容雙管齊下,在堅實的地基上建立起實現(xiàn)人和動物“有效溝通”的“巴別塔”。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容