如果人要和機(jī)器人談戀愛(ài),最大的障礙是什么?

近年阿爾法狗與人類(lèi)的圍棋“人機(jī)大戰(zhàn)”炒得火熱,在這個(gè)新聞熱點(diǎn)的背后大家都會(huì)思考一個(gè)問(wèn)題:人類(lèi)和人工智能除了各種大戰(zhàn)之外,是否能夠?qū)崿F(xiàn)和諧共存?比如人類(lèi)和機(jī)器人之間是否會(huì)有愛(ài)情出現(xiàn)呢?

當(dāng)然,這樣的場(chǎng)景在很多電影中都已經(jīng)出現(xiàn)過(guò),最近的一則消息讓大家對(duì)這個(gè)話(huà)題更有了一些想象空間:由斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering)挑戰(zhàn)賽榜單更新成績(jī),科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室(HFL)提交的系統(tǒng)模型奪得第一名寶座,這也是中國(guó)本土研究機(jī)構(gòu)首次取得該賽事的榜首。

SQuAD挑戰(zhàn)賽最新成績(jī)榜單

SQuAD挑戰(zhàn)賽是行業(yè)內(nèi)公認(rèn)的“機(jī)器閱讀理解標(biāo)準(zhǔn)水平測(cè)試”,也是該領(lǐng)域的頂級(jí)賽事,被譽(yù)為機(jī)器閱讀理解界的ImageNet(圖像識(shí)別領(lǐng)域的頂級(jí)賽事)。參賽者來(lái)自全球?qū)W術(shù)界和產(chǎn)業(yè)界的研究團(tuán)隊(duì),包括微軟亞洲研究院、艾倫研究院、IBM、Salesforce、Facebook、谷歌以及卡內(nèi)基·梅隆大學(xué)、斯坦福大學(xué)等知名企業(yè)研究機(jī)構(gòu)和高校,賽事對(duì)自然語(yǔ)言理解的進(jìn)步有重要的推動(dòng)作用。

如果人類(lèi)想和機(jī)器人談戀愛(ài),最大的困難就是:機(jī)器閱讀的長(zhǎng)句理解

電影《Her》講述了主人公西奧多在結(jié)束了一段令他心碎的愛(ài)情長(zhǎng)跑之后,他愛(ài)上了電腦操作系統(tǒng)里的女聲,這個(gè)叫“薩曼莎”的姑娘不僅有著略微沙啞的性感嗓音,并且風(fēng)趣幽默、善解人意,讓孤獨(dú)的男主泥足深陷。

薩曼薩其實(shí)就是人工智能,它通過(guò)掃描主人公的郵件,閱讀與主人相關(guān)的資料后,越來(lái)像主人公去世的女友,兩人就開(kāi)啟了一段人機(jī)戀愛(ài)的故事。

這部電影涉及到了一個(gè)很專(zhuān)業(yè)的人工智能領(lǐng)域,如果機(jī)器要和人談戀愛(ài),首先機(jī)器必須能夠理解自然語(yǔ)言,有關(guān)自然語(yǔ)言理解的最大難點(diǎn)就在于:長(zhǎng)句的閱讀理解!

現(xiàn)在人類(lèi)已經(jīng)在圖像識(shí)別、機(jī)器翻譯、語(yǔ)音識(shí)別等領(lǐng)域取得了卓越的成績(jī)。人類(lèi)學(xué)家認(rèn)為,語(yǔ)言是構(gòu)建人類(lèi)文明的基石。在語(yǔ)言上,我們構(gòu)建了神話(huà)、宗教;構(gòu)建了城邦、帝國(guó);構(gòu)建了信任、信仰;甚至我們自己還發(fā)明了編程語(yǔ)言。很長(zhǎng)一段時(shí)間,自然語(yǔ)言處理研究都是基于句子級(jí)別的閱讀理解,例如給一個(gè)句子,理解句子中的主謂賓、定狀補(bǔ)等等,但是長(zhǎng)文的理解一直都是難點(diǎn)。

舉例:

萊茵河是一條位于歐洲的著名河流,始于瑞士阿爾卑斯山,流經(jīng)瑞士、奧地利、列支敦士登、法國(guó)、德國(guó)、荷蘭,最終在荷蘭注入北海。萊茵河上最大的城市是德國(guó)科隆。它是中歐和西歐區(qū)域的第二長(zhǎng)河流,位于多瑙河之后,約1230公里。

若針對(duì)該段內(nèi)容提問(wèn):什么河比萊茵河長(zhǎng)?人們可以輕易地給出答案:多瑙河。但目前,即使是最佳的系統(tǒng)模型R-NET給出的答案也并不盡人意,它的回答是科隆。對(duì)人類(lèi)來(lái)說(shuō),這是一個(gè)非常簡(jiǎn)單的閱讀理解題,但對(duì)機(jī)器的閱讀理解能力來(lái)說(shuō),這是超級(jí)困難的。

科大訊飛在機(jī)器閱讀理解標(biāo)準(zhǔn)水平測(cè)試SQuAD挑戰(zhàn)賽中,勇奪第一

SQuAD挑戰(zhàn)賽通過(guò)眾包的方式構(gòu)建了一個(gè)大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬(wàn)個(gè)問(wèn)題),就是將一篇幾百詞左右的短文給人工標(biāo)注者閱讀,讓標(biāo)注人員提出最多5個(gè)基于文章內(nèi)容的問(wèn)題并提供正確答案;短文原文則來(lái)源于500多篇維基百科文章。參賽者提交的系統(tǒng)模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個(gè)基于文章內(nèi)容的問(wèn)題,然后與人工標(biāo)注的答案進(jìn)行比對(duì),得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果。

SQuAD挑戰(zhàn)賽主頁(yè)

SQuAD向參賽者提供訓(xùn)練集用于模型訓(xùn)練,以及一個(gè)規(guī)模較小的數(shù)據(jù)集作為開(kāi)發(fā)集,用于模型的調(diào)優(yōu)和選型。與此同時(shí),SQuAD還提供了一個(gè)開(kāi)放平臺(tái)供參賽者提交自己的算法,由SQuAD官方利用隱藏的測(cè)試集對(duì)參賽系統(tǒng)進(jìn)行評(píng)分,并在SQuAD官方確認(rèn)后將相關(guān)結(jié)果更新到官網(wǎng)上。得益于SQuAD提供的大規(guī)模高質(zhì)量的訓(xùn)練數(shù)據(jù)以及層出不窮的模型,該挑戰(zhàn)賽的榜單一次又一次的刷新。目前,科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的系統(tǒng)模型取得了精確匹配77.845%和模糊匹配85.297%的成績(jī),位列世界第一。

科大訊飛,是如何做到的?

在SQuAD官網(wǎng)的成績(jī)榜單上,可以看到科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的模型名為“Interactive AoA Reader”,這是訊飛經(jīng)過(guò)不斷摸索之后提出的“基于交互式層疊注意力模型”(Interactive Attention-over-Attention Model)。正是這個(gè)與眾不同的模型,讓科大訊飛在全球自然語(yǔ)言理解研究領(lǐng)域脫穎而出、躍居頭名。

機(jī)器閱讀理解問(wèn)題的解決,傳統(tǒng)的自然語(yǔ)言處理(NLP)方式是采用分拆任務(wù)的方法將其分成問(wèn)題分析、篇章分析、關(guān)鍵句抽取等一些步驟,但這種方法容易造成級(jí)聯(lián)誤差的積累,很難得到很好的效果。

目前在機(jī)器閱讀理解領(lǐng)域中,則多采用完全端到端的神經(jīng)網(wǎng)絡(luò)建模,消除了分步驟產(chǎn)生的級(jí)聯(lián)誤差。除此之外,采用神經(jīng)網(wǎng)絡(luò)的方法能夠通過(guò)大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)到泛化的知識(shí)表示,對(duì)篇章和問(wèn)題從語(yǔ)義層面上高度抽象化。

訊飛同樣也采用了端到端的神經(jīng)網(wǎng)絡(luò)模型,但把精力更多放在如何能夠模擬人類(lèi)在做閱讀理解問(wèn)題時(shí)的一些方法。訊飛提出的基于交互式層疊注意力模型,主要思想是根據(jù)給定的問(wèn)題對(duì)篇章進(jìn)行多次的過(guò)濾,同時(shí)根據(jù)已經(jīng)被過(guò)濾的文章進(jìn)一步篩選出問(wèn)題中的關(guān)鍵提問(wèn)點(diǎn)。這樣“交互式”地逐步精確答案的范圍,與其他參賽者的做法不太相同,最終收獲了令人矚目的成績(jī)。

讓機(jī)器能夠閱讀理解,究竟有什么意義?

首先,讓機(jī)器實(shí)現(xiàn)“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”,也一直是科大訊飛所肩負(fù)的使命和方向??拼笥嶏w認(rèn)為,人工智能的發(fā)展主要分為運(yùn)算智能、感知智能和認(rèn)知智能。機(jī)器在運(yùn)算智能上有極大的優(yōu)勢(shì),在感知智能上也已經(jīng)取得了很大的進(jìn)展,例如語(yǔ)音識(shí)別、語(yǔ)音合成、圖像識(shí)別、機(jī)器翻譯等?,F(xiàn)在全球的研究機(jī)構(gòu)都在尋找由感知智能向認(rèn)知智能突破的關(guān)鍵缺口,在認(rèn)知智能方面,自然語(yǔ)言處理一直是實(shí)現(xiàn)人機(jī)交互、人工智能的重要技術(shù)基石,機(jī)器閱讀理解正是實(shí)現(xiàn)這一領(lǐng)域突破的一個(gè)研究焦點(diǎn)。只有人工智能突破了閱讀理解,才能真正進(jìn)入認(rèn)知智能領(lǐng)域,人工智能才會(huì)越來(lái)越智能、聰明!

早在2014年,科大訊飛與哈爾濱工業(yè)大學(xué)就聯(lián)合成立了聯(lián)合實(shí)驗(yàn)室(HFL),作為“訊飛超腦”計(jì)劃的核心研發(fā)團(tuán)隊(duì)之一,聯(lián)合實(shí)驗(yàn)室致力于在語(yǔ)言認(rèn)知計(jì)算領(lǐng)域進(jìn)行長(zhǎng)期、深入的技術(shù)創(chuàng)新,重點(diǎn)突破深層語(yǔ)義理解、邏輯推理決策、自主學(xué)習(xí)進(jìn)化等認(rèn)知智能關(guān)鍵技術(shù),并圍繞教育學(xué)習(xí)、人機(jī)語(yǔ)音交互、信息安全等領(lǐng)域?qū)崿F(xiàn)科研成果的規(guī)?;瘧?yīng)用。

科大訊飛不僅能夠提供各類(lèi)人工智能教育產(chǎn)品,為廣大師生提供教學(xué)系統(tǒng)解決方案,更是推出了專(zhuān)門(mén)針對(duì)考試評(píng)分的全學(xué)科閱卷系統(tǒng),能讓機(jī)器人做考試評(píng)分,特別是給考卷的主觀題評(píng)分。以語(yǔ)文考試的作文為例,在閱卷之前老師們先設(shè)置一套通用的打分標(biāo)準(zhǔn),包括字跡工整度、詞匯豐富性、句子通順度、文采、篇章結(jié)構(gòu)、立意等多個(gè)層次,研究人員讓機(jī)器來(lái)學(xué)習(xí)這套方案后進(jìn)行閱卷。這每一項(xiàng)標(biāo)準(zhǔn)背后都需要精密復(fù)雜的技術(shù)支持,比如手寫(xiě)識(shí)別、主題模型、人工神經(jīng)網(wǎng)絡(luò)等。

目前,科大訊飛的全學(xué)科閱卷技術(shù)在四六級(jí)、部分省份的高考、中考等大規(guī)模考試中進(jìn)行了試點(diǎn)驗(yàn)證,驗(yàn)證結(jié)果表明計(jì)算機(jī)評(píng)分結(jié)果已經(jīng)達(dá)到了現(xiàn)場(chǎng)閱卷老師的水平,完全滿(mǎn)足大規(guī)模考試的需要。這項(xiàng)技術(shù)應(yīng)用到正式考試中,就可以輔助人工閱卷,減少人員投入,降低人工閱卷中疲勞、情緒等因素的影響,進(jìn)一步提升閱卷效率和準(zhǔn)確性。

此前,哈工大訊飛聯(lián)合實(shí)驗(yàn)室曾先后在Google DeepMind閱讀理解公開(kāi)數(shù)據(jù)測(cè)試集、Facebook閱讀理解公開(kāi)數(shù)據(jù)測(cè)試集取得世界最好成績(jī),本次在SQuAD測(cè)試集再獲全球最佳,包攬了機(jī)器閱讀理解權(quán)威測(cè)試集的“大滿(mǎn)貫”。機(jī)器閱讀理解技術(shù)擁有廣闊的應(yīng)用場(chǎng)景,例如在產(chǎn)品的精準(zhǔn)問(wèn)答、開(kāi)放域的問(wèn)答上都會(huì)起到有力的支撐作用,訊飛也在不斷探索機(jī)器閱讀理解技術(shù)的應(yīng)用落地。但對(duì)于機(jī)器閱讀理解的“能理解會(huì)思考”的終極目標(biāo)來(lái)說(shuō),現(xiàn)在還只是萬(wàn)里長(zhǎng)征的開(kāi)始,對(duì)自然語(yǔ)言的更深層次的歸納、總結(jié)、推理,一定是未來(lái)機(jī)器閱讀理解不可缺少的部分。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容