個性化對話系統(tǒng)Personalization in Goal-oriented Dialog

原文
代碼

摘要

建模人類對話的主要目標(biāo)是創(chuàng)建可以在開放式和目標(biāo)導(dǎo)向場景中與人員交互的代理。 端對端訓(xùn)練的神經(jīng)對話系統(tǒng)是這種廣義對話模型的重要研究線,因為它們不會訴諸任何特定情境的手工制作規(guī)則。 然而,將個性化納入這樣的系統(tǒng)是一個很大程度上尚未探索的主題,因為沒有現(xiàn)成的語料庫來促進(jìn)這種工作。 在本文中,我們提出了一個新的面向目標(biāo)的對話框數(shù)據(jù)集,這些數(shù)據(jù)集受到與其相關(guān)的揚聲器配置文件的影響。 我們分析了基于內(nèi)存網(wǎng)絡(luò)的現(xiàn)有端到端對話系統(tǒng)的缺點,并提出了對支持個性化的體系結(jié)構(gòu)的修改。 我們還將對話中的個性化作為一項多任務(wù)學(xué)習(xí)問題進(jìn)行調(diào)查,并顯示在各種配置文件之間共享特征的單個模型優(yōu)于每個配置文件的單獨模型。

1.介紹

神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的記憶和注意力機(jī)制的最新進(jìn)展是在機(jī)器翻譯[Johnson等人,2016],QA[Graves等人,2016]以及其他需要邏輯推理元素的語言理解任務(wù)。相比較傳統(tǒng)系統(tǒng),建立基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)完成這些任務(wù)的主要動機(jī)是,它們不需要任何特征工程或規(guī)則領(lǐng)域的手工工作[Vinallys and Le,2015]。 會話建模就是一個這樣的領(lǐng)域,端對端訓(xùn)練系統(tǒng)在開放式[Dodge et al。,2015]和面向目標(biāo)的應(yīng)用[Bordes and Weston,2016]中匹配或超越了傳統(tǒng)的對話系統(tǒng)。

對話系統(tǒng)的一個重要但尚未探索的方面是根據(jù)與其交互的人員的特征或?qū)傩詠韨€性化機(jī)器人的響應(yīng)的能力。 個性化是創(chuàng)建真正智能的會話代理的關(guān)鍵,可以無縫集成到人類的生活中。例如,餐館預(yù)訂系統(tǒng)理想情況下應(yīng)該與用戶進(jìn)行對話以找到變量的值,例如位置,烹飪類型和價格范圍。然后它應(yīng)該基于這些變量以及關(guān)于用戶的某些固定屬性(飲食偏好,最喜歡的食物項目等)提出建議。機(jī)器人使用的語言的注冊(或樣式)也可能受到用戶某些特征(年齡,性別等)的影響[Halliday,1964]。然而,沒有開放的數(shù)據(jù)集可以讓研究人員訓(xùn)練每個對話都受說話人的個人信息影響[Serban et al。,2015]的端到端的對話系統(tǒng)。

為了創(chuàng)建這樣一個數(shù)據(jù)集的最終目的,本文旨在擴(kuò)展由Bordes和Weston [2016]引入的bAbI對話數(shù)據(jù)集。設(shè)置在餐廳預(yù)訂的領(lǐng)域,他們合成的數(shù)據(jù)集將對話分解為若干任務(wù),以測試對話系統(tǒng)應(yīng)具備的一些關(guān)鍵功能??偠灾?,這些任務(wù)可以用作在面向任務(wù)的環(huán)境中分析端到端對話系統(tǒng)的框架。 鑒于餐廳及其屬性(位置,菜肴類型等)的知識庫(KB),該對話系統(tǒng)的目的是為用戶預(yù)訂餐館。 完整的對話分為不同的階段,每個階段都用來測試模型的一方面能力,例如是否可以學(xué)習(xí)隱式對話狀態(tài)追蹤,是否在對話框中使用知識庫中的事實,以及是否處理未出現(xiàn)在訓(xùn)練集對話框中的新實體。

在本文中,我們建議擴(kuò)展現(xiàn)有數(shù)據(jù)集的前五個任務(wù)。 除了原始任務(wù)的目標(biāo)之外,對話系統(tǒng)還必須利用用戶的個人資料信息來改變言語風(fēng)格并個性化推理KB。 最終目標(biāo)是根據(jù)用戶的屬性(飲食偏好,最喜歡的食品等)進(jìn)行個性化的餐廳預(yù)訂。

bAbI對話框數(shù)據(jù)集的合成本質(zhì)以及我們的擴(kuò)展工作使得構(gòu)建完美的人工對話系統(tǒng)變得很容易。 因此,這里的目標(biāo)不是要改善這個領(lǐng)域的技術(shù)水平,而是分析現(xiàn)有的端到端的面向任務(wù)的對話系統(tǒng),并在此類框架中對個人信息個性化進(jìn)行建模。 第3節(jié)介紹了我們對原始數(shù)據(jù)集的修改,第4節(jié)描述了基于第5節(jié)中任務(wù)基準(zhǔn)的各種模型。在第6節(jié)中,我們分析了將面向任務(wù)的對話作為多任務(wù)學(xué)習(xí)問題的任務(wù),并且顯示 在各種配置文件中共享特征的單個模型優(yōu)于每個配置文件的單獨模型。 我們的數(shù)據(jù)集可以通過ParlAI框架[Miller et al。,2017]或Github以及我們的實驗代碼和訓(xùn)練好的模型進(jìn)行訪問。

2.相關(guān)工作

這項工作建立在Bordes和Weston [2016]中描述的bAbI對話數(shù)據(jù)集上,該數(shù)據(jù)集旨在測試餐館預(yù)訂目標(biāo)導(dǎo)向的端到端對話系統(tǒng)。他們的任務(wù)旨在補充Weston等人描述的bAbI文本理解和推理任務(wù)。 [2015]。

與我們最接近的工作是Li等人,他們[2016]在SEQ2SEQ對話模型[Vinallys and Le,2015]中對演講者角色進(jìn)行編碼。該模型基于講話者的對話歷史(例如,他們的所有推文)在向量空間中建立講話者角色的嵌入。我們的工作與他們的調(diào)查不同,他們的研究意義在于:1)他們關(guān)注的是在開放式對話(chit-chat)中產(chǎn)生一致響應(yīng)的問題,而我們的工作則側(cè)重于面向目標(biāo)的對話的個性化以及來自一組話語的正確候選響應(yīng)的排序/區(qū)分 ,以及2)他們的對話系統(tǒng)需要提供演講者的對話歷史來建立角色,而我們的任務(wù)中,機(jī)器人必須從明確提供的屬性中組成用戶的個人信息。 這可以說是一種更好的現(xiàn)實世界學(xué)習(xí)場景表示,其中代理人可以利用存儲在正式數(shù)據(jù)結(jié)構(gòu)中的信息來個性化客戶服務(wù)或餐廳預(yù)訂等領(lǐng)域的對話。

3.數(shù)據(jù)集

我們建立在前五個合成的成的bAbI對話任務(wù)(T1-T5)上,目標(biāo)是在餐廳預(yù)訂餐桌。 會話由模擬器(圖1所示格式)根據(jù)包含所有餐廳及其屬性的底層KB生成。 每個餐廳都由一種美食(10種選擇,例如意大利,印度),一個位置(10種選擇,例如倫敦,東京),價格范圍(便宜,適中或昂貴),宴會大?。?,4 ,6或8人)和評分(從1到8)。 每家餐廳都有一個地址和一個電話號碼。 向KB發(fā)起API調(diào)用返回與滿足四個參數(shù)的所有餐館相關(guān)的事實列表:地點,美食,價格范圍和派對大小。

除了用戶和機(jī)器人話語之外,每個任務(wù)中的對話都由API調(diào)用和結(jié)果事實組成。在隨機(jī)選擇四個必填字段中的每一個字段后,使用自然語言模式生成對話:位置,美食,價格范圍和派對大小。 用戶有43種模式,機(jī)器人有15種模式(用戶可以用4種不同的方式來表達(dá),而機(jī)器人只有一種)。 如以下各節(jié)所述,我們對知識庫進(jìn)行了進(jìn)一步添加,并增加了創(chuàng)建我們?nèi)蝿?wù)的機(jī)器人話語模式。 為了適應(yīng)bAbI對話任務(wù)的綜合性質(zhì),與真實生活情況相比,機(jī)器人響應(yīng)的個性化被手工制作得過于簡單。

圖1:個性化餐廳預(yù)訂系統(tǒng) 用戶(綠色或黃色)與機(jī)器人進(jìn)行對話(藍(lán)色)以在餐廳預(yù)訂餐桌。 在每一回合中,模型都可以訪問用戶的配置文件屬性,對話歷史記錄和來自API調(diào)用的輸出(淺紅色),并且必須預(yù)測下一個機(jī)器人語音或API調(diào)用(以深紅色)。 對話組之間的水平線表示以下各節(jié)中描述的單獨任務(wù)。 (插圖由圖1改編,Bordes和Weston [2016])。

3.1 個性化的面向目標(biāo)的對話任務(wù)

根據(jù)bAbI對話任務(wù),任務(wù)1和2測試模型的隱式跟蹤對話狀態(tài)的能力,任務(wù)3和4檢查他們是否可以排序并在會話中使用KB事實。 任務(wù)5將任務(wù)的所有方面組合成一個完整的對話框。 除了實現(xiàn)bAbI對話任務(wù)的原始目標(biāo)之外,修改的任務(wù)還要求對話系統(tǒng)根據(jù)由各種固定屬性組成的用戶簡檔來個性化其言語風(fēng)格和對KB事實的推理。 對于所有任務(wù)中的每個對話,在第一輪對話之前提供用戶的屬性(性別,年齡,飲食偏好和喜歡的食物項目)。

個性化任務(wù)1:發(fā)出API調(diào)用。用戶進(jìn)行查詢,其中包含0到4個必填字段(統(tǒng)一采樣)。 機(jī)器人必須提問以填補缺失的字段,然后生成適當(dāng)?shù)腁PI調(diào)用。

個性化任務(wù)2:更新API調(diào)用。從任務(wù)1發(fā)出API調(diào)用開始,用戶將其請求更新1到4次(統(tǒng)一采樣)。 隨機(jī)選擇要更新的字段,然后機(jī)器人必須發(fā)布更新的API調(diào)用。

個性化任務(wù)3:顯示選項。根據(jù)用戶請求,通過相應(yīng)的API調(diào)用查詢KB,并將結(jié)果事實添加到對話歷史記錄中。 機(jī)器人必須根據(jù)用戶的屬性使用簡單的啟發(fā)式(在3.3節(jié)中描述)對餐廳進(jìn)行分類,并向用戶提供餐廳,直到他們接受為止。 用戶在25%的時間內(nèi)接受建議,或者如果是最后剩下一項選擇,則始終接受建議。

個性化任務(wù)4:提供額外的信息。根據(jù)用戶對隨機(jī)抽樣餐廳的請求,與餐廳有關(guān)的所有知識庫事實都被添加到歷史記錄中,并且如果用戶決定在那里預(yù)訂餐桌,則進(jìn)行對話。然后,用戶要求得到餐館的定位,或者其聯(lián)系信息或兩者都要(分別為概率分別為25%,25%和50%)。 機(jī)器人必須學(xué)會從歷史中檢索正確的KB事實,為用戶量身定制。

個性化任務(wù)5:進(jìn)行完整的對話。為任務(wù)5生成的對話將任務(wù)1-4的所有方面組合到完整對話中。

將所有5項任務(wù)納入個性化的第一個方面是,根據(jù)用戶的性別(男性或女性)和年齡(年輕,中年或老年人),機(jī)器人使用的語言風(fēng)格發(fā)生了變化。 對于原始任務(wù)中的15個機(jī)器人話語模式中的每一個,我們?yōu)槊總€可能的(年齡,性別)配置文件排列創(chuàng)建了6個新模式。 這些模式中的每一個在向用戶傳遞相同信息的同時,在語調(diào),形式和詞語用法方面都有所不同。 圖1顯示了(男性,老人)用戶和(男性,年輕)用戶的同一對話框的兩個版本。將所有5項任務(wù)納入個性化的第一個方面是,根據(jù)用戶的性別(男性或女性)和年齡(年輕,中年或老年人),機(jī)器人使用的語言風(fēng)格發(fā)生了變化。

3.2 用戶配置文件和語言樣式更改

對于原始任務(wù)中的15個機(jī)器人話語模式中的每一個,我們?yōu)槊總€可能的(年齡,性別)配置文件排列創(chuàng)建了6個新模式。 這些模式中的每一個在向用戶傳遞相同信息的同時,在語調(diào),形式和詞語用法方面都有所不同。 圖1顯示了(男性,老人)用戶和(男性,年輕)用戶的同一對話框的兩個版本。

在創(chuàng)建話語模式時,重要的是為6個配置文件中的每一個保留一致的詞匯。機(jī)器人使用的詞語和語言的形式化程度和精確度隨著年齡而增加。同一時間,同一性別和年齡組的詞語選擇重疊。例如,(男性,年輕)用戶的模式在形式和語調(diào)上與(女性,年輕)用戶的模式類似,并與(女性,年輕)和(男性,中年)用戶共享某些關(guān)鍵詞,用戶模式。這與(女性,中年)或(女性,老年人)使用者的模式相比較無關(guān)。通過在配置文件之間建立這種關(guān)系而不是6種完全不同的模式,我們想測試對話模型是否可以學(xué)習(xí)形成概念(例如形式,精確度和詞語使用)與屬性(如性別和年齡)之間的關(guān)聯(lián)。將我們的語音樣式更改應(yīng)用于bAbI對話任務(wù)會導(dǎo)致與6個用戶配置文件關(guān)聯(lián)的同一個對話框的6個版本。因此,我們將每個任務(wù)的規(guī)模增加了6倍。所有原始模式和與其中每一個相關(guān)的6個修改模式都以附錄A的表格形式顯示。

3.3 KB更新和個性化推理

為了使任務(wù)3中的機(jī)器人推薦餐館的順序個性化,我們?yōu)橛脩舻暮啓n添加了2個新屬性:飲食偏好(素食或非素食)和最喜歡的食物項目(從與在對話中烹飪)。我們?yōu)橹R庫中的每家餐廳創(chuàng)建了一個副本,并為餐廳類型(素食主義者或非素食主義者)添加了一個附加屬性,以區(qū)分其他相同的副本。對于修改后的KB中的每個餐廳,我們還添加了特色屬性(從與餐廳菜肴相關(guān)的菜單中隨機(jī)抽樣)。當(dāng)修改原始任務(wù)中的每個對話框時,我們使用的評分計算公式為:評分(8分)+8(如果餐館類型與用戶的飲食相匹配偏好)+ 2.5(如果餐廳專業(yè)匹配用戶最喜歡的食品)。有了這樣一個標(biāo)準(zhǔn),所有素食餐館都會為素食用戶比非素食餐廳高8分,并且在機(jī)器人建議任何非素食餐館(按照評分從高到低)推薦之前總會提出。通過額外獲得2.5分以反映用戶對最喜歡食品的偏好,專門從事該項目的較低評級餐廳將在較高等級(最多2分)專門從事其他事務(wù)的餐廳之前提出。這測試了模型根據(jù)用戶的配置文件執(zhí)行真/假推理的能力,并根據(jù)多個條件隱式排列餐廳。

我們對任務(wù)4的修改要求機(jī)器人根據(jù)用戶的某些屬性和餐廳本身檢索與餐廳相關(guān)的KB事實的組合。除了電話號碼和地址之外,我們還為每家餐廳的知識庫條目添加了3個新屬性(社交媒體鏈接,停車信息和公共交通信息)。在每個修改后的對話框中,當(dāng)用戶詢問餐廳的聯(lián)系信息時,如果用戶年輕,機(jī)器人必須返回餐廳的社交媒體鏈接,或者如果用戶是中年或老年人,則必須返回電話號碼。類似地,當(dāng)用戶詢問餐廳的方向時,如果餐館便宜,機(jī)器人必須返回地址和公共交通信息,或者如果餐廳處于適中或昂貴的價格范圍內(nèi),則必須返回地址和停車信息。這測試了模型根據(jù)用戶簡檔(年齡)中的屬性或用戶在對話期間(餐廳的價格范圍)所做的選擇來個性化知識庫事實檢索的能力。

3.4 更新數(shù)據(jù)集

我們使用與原始bAbI對話框數(shù)據(jù)集相同的方式生成和構(gòu)建數(shù)據(jù)集:對于每個任務(wù),我們提供了使用一半修改后的KB生成的培訓(xùn),驗證和測試集對話框。我們還從包含新實體(餐館,美食類型等)的其他知識庫中生成了另一個測試集,這些新實體在任何培訓(xùn)對話中都看不到,稱為(OOV)測試集。在訓(xùn)練期間,該模型可以訪問trainning example和知識庫。模型可以在plain和OOV兩個測試集上進(jìn)行評估,評估他們在每次對話時從所有可能的候選列表中排列正確的機(jī)器人話語的能力。表1給出了每項任務(wù)數(shù)據(jù)集的統(tǒng)計數(shù)據(jù),并與原始bAbI對話任務(wù)進(jìn)行了比較。由于與用戶配置文件相關(guān)的各種語音風(fēng)格,詞匯的大小增加了近四倍。由于KB中每家餐廳的重復(fù)和演講風(fēng)格的變化,可能的候選答復(fù)數(shù)量增加了10倍。我們?yōu)槊宽椚蝿?wù)提供兩種變體:一套全套生成的對話框和一套只包含1000個對話.

表1::數(shù)據(jù)集統(tǒng)計。 對于第4行到第6行,第一個數(shù)字是整個集合的大小,括號中的數(shù)字是小集合的大小。 (*)PT1-PT5和所有5個bAbI對話任務(wù)都有兩個相同大小的測試集,一個使用與訓(xùn)練集相同的KB實體,另一個使用詞典外詞。

4.模型

繼Bordes和Weston [2016]之后,我們通過評估幾種學(xué)習(xí)方法:基于規(guī)則的系統(tǒng),監(jiān)督嵌入和端到端內(nèi)存網(wǎng)絡(luò)來提供修改后數(shù)據(jù)集的基線。我們還建議對內(nèi)存網(wǎng)絡(luò)架構(gòu)進(jìn)行修改,以便通過KB進(jìn)行個性化推理。

4.1 基于規(guī)則的系統(tǒng)

我們的任務(wù)是通過修改和附加到bAbI對話框任務(wù)T1-T5生成的。 所有的對話框都是用基于規(guī)則的模擬器構(gòu)建的,機(jī)器人表達(dá)完全是確定性的。 因此,可以基于與模擬器相同的規(guī)則創(chuàng)建完美的手工制作系統(tǒng)。

4.2 有監(jiān)督的嵌入模型

盡管從Word2Vec [Mikolov等人,2013]的原始文本學(xué)習(xí)無監(jiān)督嵌入廣為人知,嵌入也可以專門針對特定任務(wù)的監(jiān)督方式學(xué)習(xí)。對于開放式和面向目標(biāo)的對話,受監(jiān)督的詞嵌入模型(對話歷史,響應(yīng))對已被證明是一個強(qiáng)有力的基線[Dodge et al。,2015,Bordes and Weston,2016]。 我們不會為用戶配置文件手工制作任何特殊嵌入,并將其視為對話中的一輪。

嵌入向量是專門針對預(yù)測下一個回復(fù)的任務(wù)而訓(xùn)練的::
image.png

, 其中A和B是d×V字嵌入矩陣,并且輸入和回答都是(bag-of-embedding)。 該模型用SGD進(jìn)行訓(xùn)練以最小化排序損失函數(shù):
image.png

,其中m是邊際的大小,并且N個負(fù)候選響應(yīng)
image.png

是按照示例采樣的.

4.3 記憶網(wǎng)絡(luò)

記憶網(wǎng)絡(luò)[Weston et al。,2014]是最近一類被證明可以成功完成各種任務(wù)的模型,如問答[Sukhbaatar等,2015]和進(jìn)行對話[Dodge等,2015]。對于對話系統(tǒng),整個對話歷史記錄存儲在模型的內(nèi)存組件中。它可以迭代地讀取以執(zhí)行推理并基于上下文選擇最佳可能的回答。該模型在每次交談時都會注意記憶中的各種實體,并可以通過多次迭代(稱為hops)進(jìn)行可視化。 應(yīng)用Bordes和Weston [2016]描述的對內(nèi)存網(wǎng)絡(luò)體系結(jié)構(gòu)的修改,我們使用該模型作為端到端基線并分析其性能。

用戶信息存儲在模型的存儲器中,就好像它是用戶所說的對話歷史的第一輪一樣,即該模型通過組合配置文件中每個屬性的嵌入值來構(gòu)建個人信息的嵌入向量。 與Bordes和Weston [2016]不同,我們不使用KB實體的任何匹配類型功能。 我們的目標(biāo)是分析現(xiàn)有內(nèi)存網(wǎng)絡(luò)模型的功能,以便在進(jìn)行對話時利用配置文件信息。 附錄B包含基于下節(jié)中描述的實驗的內(nèi)存網(wǎng)絡(luò)預(yù)測的可視化。

4.4 拆分的內(nèi)存架構(gòu)

任務(wù)3和4的個性化推理方面要求機(jī)器人結(jié)合來自用戶屬性以及對話歷史(即知識庫事實和對話)的信息。 單個內(nèi)存架構(gòu)不能充分關(guān)注用于制定個性化響應(yīng)的各種屬性和每輪對話。

我們建議將模型的內(nèi)存分為兩部分:用戶信息配置和對話歷史記錄。 在對話啟動之前,各種屬性將作為單獨的條目添加到配置文件內(nèi)存中。 同時,隨著對話的進(jìn)行,每個對話輪都會添加到對話內(nèi)存中。模型讀取的機(jī)制和基于內(nèi)存做出推斷的機(jī)制保持不變。 來自兩個存儲器的輸出以元素方式求和的方式以獲得每輪對話的最終響應(yīng)。 該模型的可視化如圖2所示。

image.png

圖2:內(nèi)存網(wǎng)絡(luò)的分割內(nèi)存架構(gòu):配置文件屬性和對話歷史記錄用兩個單獨的存儲器建模。 兩個存儲器的輸出相加得出最終響應(yīng)。

5.實驗

我們報告表2中所有模型和任務(wù)的響應(yīng)準(zhǔn)確度(即從所有可能的答案中選出正確的候選答復(fù)的百分比)。行顯示任務(wù)PT1-PT5和列2-5給出每個模型的準(zhǔn)確性。 模型的超參數(shù)在驗證集上進(jìn)行了優(yōu)化(值在附錄C中提供)。

表2:跨模型和任務(wù)的測試結(jié)果。 對于內(nèi)存網(wǎng)絡(luò),第一個數(shù)字是每個任務(wù)的完整對話的準(zhǔn)確性,括號中的數(shù)字是小組(含1000輪對話)的準(zhǔn)確性。 所有其他型號僅在完整set上進(jìn)行評估。

image.png

手工制作的系統(tǒng)。正如預(yù)期的那樣,手工制定的基于規(guī)則的系統(tǒng)勝過所有機(jī)器學(xué)習(xí)模型并完美地解決了所有5個任務(wù)。 然而,重要的是要注意,為實際對話構(gòu)建基于規(guī)則的系統(tǒng)并非易事:我們的任務(wù)使用有限的詞匯量和固定的語音模式。 因此,我們希望用它們分析機(jī)器學(xué)習(xí)算法的優(yōu)缺點。

監(jiān)督嵌入。與Bordes和Weston [2016]的bAbI對話任務(wù)中報告的結(jié)果相比,監(jiān)督嵌入在修改后的任務(wù)上表現(xiàn)更差。 該模型無法成功完成任何任務(wù),并且PT2-PT5的每個響應(yīng)精度極低。 由于詞匯量增加了四倍,候選集規(guī)模增加了十倍,我們將這種性能下降歸因于我們?nèi)蝿?wù)復(fù)雜性的增加。

記憶網(wǎng)絡(luò)的演講風(fēng)格。記憶網(wǎng)絡(luò)在所有任務(wù)中大大優(yōu)于監(jiān)督嵌入。 他們以非常高的準(zhǔn)確度完成了PT1和PT2(發(fā)布和更新API調(diào)用)。 這表明該模型能夠隱式跟蹤對話狀態(tài)并根據(jù)用戶的配置文件個性化機(jī)器人的話語。 表5至表6顯示了每次對話時讀取的內(nèi)存部分的可視化。

拆分記憶模型進(jìn)行個性化推理。PT3-PT5的結(jié)果表明,Memory Networks無法可靠地在會話中使用KB事實和配置文件信息。 具有分割內(nèi)存功能的內(nèi)存網(wǎng)絡(luò)明顯優(yōu)于PT3的標(biāo)準(zhǔn)體系結(jié)構(gòu),從而在完整對話任務(wù)PT5上實現(xiàn)更好的性能。 表8至表11中對模型注意力的可視化和分析表明,標(biāo)準(zhǔn)記憶網(wǎng)絡(luò)無法解釋關(guān)于實體的知識并將其與用戶的屬性相關(guān)聯(lián),而拆分記憶有助于在分類餐館時將概要信息與正確的知識庫結(jié)合起來 PT3)或提供關(guān)于它們的附加信息(在PT4中)。

訓(xùn)練困難。盡管大量的超參數(shù)調(diào)整,分割記憶模型很難訓(xùn)練PT1和PT2。 訓(xùn)練收斂的準(zhǔn)確性明顯低于標(biāo)準(zhǔn)模型,導(dǎo)致測試精度降低,并且表明更簡單的模型更適合于不需要對內(nèi)存中的各種實體進(jìn)行組合推理的任務(wù)。 一般來說,為知識庫中每個實體學(xué)習(xí)可區(qū)分的嵌入被證明是所有模型的挑戰(zhàn)。

個性化的通用體系結(jié)構(gòu)。雖然沒有一個模型能夠充分解決PT3和PT4,但分配內(nèi)存架構(gòu)的內(nèi)存網(wǎng)絡(luò)結(jié)果令人鼓舞。 我們相信這樣的修改不是特定于內(nèi)存網(wǎng)絡(luò)的,并且可以應(yīng)用于任何通用對話模型,其存儲和通過對話輪流的原因。

6.多任務(wù)學(xué)習(xí)

我們在多任務(wù)學(xué)習(xí)場景中分析了內(nèi)存網(wǎng)絡(luò)架構(gòu),以進(jìn)行全面對話。我們針對演講風(fēng)格變化的6個配置文件排列中的每一個訓(xùn)練了各個配置文件特定的模型,并將其性能與單個多配置文件模型進(jìn)行了比較。每個特定配置文件模型都是在機(jī)器人和具有相應(yīng)年齡和性別組合(總共6000個對話框)的用戶之間進(jìn)行1000次完整對話的培訓(xùn)。 多輪廓模型在相同的6000個完整對話框上訓(xùn)練,包含全部6個用戶配置文件。 對于每個配置文件,我們在表3中的1000個測試對話框(具有相同配置文件的用戶)上報告針對特定配置文件和多配置文件模型的每個響應(yīng)精度。

多模型明顯優(yōu)于每個profile特定模型,表明在具有多個profile的對話框上訓(xùn)練單個模型,這些profile共享邏輯和詞匯是一種有效的學(xué)習(xí)策略。 我們將這種顛簸的準(zhǔn)確性歸因于學(xué)習(xí)6個用戶配置文件中的共享特征,這可以通過比較表12中兩種策略的注意力權(quán)重來加以說明。

image.png

結(jié)論

本文旨在通過引入一個面向目標(biāo)的對話框的新數(shù)據(jù)集,以及與每個對話框關(guān)聯(lián)的用戶配置文件,彌合神經(jīng)對話代理研究領(lǐng)域的空白。 該數(shù)據(jù)集充當(dāng)端到端目標(biāo)導(dǎo)向型會話代理的培訓(xùn)和分析的試驗臺,其必須基于用戶簡檔中的屬性個性化與用戶的對話。 面向目標(biāo)的對話的關(guān)鍵方面已被分解為各種綜合生成的任務(wù),以便在將模型應(yīng)用于實際數(shù)據(jù)之前,以系統(tǒng)的方式評估模型的優(yōu)缺點。 盡管這些任務(wù)的語言和場景是人為的,但我們相信建立可以解決這些任務(wù)的機(jī)制是開發(fā)諸如餐廳預(yù)訂,客戶服務(wù)或數(shù)字助理等領(lǐng)域的復(fù)雜個性化對話系統(tǒng)的合理起點。

另外,我們演示了如何使用我們的任務(wù)來分解基于內(nèi)存網(wǎng)絡(luò)的對話系統(tǒng)。 該模型無法執(zhí)行組合推理或個性化來解決任務(wù),表明需要對這些方面的學(xué)習(xí)方法進(jìn)行進(jìn)一步的工作。 為實現(xiàn)這一目標(biāo),我們提出了一種分離式內(nèi)存架構(gòu),用于端到端訓(xùn)練的對話代理,從而提高整體性能。

最后,我們展示了將對話中的個性化作為多任務(wù)學(xué)習(xí)問題而不是為各種用戶配置文件訓(xùn)練單獨模型的優(yōu)勢。 我們發(fā)現(xiàn),聯(lián)合訓(xùn)練模型明顯優(yōu)于特定于個人資料的模型,并且能夠利用各種對話樣式之間的共享特征和關(guān)系。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,176評論 25 708
  • 1、第八章 Samba服務(wù)器2、第八章 NFS服務(wù)器3、第十章 Linux下DNS服務(wù)器配站點,域名解析概念命令:...
    哈熝少主閱讀 3,910評論 0 10
  • 正當(dāng)我把車子泊好的時候,忽然聽到一陣物體相撞的聲音,沒錯老婆出車禍了。車牌號為a88868的肇事車輛揚長而去。我似...
    風(fēng)已過半閱讀 228評論 0 1
  • 工作中用到的別人的測試代碼,代碼當(dāng)然自己也可以寫,看懂了,然后按照自己的需求來改,效率更高 1. Linux 線程...
    megar閱讀 349評論 0 0
  • 本來想過可能今天的一首《你瞞我瞞》會變成以后的回憶沒想到如今就已經(jīng)回不去。 感覺生命里的每一次相逢都是際遇,那...
    Anfy閱讀 866評論 1 3

友情鏈接更多精彩內(nèi)容