京東數(shù)據(jù)團(tuán)隊曾經(jīng)出了一片關(guān)于對話系統(tǒng)的論文《A Survey on Dialogue Systems:Recent Advances and New Frontiers(智能對話系統(tǒng)調(diào)查:前沿與進(jìn)展)》,全文引用了124篇論文,是一篇綜合全面的介紹對話系統(tǒng)的文章。
論文原文地址:
https://www.kdd.org/exploration_files/19-2-Article3.pdf
公眾號“機(jī)器學(xué)習(xí)算法全棧工程師”對這篇論文的內(nèi)容進(jìn)行了解讀,主要概述了對話系統(tǒng),尤其是對話系統(tǒng)在深度學(xué)習(xí)方面的進(jìn)展,還討論了可能的研究方向。以下是主要架構(gòu):

奇點機(jī)智對這篇文章進(jìn)行了進(jìn)一步的拆解,分成四篇文章來介紹智能對話系統(tǒng)。
讀懂智能對話系統(tǒng)(1)任務(wù)導(dǎo)向型對話系統(tǒng)
讀懂智能對話系統(tǒng)(3)對話系統(tǒng)的未來發(fā)展
來源:機(jī)器學(xué)習(xí)算法全棧工程師
作者:蒙康
對話系統(tǒng)的未來發(fā)展
深度學(xué)習(xí)已成為對話系統(tǒng)的一項基本技術(shù)。研究人員將神經(jīng)網(wǎng)絡(luò)應(yīng)用于傳統(tǒng)任務(wù)導(dǎo)向型對話系統(tǒng)的不同組成部分,包括自然語言理解、自然語言生成、對話狀態(tài)跟蹤。近年來,端到端的框架不僅在非面向任務(wù)的聊天對話系統(tǒng)中流行,而且在面向任務(wù)的對話系統(tǒng)中逐步流行起來。
深度學(xué)習(xí)能夠利用大量的數(shù)據(jù),從而模糊了任務(wù)導(dǎo)向型對話系統(tǒng)和非任務(wù)導(dǎo)向型對話系統(tǒng)之間的界限。值得注意的是,目前的端到端模型仍然遠(yuǎn)非完美。盡管取得了上述成就,但這些問題仍然具有挑戰(zhàn)性。接下來,我們將討論一些可能的研究方向。
快速適應(yīng)
雖然端到端模型越來越引起研究者的重視,我們?nèi)匀恍枰趯嶋H工程中依靠傳統(tǒng)的管道(pipeline)方法,特別是在一些新的領(lǐng)域,特定領(lǐng)域?qū)υ挃?shù)據(jù)的收集和對話系統(tǒng)的構(gòu)建是比較困難的。未來的趨勢是對話模型有能力從與人的交互中主動去學(xué)習(xí)。
深度理解
現(xiàn)階段基于神經(jīng)網(wǎng)絡(luò)的對話系統(tǒng)極大地依賴于大量標(biāo)注好的數(shù)據(jù),結(jié)構(gòu)化的知識庫以及對話語料數(shù)據(jù)。在某種意義上產(chǎn)生的回復(fù)仍然缺乏多樣性,有時并沒有太多的意義,因此對話系統(tǒng)必須能夠更加有效地深度理解語言和真實世界。
隱私保護(hù)
目前廣泛應(yīng)用的對話系統(tǒng)服務(wù)于越來越多的人。很有必要注意到的事實是我們使用的是同一個對話助手。通過互動、理解和推理的學(xué)習(xí)能力,對話助手可以無意中隱蔽地存儲一些較為敏感的信息。因此,在構(gòu)建更好的對話機(jī)制時,保護(hù)用戶的隱私是非常重要的。