筆者寫了一篇知識(shí)圖譜在搜索與推薦中的應(yīng)用,這篇文章會(huì)著重講講問答系統(tǒng)中的人機(jī)交互和自然語言處理相關(guān)的問題。簡(jiǎn)單聊聊人機(jī)交互,目前人機(jī)交互的常見場(chǎng)景有如下三種:閑聊型(Chatbot)、問答型(QA)、任務(wù)型(VPA)。
閑聊型,典型的應(yīng)用案例是微軟小冰,你可以和小冰進(jìn)行閑聊
問答型,典型的應(yīng)用案例是度秘、小螞答,基于問答的方式與用戶進(jìn)行交互
任務(wù)型,cortana和siri應(yīng)該可以算這個(gè)類型的
本文主要著重講解知識(shí)圖譜在問答型產(chǎn)品中的應(yīng)用。
我偏笑_NSNirvana 在QA問句解析的七種方法及優(yōu)化思路中談到了幾種QA的方案?
根據(jù)筆者研究,目前問答系統(tǒng),特別是封閉式的問答系統(tǒng)中,商業(yè)化公司一般會(huì)偏向兩類方案:1.基于模板匹配的方案 ?2.基于知識(shí)圖譜的方案
兩種方案都有各自的優(yōu)勢(shì)。
模板匹配方案項(xiàng)目容易啟動(dòng),并且能夠很快速的解決基礎(chǔ)核心問題,但是由于結(jié)構(gòu)問題,不能很好的理解上下文,還有意圖模糊的問題。該方法最大的風(fēng)險(xiǎn)因素在人這一塊,因?yàn)闃?gòu)建規(guī)則庫到后期成本會(huì)越來越高,而且沖突會(huì)越來越多,總體來說,這是一個(gè)很好做,但是上限不高的方案。如果說只需要滿足基礎(chǔ)的核心QA需求,這種方案是不錯(cuò)的選擇,目前采用這種方案的bot:網(wǎng)易七魚,中國(guó)電信客服機(jī)器人
知識(shí)圖譜方案能夠更好的理解語言中的抽象部分,更好的去對(duì)語言中模糊的部分通過交互來確認(rèn)信息。在推薦上能夠鎖定較少,較為精確的推薦結(jié)果,在算法上會(huì)比較好實(shí)現(xiàn)。目前采用這種方案的bot:度秘、阿里小蜜、小螞答。其中小蜜和小螞答的構(gòu)建方案大體類似,由于用戶需求的不同,采用了不同的應(yīng)用方案才造成了產(chǎn)品形態(tài)上的差異。度秘的構(gòu)建方案有別于阿里小蜜。
之前介紹了知識(shí)圖譜的schema的構(gòu)建方案,but,那是基于common sense的構(gòu)建方案,QA系統(tǒng)中的構(gòu)建方案會(huì)有別于common sense的構(gòu)建方案,常規(guī)的common sense知識(shí)圖譜構(gòu)建的抽象層一般來說是type,property這一塊一般是具體的概念,例如姚明的老婆, 阿里的方案是將property進(jìn)行抽象化,例如:(找回密碼,semantic of,如何找回密碼?),通過這些抽象的邊,去描述實(shí)體之間的關(guān)系,然后通過圖遍歷的方式去構(gòu)建交互體系。

下面是百度度秘的意圖圖譜有關(guān)的資料
百度的意圖圖譜技術(shù)。與我之前講過的實(shí)體圖譜不同,意圖圖譜的節(jié)點(diǎn)代表一個(gè)個(gè)意圖節(jié)點(diǎn)。這些“意圖”之間的關(guān)系包括需求澄清(disambiguation)、需求細(xì)化(depth extension)、需求橫向延展(breadth extension )等。在下圖所示例子中,當(dāng)“阿拉斯加”的意思是“阿拉斯加州”時(shí),與之關(guān)聯(lián)的意圖是城市、旅游等信息。當(dāng)“阿拉斯加”的含義是“阿拉斯加犬”時(shí),它延伸的意圖是寵物狗、寵物狗護(hù)理,以及如何喂食等。

這樣的意圖圖譜可用于人機(jī)對(duì)話系統(tǒng)當(dāng)中,下面讓我們來看一個(gè)度秘基于意圖圖譜的用戶引導(dǎo)例子。

用戶想要查詢關(guān)于“金毛”的信息,基于意圖圖譜,度秘提供給用戶關(guān)于金毛的一般信息;接著進(jìn)入第二輪,用戶點(diǎn)擊了“我想要一只金毛”的選項(xiàng),度秘便可以猜測(cè)用戶接下來會(huì)想要知道“如何喂養(yǎng)一只金毛”、“什么樣的人適合養(yǎng)此類犬”等信息,并將這些引導(dǎo)項(xiàng)展現(xiàn)給用戶。然后用戶點(diǎn)擊了“喂養(yǎng)一只金毛容易嗎”的選項(xiàng)。對(duì)話進(jìn)行到此輪,用戶的需求基本被滿足了。