筆者會(huì)以產(chǎn)品經(jīng)理的視角來(lái)寫(xiě)技術(shù)相關(guān)的文章,在前面的文章中簡(jiǎn)要的介紹了知識(shí)圖譜的概念,構(gòu)建以及基本應(yīng)用形式。這篇文章主要介紹如何判斷問(wèn)答場(chǎng)景是否適合知識(shí)圖譜。
什么是知識(shí)圖譜的問(wèn)答
業(yè)界通用的問(wèn)答系統(tǒng)是以Q&A為中心構(gòu)建問(wèn)答,需要運(yùn)營(yíng)去窮舉用戶(hù)的所有的問(wèn)題(question),然后給每個(gè)問(wèn)題配上相應(yīng)的答案。然后算法用Q-Qmatch解析到運(yùn)營(yíng)配置的問(wèn)題(question)上,召回答案(answer)返回給用戶(hù)。目前廣泛用于語(yǔ)音助手,客服機(jī)器人當(dāng)中,案例:三星BIXBY語(yǔ)音助手,小I機(jī)器人。
知識(shí)圖譜的問(wèn)答和是以知識(shí)為中心,通過(guò)將用戶(hù)的問(wèn)題匹配到對(duì)應(yīng)知識(shí)上,然后通過(guò)召回知識(shí)返回給用戶(hù),匹配算法一般使用的是 KB-QA,中間會(huì)涉及到圖查詢(xún),命名實(shí)體識(shí)別(NER),屬性識(shí)別,推理引擎等技術(shù)。
知識(shí)圖譜的問(wèn)答有哪些特點(diǎn)
1.可以基于海量原生知識(shí)去進(jìn)行問(wèn)答,QA系統(tǒng)的A一般是運(yùn)營(yíng)深度加工過(guò)的,例如很人性化的話(huà)術(shù),圖片等等
2.問(wèn)答容量更大,常規(guī)的QA系統(tǒng)在Q超過(guò)一定數(shù)量之后算法的召回準(zhǔn)確率會(huì)急劇下降
3.這個(gè)比較難一句話(huà)說(shuō)完,問(wèn)答一般是有邏輯的,QA系統(tǒng)一般是由運(yùn)營(yíng)去解析用戶(hù)問(wèn)題中的邏輯,知識(shí)圖譜的問(wèn)答可以將這個(gè)邏輯讓機(jī)器去解析,簡(jiǎn)單來(lái)說(shuō)就是推理。后面會(huì)有案例講到。
4.因?yàn)槭且灾R(shí)為中心去做問(wèn)答,對(duì)話(huà)管理模塊會(huì)更好做,在信息不確定的情況下可以多輪會(huì)話(huà),人對(duì)話(huà)的時(shí)候會(huì)經(jīng)常省略一些內(nèi)容,可以通過(guò)上下文做意圖繼承。
5.擴(kuò)充實(shí)體的訓(xùn)練邊際成本極低,運(yùn)營(yíng)成本極低
6.擴(kuò)充schema的訓(xùn)練成本較高,變動(dòng)成本極高
如何選擇場(chǎng)景
價(jià)值:產(chǎn)生的問(wèn)答效果,積累下來(lái)的領(lǐng)域數(shù)據(jù),商業(yè)上能夠致勝等等
成本:包括技術(shù)成本,構(gòu)建成本,時(shí)間成本,后期運(yùn)營(yíng)成本等等
一個(gè)最基本的衡量標(biāo)準(zhǔn)是產(chǎn)生的價(jià)值>成本即可。
根據(jù)上述的知識(shí)圖譜特點(diǎn),將成本進(jìn)行拆分:

挑選成本可控,價(jià)值比較明確的場(chǎng)景即可。
業(yè)內(nèi)案例
目前工業(yè)界使用知識(shí)圖譜作為主要問(wèn)答解析方式的其實(shí)不多,實(shí)際應(yīng)用中會(huì)更關(guān)注覆蓋率,已經(jīng)擴(kuò)充的便捷性,而這一點(diǎn)恰好是QA系統(tǒng)的強(qiáng)項(xiàng)。
案例1:i問(wèn)財(cái)-產(chǎn)業(yè)鏈推理
案例介紹,I問(wèn)財(cái)本身是基于結(jié)構(gòu)化知識(shí)去做問(wèn)答,例如通過(guò)股票的各種知識(shí)找股票,比較復(fù)雜的產(chǎn)業(yè)鏈推理如下圖所示,筆者估計(jì),其背后是一套網(wǎng)羅了中國(guó)所有公司的圖譜,包含了產(chǎn)業(yè),產(chǎn)品,公司,產(chǎn)品和產(chǎn)品之間的關(guān)系,公司和產(chǎn)品之間的關(guān)系。通過(guò)復(fù)雜的關(guān)系網(wǎng)絡(luò)去做知識(shí)推理,不過(guò)估計(jì)是因?yàn)檎Z(yǔ)義解析成本的關(guān)系,沒(méi)有做的很豐富。從這點(diǎn)看,可能是平衡好價(jià)值和成本。
網(wǎng)址:www.iwencai.com

案例2-淘寶直播
最近在看淘寶直播的小哥哥小姐姐的時(shí)候,驚奇的發(fā)現(xiàn),有些主播,我問(wèn)主播的一些信息的時(shí)候會(huì)有回復(fù),例如,我讓主播試一下8號(hào)寶貝,系統(tǒng)會(huì)返回主播已經(jīng)穿過(guò)這個(gè)了,然后把之前的錄播視頻發(fā)你了。覺(jué)得比較有意思,有時(shí)候還問(wèn)問(wèn)10號(hào)寶貝有沒(méi)有優(yōu)惠券啥的,系統(tǒng)會(huì)讓你領(lǐng)10號(hào)寶貝的優(yōu)惠券。再試了一下啊,發(fā)現(xiàn)還能問(wèn)三圍什么的- -。不知道以后會(huì)不會(huì)問(wèn)他的年收入都能問(wèn)的出來(lái)。估摸著是手淘這邊用這類(lèi)知識(shí)構(gòu)建的直播領(lǐng)域圖譜,順便做了個(gè)問(wèn)答。
