知識圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系,將互聯(lián)網(wǎng)信息表達成更接近人類認知世界的形式,目前主要應用于搜索、推薦、智能問答等領(lǐng)域,接下來會簡要整理目前主要的KG落地應用。
[ 相關(guān)筆記 ]
產(chǎn)品 | 知識圖譜落地應用:金融投資領(lǐng)域
1. 搜索
知識圖譜技術(shù)最先應用于搜索,最初由谷歌公司在2012年5月提出(2012年5月17日,谷歌發(fā)布知識圖譜項目,并宣布以此為基礎(chǔ)構(gòu)建下一代智能化搜索引擎)。知識圖譜技術(shù)在搜索的落地包括:
a. 語義搜索:實現(xiàn)Web從網(wǎng)頁鏈接向概念鏈接轉(zhuǎn)變,支持用戶按主題而不是字符串檢索
b. 關(guān)系搜索:獲取兩個實體之間的關(guān)系,例如公司之間的關(guān)系、人物之間的關(guān)系等
c. 結(jié)構(gòu)化展現(xiàn):以圖形化方式向用戶展示經(jīng)過分類整理的結(jié)構(gòu)化知識,從而使人們從人工過濾網(wǎng)頁尋找答案的模式中解脫出來
1.1 語義搜索
a. 關(guān)鍵詞增強型
[ 原理 ] 核心仍然是傳統(tǒng)的搜索引擎,知識圖譜技術(shù)以多種途徑被用來增強關(guān)鍵詞搜索,以此來改善搜索的查全率和查準率?;驹硎鞘孪榷x詞的同義詞、上下位詞等詞集合,當關(guān)鍵詞被檢索時,其他與該關(guān)鍵詞相關(guān)的詞也通過圖搜索的方式也被檢索出來,用來擴展或約束搜索
[ 場景 ] 更加全面、準確的查找自己需要的信息
[ 落地 ] 谷歌、百度等
e.g 在谷歌中搜“西紅柿”,可以檢索到“番茄”的相關(guān)結(jié)果(不一定是用KG技術(shù)實現(xiàn)的,但基本意思是這樣)

b. 答案檢索型
[ 原理 ] 對用戶使用自然語言提出的問題進行語義分析和語法分析,進而將其轉(zhuǎn)化成結(jié)構(gòu)化形式的查詢語句,然后在知識圖譜中查詢答案
[ 場景 ] 直接找到問題的答案,而非大量的網(wǎng)頁鏈接
[ 落地 ] 谷歌、百度等(部分查詢)
e.g.1 在百度搜索“阿里巴巴市值”,結(jié)果list中的第一條直接返回答案

e.g.2 在百度中搜索“馬云的妻子的兒子”(不一定是用KG技術(shù)實現(xiàn)的,但基本意思是這樣),結(jié)果list中的第一條直接返回答案


1.2 關(guān)系搜索
[ 場景 ] 快速準確地查詢兩個實體之間的關(guān)系
[ 落地 ] 天眼查、全歷史


1.3 結(jié)構(gòu)化展現(xiàn)
系統(tǒng)收集信息,建立知識庫,用戶通過圖形用戶接口(可視化的本體概念樹)或關(guān)鍵詞提交查詢,系統(tǒng)返回用戶所查找概念的所有實例
[ 場景1 ] 快速有效地檢索出某個概念的所有實例
例如:天眼查、全歷史、Magi
e.g.1 在天眼查(網(wǎng)頁)中搜索“騰訊公司”,可查看與該公司有關(guān)系的實例(法人、分支機構(gòu)等)

e.g.2 在全歷史(app)關(guān)系圖譜模塊點擊“秦始皇”,系統(tǒng)返回秦始皇相關(guān)的實例(親情、敵對、成就等),再依次點擊“成就--韓國”,可查看秦始皇滅掉韓國的成就

e.g.3 在Magi中搜索“智能問答”,返回對應的實體、關(guān)系及屬性等信息

[ 場景2 ] 解決一詞多義的情況
通常情況下,詞語只有在特定的語境之下才能表達出精確的意思,單獨搜索某個詞語經(jīng)常會面臨一詞多義的情況。 例如“蘋果”可以是一種水果,也可以是科技公司、手機、電腦;泰姬陵( Taj Mahal) 既可以指一個遺跡,也可以指一個音樂家。如果我們在谷歌中搜索“泰姬陵 ”,在右側(cè),谷歌會給出泰姬陵的地圖及相關(guān)介紹,也會在下方將同名的條目列出來。借助知識圖譜, 谷歌可以理解實體和實體含義間的細微差別,并且將所有可能的結(jié)果歸納分組,讓檢索更加智能。
