產(chǎn)品 | 知識圖譜落地應(yīng)用:金融投資領(lǐng)域

[ 相關(guān)筆記 ]

產(chǎn)品 | 知識圖譜落地應(yīng)用:搜索

產(chǎn)品 | 知識圖譜落地應(yīng)用:推薦

產(chǎn)品 | 知識圖譜落地應(yīng)用:智能問答

行業(yè)需求及痛點(diǎn)

傳統(tǒng)投資研究場景下,分析師需要從新聞、財(cái)報(bào)、研報(bào)、行業(yè)網(wǎng)站等多個(gè)渠道獲取大量數(shù)據(jù)、信息和知識形式的“素材”,然后通過邏輯梳理將這些“素材”進(jìn)一步組織,輸出可供投資決策的看法和建議。但在這個(gè)過程中經(jīng)常面臨如下問題:

a. 效率低、耗時(shí)耗力:金融資訊信息非常豐富,且更新快(信息涉及公司新聞、股票、證券、宏觀經(jīng)濟(jì)、政策法規(guī)、社交媒體評論等),從如此多的信息中準(zhǔn)確找到相關(guān)文章并逐篇分析是費(fèi)時(shí)費(fèi)力的。

b. 門檻高、人才流動影響大:某些行業(yè)和產(chǎn)業(yè)的上下游較為復(fù)雜,是否將其梳理清楚直接決定了能否駕馭該領(lǐng)域,而這些梳理后的知識基本都存在分析師的大腦里,一旦分析師離職,將直接影響這個(gè)行業(yè)分析的延續(xù)。

面向客戶

各種一二級市場的投資機(jī)構(gòu)(公募、私募、PE、VC、產(chǎn)業(yè)基金、金融集團(tuán)等)、券商(投行部、研究部)、咨詢公司、監(jiān)管部門(證監(jiān)會、交易所)、銀行、財(cái)經(jīng)媒體、產(chǎn)業(yè)園區(qū)、企業(yè)等。

解決方案

人工智能技術(shù)可以拓寬投資信息來源,減少基礎(chǔ)數(shù)據(jù)處理的工作量,提高信息獲取的效率,通過自動化的數(shù)據(jù)分析,為投資決策提供參考,從而提高投資研究的效率。涉及的底層技術(shù)包括圖像識別、自然語言處理、知識圖譜、情感分析等。其中,就知識圖譜技術(shù)來說,落地應(yīng)用主要包括三類:

一是基礎(chǔ)數(shù)據(jù)服務(wù):將多源金融數(shù)據(jù)和信息實(shí)現(xiàn)知識結(jié)構(gòu)化,進(jìn)而為客戶提供可視化、智能搜索、智能客服等服務(wù)。

二是事件影響分析:構(gòu)建事件圖譜,研究事件對于發(fā)生實(shí)體的影響,為客戶提供投資預(yù)測、監(jiān)測預(yù)警等服務(wù)。

三是不一致性檢驗(yàn):為客戶提供風(fēng)險(xiǎn)評估與反欺詐等服務(wù)。

1. 基礎(chǔ)數(shù)據(jù)服務(wù):金融知識結(jié)構(gòu)化

1.1 基本思想

從較大范圍獲取數(shù)據(jù)(包括但不限于工商數(shù)據(jù)、證監(jiān)會官網(wǎng)、基金業(yè)協(xié)會官網(wǎng)、公司官網(wǎng)和公眾號、專利數(shù)據(jù)、招聘網(wǎng)站、新聞等),清洗并將其結(jié)構(gòu)化,形成知識網(wǎng)絡(luò),最后以可視化的形式展現(xiàn)出來,供用戶搜索、管理、再組織,或者將知識圖譜當(dāng)做知識庫,通過KBQA為金融問答系統(tǒng)、智能客服系統(tǒng)、金融智能搜索等業(yè)務(wù)提供支持。

1.2 產(chǎn)品價(jià)值

基于知識圖譜建立的金融知識網(wǎng)絡(luò)有兩大優(yōu)勢:一是“規(guī)則化”。構(gòu)建過程摒棄了傳統(tǒng)人工選擇的方式,具有固定的生成規(guī)則,便于回溯和更新迭代。二是“時(shí)序化”。節(jié)點(diǎn)和關(guān)系信息會隨著時(shí)間的變化不斷更新。 例如, 如果某個(gè)棉花種植公司主營業(yè)務(wù)變更為棉花加工, 那么它在產(chǎn)業(yè)鏈中的位置就從上游變?yōu)橹杏巍?/p>

1.3 主要難點(diǎn)

金融知識圖譜的構(gòu)建需要依據(jù)大量先驗(yàn)信息, 例如如棉花的上游產(chǎn)業(yè)、下游產(chǎn)品分別包括哪些對象,先驗(yàn)信息的獲取與分析是能否構(gòu)建有效知識圖譜的關(guān)鍵。

1.4 典型落地場景

(1)產(chǎn)業(yè)鏈挖掘

公司主營產(chǎn)品信息、公司所屬行業(yè),產(chǎn)品所屬細(xì)分行業(yè),產(chǎn)品上下游、行業(yè)上下游等信息構(gòu)成了實(shí)體公司的投資分析基礎(chǔ),這些數(shù)據(jù)都屬于產(chǎn)業(yè)鏈數(shù)據(jù),是分析師做投資研究的基礎(chǔ)數(shù)據(jù)。

例如, 將有棉布經(jīng)營的相關(guān)主營業(yè)務(wù)的公司“實(shí)體” 與棉花服務(wù)中的“棉布經(jīng)營” 鏈接, 而“棉花經(jīng)營”從屬于棉花產(chǎn)業(yè)鏈中的“中游”這一概念,即可得到該公司處于棉花產(chǎn)業(yè)鏈的中游。

(2)公司股權(quán)挖掘

公司的股權(quán)關(guān)系包括:股東關(guān)系、投資關(guān)系、母子公司關(guān)系、擔(dān)保關(guān)系、質(zhì)押關(guān)系等等,一個(gè)公司的股權(quán)信息代表了一個(gè)實(shí)體公司在金融層面的一些運(yùn)作,股權(quán)投資、股權(quán)激勵、增資擴(kuò)股、股權(quán)質(zhì)押、股權(quán)擔(dān)保等都屬于這類業(yè)務(wù),股權(quán)結(jié)構(gòu)的變化可能會體現(xiàn)出公司的經(jīng)營風(fēng)險(xiǎn)、業(yè)務(wù)前景等。

1.5 代表公司

AlphaSensehttps://www.alpha-sense.com/index.html),成立于 2008 年,其從文件、 新聞和研究報(bào)告等碎片化信息中集合所有投資信息,通過語義分析構(gòu)建成知識圖譜, 整合相關(guān)概念、主題、行業(yè)等,并提供高級語義搜索引擎、智能問答、交互式知識管理系統(tǒng)、文檔(知識)協(xié)作系統(tǒng),以對金融知識進(jìn)行更加有效的管理、搜索、使用。

2. 事件圖譜:事件影響分析

2.1 基本思想

將新聞、公告、輿情等各類資訊,用人工智能分類的方法進(jìn)行事件類型識別,將識別好的事件和關(guān)聯(lián)主體跟金融知識圖譜做關(guān)聯(lián),從而形成事件圖譜。當(dāng)知識圖譜中的某個(gè)節(jié)點(diǎn)受到?jīng)_擊時(shí),會通過圖網(wǎng)絡(luò)輻射到其他關(guān)聯(lián)實(shí)體。

2.2 產(chǎn)品價(jià)值

通過知識圖譜可以構(gòu)建事件驅(qū)動策略,研究事件對于發(fā)生實(shí)體的影響。例如原材料漲價(jià),對行業(yè)上下游的公司有什么影響?某P2P平臺暴雷,這個(gè)風(fēng)險(xiǎn)事件對上市公司會有什么影響?CPI拐點(diǎn)出現(xiàn),該指標(biāo)對哪些行業(yè)、哪些公司有哪些影響?

以“蘋果公司 iPhone 5s 推出時(shí),市場評價(jià)不佳,公司股價(jià)應(yīng)聲下挫”這一事件為例,傳統(tǒng)策略主要有兩個(gè)特點(diǎn):一是人工處理,即 iphones 5s 產(chǎn)品市場評價(jià)與蘋果公司股票價(jià)格之間的關(guān)系,主要通過人工確認(rèn);二是不夠深入,只研究直接發(fā)生事件的實(shí)體的股價(jià)表現(xiàn),而忽略了間接事件的影響。借助知識圖譜,則可以實(shí)現(xiàn)更為及時(shí)、深入的事件驅(qū)動策略

2.3 主要難點(diǎn)

基于事件圖譜,我們可以回答哪些公司有可能會被某事件影響,但僅僅是“有可能”,具體會不會有強(qiáng)相關(guān)性必須由數(shù)據(jù)來驗(yàn)證。因此,事件圖譜只是將我們所需要關(guān)注的范圍很快圈定下來,后續(xù)如果要進(jìn)一步分析具體影響程度,必須要有影響模型、以及歷史數(shù)據(jù)才能在知識圖譜中做進(jìn)一步推理以及計(jì)算。

2.4 典型落地場景

(1)投資預(yù)測

分析某一事件對有價(jià)證券價(jià)格的影響,生成投資信號,提高投資者對非結(jié)構(gòu)化信息的應(yīng)用效率。例如,通過“主營業(yè)務(wù)產(chǎn)品”關(guān)系將 iphone 5s 與蘋果公司關(guān)聯(lián),再通過提及關(guān)系將 twitter 評論與 iphone 5s 相關(guān)聯(lián)。當(dāng) twitter 評論出現(xiàn)負(fù)面情緒時(shí),就可以通過這兩層關(guān)系快速鏈接到蘋果公司股價(jià),生成投資信號。其次,通過“主要供應(yīng)商”這一關(guān)系將蘋果公司鏈接到富士康,富士康的股價(jià)在這一事件發(fā)生后同樣出現(xiàn)大跌,原因就是“產(chǎn)品市場認(rèn)可度較差”這一事件在網(wǎng)絡(luò)中的傳播。

(2)監(jiān)測預(yù)警

通過資訊輿情分析,對金融輿情進(jìn)行監(jiān)控,發(fā)現(xiàn)事件影響進(jìn)行預(yù)警。例如“行業(yè)的原材料價(jià)格上漲”這一事件,會沿著企業(yè)的上下游產(chǎn)業(yè)鏈進(jìn)行傳遞,我們可以識別出波及到的企業(yè),命中事件傳播波動相關(guān)性標(biāo)的、事件要素投研邏輯相關(guān)性標(biāo)的等,從而為相應(yīng)投資人提供相關(guān)標(biāo)的的智能資訊服務(wù),例如持倉/自選股預(yù)警、投顧等輔助服務(wù)。

2.5 代表公司

kenshohttps://www.kensho.com/),主要產(chǎn)品為warren問答引擎,通過監(jiān)測財(cái)報(bào)發(fā)布、全球數(shù)據(jù)環(huán)境、經(jīng)濟(jì)報(bào)告、公司產(chǎn)品發(fā)布、FDA藥品批準(zhǔn)等等多方面的信息,建立起事件與資產(chǎn)之間的相關(guān)性,從而預(yù)測資產(chǎn)價(jià)格走勢。2017年初,該公司成功預(yù)測了特朗普當(dāng)選后, 美元重回漲勢, 以及科技股的反彈。

3. 不一致性檢驗(yàn):風(fēng)險(xiǎn)評估與反欺詐

通過對多路徑的不一致性或“關(guān)系” 沖突的檢驗(yàn)和合并,進(jìn)行業(yè)務(wù)排雷、風(fēng)險(xiǎn)評估與反欺詐等。例如欺詐團(tuán)伙通常會用虛假的身份和信息進(jìn)行詐騙,不一致性驗(yàn)證可以用來判斷一個(gè)借款人是否具有欺詐風(fēng)險(xiǎn):借款人 A 和 B 分別填寫了兩家不同的公司, 但是填寫的公司電話卻是同一個(gè),這種情況便無法通過不一致性檢驗(yàn),從而形成一個(gè)風(fēng)險(xiǎn)點(diǎn)。

Reference

1. 中泰證券 | 人工智能在投研的應(yīng)用

2. 海通證券 | 金融科技( Fintech)和數(shù)據(jù)挖掘研究( 二)——知識圖譜的構(gòu)建與應(yīng)用

3. 恒生研究院 | NLP和知識圖譜在金融科技領(lǐng)域的應(yīng)用場景

4. 鮑捷 | 智能金融的核心引擎:一覽與前瞻

5. 恒生技術(shù)之眼 | 從數(shù)據(jù)到智慧,知識圖譜如何推動金融更智能?

6. 恒生技術(shù)之眼 | 關(guān)于金融知識圖譜的落地,你需要知道

7. 待字閨中 | 知識圖譜驅(qū)動投資

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容