(六)金融知識(shí)圖譜——基于中財(cái)網(wǎng)的圖譜搭建(上)

????????????? 前面介紹了實(shí)體識(shí)別和關(guān)系抽取,之前在學(xué)習(xí)的時(shí)候是基于公司的實(shí)習(xí)項(xiàng)目在學(xué),只知道這兩者是為抽取結(jié)構(gòu)化數(shù)據(jù)做輔助的,看著公司的人一步步把圖譜建立起來,很厲害,于是,后面就準(zhǔn)備自己花點(diǎn)時(shí)間鼓搗鼓搗,想建一個(gè)知識(shí)圖譜,查了很多資料,也花錢買了不少視頻課,這里推薦入門的還是小象學(xué)院王昊奮老師的,如果你是小白,開始還好,后面的要求可能有點(diǎn)高,沒關(guān)系,知道個(gè)大概意思就行啦,其他也有些人開了課,冒充大牛,拿別人開源框架講課賺錢不說,還建了不少群宣傳他的課,冒充人生導(dǎo)師,其實(shí)一點(diǎn)算法都不懂,這里我就不方便說了,在自己的博客吐槽下就行。

? ? ? ? 言歸正傳。學(xué)知識(shí)圖譜需要學(xué)些什么內(nèi)容呢?

? ? ? ? 這里我就我調(diào)研到的一些東西做一些分享

? ? ? ? 上面這個(gè)圖列出了知識(shí)圖譜的部分場景需求和需要學(xué)習(xí)的知識(shí),現(xiàn)在很多開源的圖譜都是基于RDF、OWL這些資源描述框架做的,比如維基百科等等,所以對于新手來說上來接觸這些東西真的很懵,實(shí)際上在很多特定的場景的知識(shí)圖譜都沒用這些技術(shù)做,我也請教過一些大公司的人,問了下他們是基于啥做的(這里不方便透露哈),問了些,好多都是基于neo4j圖數(shù)據(jù)庫做的。所以,對于新手來說如果是用圖數(shù)據(jù)庫,RDF、OWL這些東西其實(shí)可以暫時(shí)略過哈!

? ? ? ? 所以接下來我來講一下構(gòu)建圖譜的技術(shù)路線,說的很專業(yè),有些人把這包裝的很高大上,無非就是兩個(gè)東西,爬蟲+數(shù)據(jù)庫,如果你要進(jìn)行可視化展示,那就還需要一些前端的知識(shí)。


????????這上面的兩個(gè)圖,第一個(gè)就是基于RDF存儲(chǔ)的,第二個(gè)就是基于圖數(shù)據(jù)庫存儲(chǔ)的??梢钥闯鯪eo4j的使用還是比較受歡迎的,Neo4j我個(gè)人上手雖然花了點(diǎn)時(shí)間,但實(shí)際上還是個(gè)工程問題,所以還是比較容易的,這里先展示下我自己做的一個(gè)基于中財(cái)網(wǎng)的所有上市公司的知識(shí)圖譜,內(nèi)容雖然不是很專業(yè),但在工程上還是沒啥毛病的哈!

????????這里先貼一張我的最終效果圖!


這里只能展開部分,后面我會(huì)詳細(xì)記錄整個(gè)實(shí)驗(yàn)過程并開源我的代碼!

為了知識(shí)的完成性,我先簡單介紹一下知識(shí)圖譜!

上面這些都是我自己做過的PPT,基本上看圖就很直觀了,這里就不講廢話了,這里只是對知識(shí)圖譜做一個(gè)概述,后面開始進(jìn)行我的金融圖譜項(xiàng)目實(shí)戰(zhàn)介紹!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容