最近做命名實體識別(NER)的任務(wù)比較多,也剛剛接觸NER不久,做一下小小的總結(jié)。近兩年中文命名實體識別在信息抽取和關(guān)系抽取上的應(yīng)用受到了研究人員的廣泛關(guān)注,很多比賽也以NE...
最近做命名實體識別(NER)的任務(wù)比較多,也剛剛接觸NER不久,做一下小小的總結(jié)。近兩年中文命名實體識別在信息抽取和關(guān)系抽取上的應(yīng)用受到了研究人員的廣泛關(guān)注,很多比賽也以NE...
在之前的文章《利用Word2vec生成句向量(一)》中,介紹了兩種句向量的生成方法,本文將介紹一種號稱"簡單卻具有一定競爭力"的句向量表示方法:SIF加權(quán)平均論文見A sim...
構(gòu)建上市公司知識圖譜 由于我的數(shù)據(jù)都存儲在mysql中,格式較為友好,避免了復(fù)雜的知識抽取的過程.首先,類似于數(shù)據(jù)庫的ER圖設(shè)計,設(shè)計出各個表之間對應(yīng)的關(guān)系,構(gòu)建出符合知識圖...
Bert開源了預(yù)訓練的中文模型,如果你想直接使用Bert模型生成句子向量(當做一個黑盒),并用于深度學習模型中,本文將給出一個作者親自實踐的實例.本文內(nèi)容只針對于實踐,并不會...
Neo4J在Ubuntu下的安裝比較簡單,不在此贅述,具體請參考: https://blog.csdn.net/qq_27009517/article/details/800...
之前介紹了利用LOAD CSV語句導(dǎo)入導(dǎo)入Neo4J的方法,但是這種方法對于百萬級的數(shù)據(jù)是無能為力的。我親自實踐了在python中利用py2neo和LOAD CSV語句導(dǎo)入百...
在詞向量的選擇方面,好像大部分研究人員用比較流行的Word2vec比較多,而忽略了GloVe這一個強力的詞向量,網(wǎng)上相關(guān)資料也比較少。有興趣研究其相關(guān)理論的同學可以自己查閱相...
jieba分詞是利用python進行自然語言處理中必不可少的常用工具,添加自定義詞典也是jieba分詞中的的常用功能。 然而每次運行程序,jieba自定義詞典都需要重新加載,...
首先為什么是Word2vec?不是Glove也不是什么Fasttext等其他的詞向量?Glove詞向量的訓練與部署可以看我之前的文章:https://www.jianshu....