中文命名實體識別總結(jié)

煉己者

歡迎大家關(guān)注我的知乎專欄,那里會分享我的項目總結(jié)以及所看的好博客
前段時間做了命名實體識別這個項目,在這里總結(jié)一下資源

命名實體識別的資料網(wǎng)上不多,尤其是讓我們可以跟著做的。想要做這個方向,可以先找簡單的入手。語料可以用人民日報標注語料,目前流行的方法有兩種,一種基于CRF,一種基于深度學習。我個人強烈建議先做項目,再去深入理解原理,這兩者相輔相成,才能成大事

本文脈絡(luò)簡單,就是從項目和原理兩方面推薦給大家相關(guān)的博客
首先給大家一個開胃菜,先入門一下命名實體識別,總不能做了半天不知道自己在干什么吧
命名實體識別(NER)的二三事

一.項目

方法一:基于CRF做命名實體識別

用CRF做命名實體識別(一)
用CRF做命名實體識別(二)
用CRF做命名實體識別(三)

  • 用CRF做命名實體識別(一) 主要介紹的是關(guān)于人民日報標注語料的預處理,利用CRF++工具包對模型進行訓練以及測試。
  • 用CRF做命名實體識別(二) 主要是升級對上一篇升級,新添加了一些特征,著重介紹了如何生成組織名特征詞這個特征。大家也許看的一知半解,進去讀讀便豁然開朗了
  • 用CRF做命名實體識別(三) 主要是總結(jié)了所有特征的生成思路,并對它們做了一個效果對比

方法二:基于深度學習做命名實體識別

用深度學習做命名實體識別(附代碼) 主要簡單的介紹下BILSTM-CRF的原理,以及如何把大佬的數(shù)據(jù)集換成我們自己的數(shù)據(jù)集,進行訓練。

二. 原理

原理的理解很不容易,這里主要推薦閱讀書籍和博客。主讀書籍,用博客來輔助理解

書籍推薦:吳軍的《數(shù)學之美》,周志華的西瓜書《機器學習》,李航的《統(tǒng)計學習方法》

博客推薦:

1. CRF的原理介紹

如何用簡單易懂的例子解釋條件隨機場(CRF)模型?它和HMM有什么區(qū)別?

如何輕松愉快地理解條件隨機場(CRF)?

2. HMM的原理介紹

一文搞懂HMM(隱馬爾可夫模型) - skyme - 博客園

farewell:隱馬爾科夫模型

如何用簡單易懂的例子解釋隱馬爾可夫模型?

機器學習 --- 4. 大內(nèi)密探HMM(隱馬爾可夫)圍捕賭場老千

如何用簡單易懂的例子解釋隱馬爾可夫模型?

3. BILSTM的原理介紹

推薦給初學LSTM或者懂個大概卻不完全懂的人 - CSDN博客

三. 總結(jié)

中文的命名實體識別就到這里了,大家有疑問歡迎提出來一起探討。另外要轉(zhuǎn)載的話請聯(lián)系我,謝謝各位了


以下是我所有文章的目錄,大家如果感興趣,也可以前往查看
??戳右邊:打開它,也許會看到很多對你有幫助的文章

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容