前言:分析關(guān)鍵詞
如何在一段文本之中提取出相應(yīng)的關(guān)鍵詞呢?
之前我有想過用機(jī)器學(xué)習(xí)的方法來進(jìn)行詞法分析,但是在項(xiàng)目中測(cè)試時(shí)正確率不夠。于是這時(shí)候便有了 HanLP-漢語言處理包 來進(jìn)行提取關(guān)鍵詞的想法。
下載:.jar .properties data等文件
這里提供官網(wǎng)下載地址 HanLP下載,1.3.3數(shù)據(jù)包下載
在intellij中配置環(huán)境,并運(yùn)行第一個(gè)demo
在項(xiàng)目中配置jar包,添加依賴。
file->Project Structure->Modules->Dependencies->+Jars

將properties文件轉(zhuǎn)移到src根目錄下,修改root為自己的數(shù)據(jù)集路徑

運(yùn)行第一個(gè)demo
public class TestHanLP {
? ? public static void main(String[] args) {
? ? ? ? System.out.println(HanLP.segment("你好,歡迎使用HanLP!"));
? ? }
}
可能的錯(cuò)誤
字符類型對(duì)應(yīng)表加載失敗:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解決辦法:查看錯(cuò)誤提示頁面下是否有該文件,如果沒有則去網(wǎng)上下載一個(gè)。像我這里,由于只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個(gè)文件的文件名—–成功運(yùn)行!。

成功運(yùn)行

文章來源于csu_zipple的博客