HanLP分詞器的使用方法

前言:分析關(guān)鍵詞

如何在一段文本之中提取出相應(yīng)的關(guān)鍵詞呢?

之前我有想過用機(jī)器學(xué)習(xí)的方法來進(jìn)行詞法分析,但是在項(xiàng)目中測(cè)試時(shí)正確率不夠。于是這時(shí)候便有了 HanLP-漢語言處理包 來進(jìn)行提取關(guān)鍵詞的想法。

下載:.jar .properties data等文件

這里提供官網(wǎng)下載地址 HanLP下載,1.3.3數(shù)據(jù)包下載

在intellij中配置環(huán)境,并運(yùn)行第一個(gè)demo

在項(xiàng)目中配置jar包,添加依賴。

file->Project Structure->Modules->Dependencies->+Jars


將properties文件轉(zhuǎn)移到src根目錄下,修改root為自己的數(shù)據(jù)集路徑


運(yùn)行第一個(gè)demo

public class TestHanLP {

? ? public static void main(String[] args) {

? ? ? ? System.out.println(HanLP.segment("你好,歡迎使用HanLP!"));

? ? }

}


可能的錯(cuò)誤

字符類型對(duì)應(yīng)表加載失敗:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes

解決辦法:查看錯(cuò)誤提示頁面下是否有該文件,如果沒有則去網(wǎng)上下載一個(gè)。像我這里,由于只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個(gè)文件的文件名—–成功運(yùn)行!。


成功運(yùn)行





文章來源于csu_zipple的博客

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,578評(píng)論 19 139
  • Spring Boot 參考指南 介紹 轉(zhuǎn)載自:https://www.gitbook.com/book/qbgb...
    毛宇鵬閱讀 47,275評(píng)論 6 342
  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,094評(píng)論 25 709
  • 今天起了個(gè)大早去辦簽證。 一出門連開了三輛obike都是壞的,只能自認(rèn)倒霉,一邊又慌張地向地鐵站奔去。 已經(jīng)刻意往...
    Betteremma閱讀 279評(píng)論 0 0
  • 昨兒在樓下散步,大家看著我肚子(已滿34周),婆婆小聲說“終于愿意回來休息了”,隔壁老嬸加一句“這么大肚子還開車上...
    心花怒放的日子啊閱讀 511評(píng)論 0 1

友情鏈接更多精彩內(nèi)容