elasticsearch-2.4.1 安裝中文分詞器 ik-v1.10.1

這篇文檔是根據(jù)以前的記錄整理出來(lái)的。當(dāng)時(shí)elasticsearch的最新版本還是2.4.1,所以安裝的中文分詞器ik是匹配這個(gè)版本的v1.10.1。

github地址:https://github.com/medcl/elasticsearch-analysis-ik

最新版本v5.00,我安裝的是v1.10.1(v5.00之前的最新正式版本)

安裝maven:http://blog.csdn.net/zl18310999566/article/details/52958653

1.自定義詞典為什么沒(méi)有生效?

請(qǐng)確保你的擴(kuò)展詞典的文本格式為 UTF8 編碼

2.如何手動(dòng)安裝?

git clone https://github.com/medcl/elasticsearch-analysis-ik
cd elasticsearch-analysis-ik
# git checkout tags/{version}
git checkout tags/v1.10.1
mvn clean
mvn compile
mvn package

拷貝和解壓release下的文件:
{project_path}/elasticsearch-analysis-ik/target/releases/elasticsearch-analysis-ik-*.zip 到你的 elasticsearch 插件目錄, 如: plugins/ik,重啟elasticsearch

3.分詞測(cè)試失敗,請(qǐng)?jiān)谀硞€(gè)索引下調(diào)用analyze接口測(cè)試,而不是直接調(diào)用analyze接口 如:http://localhost:9200/your_index/_analyze?text=中華人民共和國(guó)MN&tokenizer=ik

默認(rèn)使用ik分詞器:(一般不需要,在創(chuàng)建索引映射時(shí)可以指定分詞器)

修改elasticsearch的配置文件(elasticsearch.yml):

index.analysis.analyzer.ik.type: "ik"

擴(kuò)展詞庫(kù),在config\ik\custom下在mydict.dic中增加需要的詞組,然后重啟Elasticsearch,需要注意的是文件編碼是UTF-8 無(wú)BOM格式編碼。

可能需要安裝mvn:

wget http://apache.fayea.com/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gz 
tar -zxvf apache-maven-3.3.9-bin.tar.gz 
mv apache-maven-3.3.9 /usr/local/maven-3.3.9

修改環(huán)境變量:

vi /etc/profile 
export MAVEN_HOME=/usr/local/maven-3.3.9 
export PATH=$PATH:$MAVEN_HOME/bin 
source /etc/profile
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容