這篇文檔是根據(jù)以前的記錄整理出來(lái)的。當(dāng)時(shí)elasticsearch的最新版本還是2.4.1,所以安裝的中文分詞器ik是匹配這個(gè)版本的v1.10.1。
github地址:https://github.com/medcl/elasticsearch-analysis-ik
最新版本v5.00,我安裝的是v1.10.1(v5.00之前的最新正式版本)
安裝maven:http://blog.csdn.net/zl18310999566/article/details/52958653
1.自定義詞典為什么沒(méi)有生效?
請(qǐng)確保你的擴(kuò)展詞典的文本格式為 UTF8 編碼
2.如何手動(dòng)安裝?
git clone https://github.com/medcl/elasticsearch-analysis-ik
cd elasticsearch-analysis-ik
# git checkout tags/{version}
git checkout tags/v1.10.1
mvn clean
mvn compile
mvn package
拷貝和解壓release下的文件:
{project_path}/elasticsearch-analysis-ik/target/releases/elasticsearch-analysis-ik-*.zip 到你的 elasticsearch 插件目錄, 如: plugins/ik,重啟elasticsearch
3.分詞測(cè)試失敗,請(qǐng)?jiān)谀硞€(gè)索引下調(diào)用analyze接口測(cè)試,而不是直接調(diào)用analyze接口 如:http://localhost:9200/your_index/_analyze?text=中華人民共和國(guó)MN&tokenizer=ik
默認(rèn)使用ik分詞器:(一般不需要,在創(chuàng)建索引映射時(shí)可以指定分詞器)
修改elasticsearch的配置文件(elasticsearch.yml):
index.analysis.analyzer.ik.type: "ik"
擴(kuò)展詞庫(kù),在config\ik\custom下在mydict.dic中增加需要的詞組,然后重啟Elasticsearch,需要注意的是文件編碼是UTF-8 無(wú)BOM格式編碼。
可能需要安裝mvn:
wget http://apache.fayea.com/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gz
tar -zxvf apache-maven-3.3.9-bin.tar.gz
mv apache-maven-3.3.9 /usr/local/maven-3.3.9
修改環(huán)境變量:
vi /etc/profile
export MAVEN_HOME=/usr/local/maven-3.3.9
export PATH=$PATH:$MAVEN_HOME/bin
source /etc/profile