本文作者:开源技术之家

【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置

开源技术之家 2年前 ( 2018-08-07 ) 1103 抢沙发

Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(例如“the”这个词)等;chinese 效果很差,后面会演示。这次主要玩这几个内容:安装中文分词ik,对比不同分词器的效果,得出一个较佳的配置。

Elasticsearch 与elasticsearch-analysis-ik maven 版本对应表

IK versionES version
master5.x -> master
5.5.05.5.0
5.4.35.4.3
5.3.35.3.3
5.2.25.2.2
5.1.25.1.2
1.10.12.4.1
1.9.52.3.5
1.8.12.2.1
1.7.02.1.1
1.5.02.0.0
1.2.61.0.0
1.2.50.90.x
1.1.30.20.x
1.0.00.16.2 -> 0.19.0

elasticsearch-analysis-ik 下载

elasticsearch-analysis-ik 插件下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v5.0.0



安装中文分词 IK

  1. 解压缩 下载的 插件包:elasticsearch-analysis-ik-1.10.1.zip


  2.将解压后的下面这些拷贝到 /elasticsearch/plugins/analysis-ik/  下

          commons-codec-1.9.jar  
          commons-logging-1.2.jar  
          config  
          elasticsearch-analysis-ik-1.10.5.jar  
          httpclient-4.5.2.jar  
          httpcore-4.4.4.jar  
          plugin-descriptor.properties


  3.重启elasticsearch 节点

    日志显示:modules [reindex, lang-expression, lang-groovy], plugins [analysis-ik], sites []


本文标题:【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置
本文链接:https://www.kyjszj.com/htzq/113.html
作者授权:除特别说明外,本文由 开源技术之家 原创编译并授权 开源技术之家 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。
文章版权及转载声明

作者:开源技术之家本文地址:https://www.kyjszj.com/htzq/113.html发布于 2年前 ( 2018-08-07 )
文章转载或复制请以超链接形式并注明出处开源技术之家

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,1103人围观)参与讨论

还没有评论,来说两句吧...