- N +

【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置

【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置原标题:【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置

导读:

Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese&n...

文章目录 [+]

Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精准度低;english 对英文更加智能,可以识别单数负数,大小写,过滤stopwords(例如“the”这个词)等;chinese 效果很差,后面会演示。这次主要玩这几个内容:安装中文分词ik,对比不同分词器的效果,得出一个较佳的配置。

Elasticsearch 与elasticsearch-analysis-ik maven 版本对应表

IK versionES version
master5.x -> master
5.5.05.5.0
5.4.35.4.3
5.3.35.3.3
5.2.25.2.2
5.1.25.1.2
1.10.12.4.1
1.9.52.3.5
1.8.12.2.1
1.7.02.1.1
1.5.02.0.0
1.2.61.0.0
1.2.50.90.x
1.1.30.20.x
1.0.00.16.2 -> 0.19.0

elasticsearch-analysis-ik 下载

elasticsearch-analysis-ik 插件下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v5.0.0



安装中文分词 IK

  1. 解压缩 下载的 插件包:elasticsearch-analysis-ik-1.10.1.zip


  2.将解压后的下面这些拷贝到 /elasticsearch/plugins/analysis-ik/  下

          commons-codec-1.9.jar  
          commons-logging-1.2.jar  
          config  
          elasticsearch-analysis-ik-1.10.5.jar  
          httpclient-4.5.2.jar  
          httpcore-4.4.4.jar  
          plugin-descriptor.properties


  3.重启elasticsearch 节点

    日志显示:modules [reindex, lang-expression, lang-groovy], plugins [analysis-ik], sites []


本文标题:【Elasticsearch实战】中文分词elasticsearch-analysis-ik 插件安装配置
本文链接:https://www.kyjszj.com/htzq/113.html
作者授权:除特别说明外,本文由 开源技术之家 原创编译并授权 开源技术之家 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。

有好的文章希望我们帮助分享和推广,猛戳这里我要投稿

返回列表
上一篇:
下一篇:

发表评论中国互联网举报中心

快捷回复:

    评论列表 (暂无评论,共901人参与)参与讨论

    还没有评论,来说两句吧...