本文作者:开源技术之家

【ElasticSearch学习】(七)Elasticsearch 索引词频率

开源技术之家 2年前 ( 2018-08-07 ) 1149 抢沙发

elasticsearch  索引词频率

term vector 是在lucene中的一个概念,就是对于文档的某一列,如title,body这种类型的建立词频的多维向量空间,每一个词就是一个维度,这个维度的值就是这个词在列中的频率。在ElasticSearch 中termvectors 返回在索引中特定文档字段的统计信息,termvectors总elasticsearch中是实时分析的,如果要想不实时分析,可以设置realtime参数为false。默认情况下是关闭的,需要在建索引的时候手工打开。


注意:在elasticsearch 2.0版本以上用 _vermvectors 代替 _vermvector 


下面我们建一个打开了索引词统计的索引

请求:

PUT  http://10.xxx.17x.175:9200/helloworld/

参数:

{
"helloworld": {
"mappings": {
"goodMorning": {
"properties": {
"name": {
"type": "string",
"term_vectors":"with_positions_offsets_payloads",
"analyzer":"ik"
}
}
}
}
}
}

然后我们插入两条数据:

请求:

PUT http://10.xxx.17x.175:9200/helloworld/goodMorning/1?pretty/
PUThttp://10.xxx.17x.175:9200/helloworld/goodMorning/2?pretty/

参数分别为:

{
"type":"你好我是码友,码友18是我的网站"
}
{
"type":"码友18年网站,java博客网站"
}

下面我们用_termvectors来查看统计结果

请求:

GET http://10.xxx.17x.175:9200/helloworld/goodMorning/1/_termvectors?pretty=true

响应:

{
"_index": "helloworld",
"_type": "goodMorning",
"_id": "1",
"_version": 1,
"found": true,
"took": 1,
"term_vectors": { }
}


本文标题:【ElasticSearch学习】(七)Elasticsearch 索引词频率
本文链接:https://www.kyjszj.com/htzq/123.html
作者授权:除特别说明外,本文由 开源技术之家 原创编译并授权 开源技术之家 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。
文章版权及转载声明

作者:开源技术之家本文地址:https://www.kyjszj.com/htzq/123.html发布于 2年前 ( 2018-08-07 )
文章转载或复制请以超链接形式并注明出处开源技术之家

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,1149人围观)参与讨论

还没有评论,来说两句吧...