- N +

【ElasticSearch学习】(七)Elasticsearch 索引词频率

【ElasticSearch学习】(七)Elasticsearch 索引词频率原标题:【ElasticSearch学习】(七)Elasticsearch 索引词频率

导读:

elasticsearch  索引词频率term vector 是在lucene中的一个概念,就是对于文档的某一列,如title,body这种类型的建立词频的多维向量...

文章目录 [+]

elasticsearch  索引词频率

term vector 是在lucene中的一个概念,就是对于文档的某一列,如title,body这种类型的建立词频的多维向量空间,每一个词就是一个维度,这个维度的值就是这个词在列中的频率。在ElasticSearch 中termvectors 返回在索引中特定文档字段的统计信息,termvectors总elasticsearch中是实时分析的,如果要想不实时分析,可以设置realtime参数为false。默认情况下是关闭的,需要在建索引的时候手工打开。


注意:在elasticsearch 2.0版本以上用 _vermvectors 代替 _vermvector 


下面我们建一个打开了索引词统计的索引

请求:

PUT  http://10.xxx.17x.175:9200/helloworld/

参数:

{
"helloworld": {
"mappings": {
"goodMorning": {
"properties": {
"name": {
"type": "string",
"term_vectors":"with_positions_offsets_payloads",
"analyzer":"ik"
}
}
}
}
}
}

然后我们插入两条数据:

请求:

PUT http://10.xxx.17x.175:9200/helloworld/goodMorning/1?pretty/
PUThttp://10.xxx.17x.175:9200/helloworld/goodMorning/2?pretty/

参数分别为:

{
"type":"你好我是码友,码友18是我的网站"
}
{
"type":"码友18年网站,java博客网站"
}

下面我们用_termvectors来查看统计结果

请求:

GET http://10.xxx.17x.175:9200/helloworld/goodMorning/1/_termvectors?pretty=true

响应:

{
"_index": "helloworld",
"_type": "goodMorning",
"_id": "1",
"_version": 1,
"found": true,
"took": 1,
"term_vectors": { }
}


本文标题:【ElasticSearch学习】(七)Elasticsearch 索引词频率
本文链接:https://www.kyjszj.com/htzq/123.html
作者授权:除特别说明外,本文由 开源技术之家 原创编译并授权 开源技术之家 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。

有好的文章希望我们帮助分享和推广,猛戳这里我要投稿

返回列表
上一篇:
下一篇:

发表评论中国互联网举报中心

快捷回复:

    评论列表 (暂无评论,共1003人参与)参与讨论

    还没有评论,来说两句吧...