我有几个索引,用于将我的数据存储在与周相关的索引中,模板为myindex-2022-weekOfYear
如何在这些索引中按id查找所有重复项?
我尝试使用聚合(基于此处的另一个问题)
GET myindex-*/_search
{
"stored_fields": [
"myKey"
],
"size": 100,
"aggs": {
"duplicateNames": {
"terms": {
"field": "myKey",
"min_doc_count": 2
},
"aggs": {
"duplicateDocuments": {
"top_hits": {}
}
}
}
}
}
但是看起来这个查询没有正常工作,因为按id搜索单个文档(从查询结果中)只返回一个索引,所以我假设min_doc_count
没有按预期工作。
编辑:我看到的回应:
"genres" : {
"doc_count_error_upper_bound" : 530,
"sum_other_doc_count" : 357290963,
"buckets" : [ ]
}
所以可能shard_size太小了(由于es资源的限制,我不能增加它)
1条答案
按热度按时间dz6r00yl1#
Tldr;
我找不到为什么这是不工作,但我做了一个概念证明,这表明它是正确的工作。(对于一个相当小的尺寸)
Package 袋
我得到了预期的,文档
id
:1
、2
、3
、4
。省略5
。