如何计算索引所基于的原始数据大小?在/${INDEX_NAME}/_stats中,我可以看到索引的总大小:原始数据和索引结构。我如何检查原始数据的大小?例如,我有一个1 MB的文件,其中包含一些文档。我将其索引到ES,总索引大小为1.3MB。当我有索引大小,并希望了解原始数据大小时,我如何进行反向工程?
brccelvz1#
Elasticsearch默认不保留源数据的大小,但是你可以配置Mapper Size Plugin来添加_size元数据字段,它保留源数据的字节大小。启用后,所有索引的文档都将具有一个新字段"_size",其长度为_source document。例如:
_size
_source
GET my_index/_search?size=1&filter_path=hits.hits
退货:
{ "hits" : { "hits" : [ { "_index" : "my_index", "_type" : "_doc", "_id" : "123456789abcdef0", "_score" : 1.0, "_size" : 75, "_source" : { "@timestamp" : "2023-01-31T23:58:58.869Z", "content" : { "att1": "val1" } } } ] } }
此外,如果您想了解为什么索引大小为1.3 MB,您可以使用index disk usage API来实现此目的:
POST my_index/_disk_usage?run_expensive_tasks=true
1条答案
按热度按时间brccelvz1#
Elasticsearch默认不保留源数据的大小,但是你可以配置Mapper Size Plugin来添加
_size
元数据字段,它保留源数据的字节大小。启用后,所有索引的文档都将具有一个新字段"_size",其长度为
_source
document。例如:退货:
此外,如果您想了解为什么索引大小为1.3 MB,您可以使用index disk usage API来实现此目的: