当前位置：首页 > article >正文

【Elasticsearch】`auto_date_histogram`聚合功能详解

article 2025/2/6 14:54:33

1.功能概述

`auto_date_histogram`是 Elasticsearch 提供的一种时间分桶聚合功能，它可以根据数据分布自动调整分桶的间隔，以生成指定数量的分桶。与传统的`date_histogram`不同，`auto_date_histogram`不需要用户手动指定时间间隔，而是根据数据自动选择最佳间隔。

2.基本语法

`auto_date_histogram`的基本语法如下：

```json

{

"aggs": {

"my_auto_date_histo": {

"auto_date_histogram": {

"field": "date",

"buckets": 10

}

}

}

}

```

• `field`：指定用于聚合的日期字段。

• `buckets`：目标分桶数量，默认为10。

3.参数详解

• `buckets`：指定目标分桶数量，返回的分桶数量将小于或等于该值。

• `format`：指定日期格式，例如`"yyyy-MM-dd"`。

• `time_zone`：指定时区，支持 ISO 8601 UTC 偏移量（如`+01:00`）或时区 ID（如`America/New_York`）。

• `minimum_interval`：设置最小间隔，可选值包括`year`、`month`、`day`、`hour`、`minute`、`second`。

• `missing`：指定缺失值的处理方式，可以将缺失值视为某个特定日期。

4.示例用法

以下是一个使用`auto_date_histogram`的示例，目标是根据`timestamp`字段生成约20个分桶，并按`yyyy-MM-dd`格式化日期：

```json

GET /my_index/_search

{

"size": 0,

"aggs": {

"messages_over_time": {

"auto_date_histogram": {

"field": "timestamp",

"buckets": 20,

"format": "yyyy-MM-dd"

}

}

}

}

```

5.自动选择间隔

`auto_date_histogram`会根据数据分布自动选择合适的间隔，以确保返回的分桶数量接近目标值。可能的间隔包括：

• 秒：1、5、10、30 的倍数

• 分钟：1、5、10、30 的倍数

• 小时：1、3、12 的倍数

• 天：1、7 的倍数

• 月：1、3 的倍数

• 年：1、5、10、20、50、100 的倍数。

6.最佳实践

• 设置最小间隔：使用`minimum_interval`参数可以提高聚合效率。

• 处理时区差异：使用`time_zone`参数确保分桶基于正确的时区。

• 结合其他聚合：可以与`sum`、`avg`等其他聚合功能结合，进行更复杂的时间分析。

7.常见问题

• 字段映射：确保聚合字段正确映射为日期类型。

• 分桶数量：实际返回的分桶数量可能因数据分布而略有不同。

• 夏令时处理：在涉及夏令时转换的时区中，分桶可能会有细微差异。

通过`auto_date_histogram`，用户可以更灵活地处理时间序列数据，而无需手动调整分桶间隔，从而提高数据分析的效率和准确性。

http://www.kler.cn/a/533814.html

相关文章：

HTML5 教程之标签（3）

离散时间傅里叶变换（DTFT）公式详解：周期性与连续性剖析

数据库开发常识（10.6）——SQL性能判断标准及索引误区（1）

【技术追踪】DiﬀMIC：用于医学图像分类的双引导扩散网络（MICCAI-2024）

63.视频推荐的算法|Marscode AI刷题

MLA 架构

Ubuntu部署Deepseek-R1模型（8b）

基于微信小程序的医院综合服务平台的设计与实现ssm+论文源码调试

亚博microros小车-原生ubuntu支持系列：22 物体识别追踪

AI绘画：解锁商业设计新宇宙（6/10）

使用request库实现接口测试-笔记

阿里云 ubuntu22.04 中国区节点安装 Docker

2024年12月 Scratch 图形化（一级）真题解析中国电子学会全国青少年软件编程等级考试

arm 下多线程访问同一变量，使用原子操作性能差问题

【Git】二、分支管理详解

2024年12月 Scratch 图形化（三级）真题解析中国电子学会全国青少年软件编程等级考试

记录一下在Mac下用pyinstallter 打包 Django项目

自己实现的一个缓存数据库（搞着玩） .net Core/6/8/9

【C语言高级特性】位操作（二）：应用场景

python开发：爬虫示例——GET和POST请求处理

vue2-给data动态添加属性

WPS中解除工作表密码保护（忘记密码）

手写MVVM框架-实现v-model(单向绑定)

rabbitMQ数据隔离

1 HBase 基础