Elasticsearch - 汇总数据
汇总作业是一项定期任务,它汇总索引模式指定的索引中的数据并将其汇总到新索引中。在下面的示例中,我们创建了一个名为 sensor 的索引,其中包含不同的日期时间戳。然后,我们创建了一个汇总作业,使用 cron 作业定期汇总这些索引中的数据。
PUT /sensor/_doc/1 { "timestamp": 1516729294000, "temperature": 200, "voltage": 5.2, "node": "a" }
运行上述代码,我们得到以下结果 −
{ "_index" : "sensor", "_type" : "_doc", "_id" : "1", "_version" : 1, "result" : "created", "_shards" : { "total" : 2, "successful" : 1, "failed" : 0 }, "_seq_no" : 0, "_primary_term" : 1 }
现在,添加第二个文档,并依此类推添加其他文档。
PUT /sensor-2018-01-01/_doc/2 { "timestamp": 1413729294000, "temperature": 201, "voltage": 5.9, "node": "a" }
创建汇总作业
PUT _rollup/job/sensor { "index_pattern": "sensor-*", "rollup_index": "sensor_rollup", "cron": "*/30 * * * * ?", "page_size" :1000, "groups" : { "date_histogram": { "field": "timestamp", "interval": "60m" }, "terms": { "fields": ["node"] } }, "metrics": [ { "field": "temperature", "metrics": ["min", "max", "sum"] }, { "field": "voltage", "metrics": ["avg"] } ] }
cron 参数控制作业何时以及以何种频率激活。当汇总作业的 cron 计划触发时,它将从上次激活后停止的位置开始汇总
作业运行并处理一些数据后,我们可以使用 DSL 查询进行一些搜索。
GET /sensor_rollup/_rollup_search { "size": 0, "aggregations": { "max_temperature": { "max": { "field": "temperature" } } } }