ES 查询

夜莺（ Nightingale )ES日志告警规则

ES 日志告警

ES 日志告警可以通过对日志进行查询分析，来及时发现异常日志，并触发告警。

首先可以选择ES数据源，然后配置查询条件和告警条件，下面针对每个数字指向的功能，进行下详细说明

支持多种配置方式

目前支持的是 query string 语法（Lucene 语法）

Elasticsearch 对 text 类型字段会进行分词处理，这是最容易踩坑的地方：

什么是分词？

分词对查询的影响：

常见问题：查询结果中没有搜索的关键字

如果你搜索 message:连接超时，但返回的日志中并没有"连接超时"这个词，原因是：

解决方案：

# 方案1：使用引号进行短语查询（推荐）
message:"连接超时"

# 方案2：使用 AND 强制所有词都必须存在
message:(连接 AND 超时)

# 方案3：使用 keyword 子字段精确匹配（需索引支持）
message.keyword:*连接超时*

支持使用 ? 和 * 通配符:

- qu?ck - ? 匹配单个字符
- bro* - * 匹配零个或多个字符

使用 ~ 运算符进行模糊匹配:

- quikc~ - 匹配与 quick 相似的词
- "fox quick"~5 - 短语查询中的词之间可以相隔最多5个位置

支持数值和日期范围:

- count:[1 TO 5] - 闭区间,包含1和5
- date:[2022-01-01 TO 2022-12-31]
- age:>=10 - 大于等于10

可以使用 AND、OR、NOT 等布尔操作符:

- quick AND brown - 同时包含两个词
- quick OR brown - 包含其中任意一个词
- quick NOT fox - 包含 quick 但不包含 fox

详细的语法可以参考 ES 文档

点击可以选择日志中的日期字段，通过此字段来作为查询日志的时间范围的依据

如果是 5 分钟，表示在做告警查询时，会查询过去 5 分钟内的日志

对日志进行统计分析的函数，比如 count、sum、avg、min、max 等

对日志进行分组，比如按照 host 字段进行分组，进行 count 统计, 查询到的结果会按照 host 字段进行分组

统计分析得到的数值，会赋值给告警条件中的 A、B、C 等变量，然后根据这些变量进行告警条件判断，比如 $A > 10 表示日志数量大于10条时触发告警

在有的场景，日志会出现延迟，如果延迟3 分钟，查询最近 3 分钟的数据，会查不到数据，这时，可以在高级配置中，设置延迟查询时间，比如延迟 180s，表示查询查询的时候，把开始时间和终止时间都向前偏移 180s