夜莺-Nightingale
夜莺V7
项目介绍 功能概览
部署升级 部署升级
数据接入 数据接入
告警管理 告警管理
数据查看 数据查看
功能介绍 功能介绍
API FAQ
夜莺V6
项目介绍 架构介绍
快速开始 快速开始
黄埔营
安装部署 安装部署
升级
采集器 采集器
使用手册 使用手册
API API
数据库表结构 数据库表结构
FAQ FAQ
开源生态
Prometheus
版权声明
第1章:天降奇兵 第1章:天降奇兵
第2章:探索PromQL 第2章:探索PromQL
第3章:Prometheus告警处理 第3章:Prometheus告警处理
第4章:Exporter详解 第4章:Exporter详解
第5章:数据与可视化 第5章:数据与可视化
第6章:集群与高可用 第6章:集群与高可用
第7章:Prometheus服务发现 第7章:Prometheus服务发现
第8章:监控Kubernetes 第8章:监控Kubernetes
第9章:Prometheus Operator 第9章:Prometheus Operator
参考资料

ES 日誌告警

ES 日誌告警可以通過對日誌進行查詢分析,來及時發現異常日誌,並觸發告警。

首先可以選擇ES數據源,然後配置查詢條件和告警條件,下面針對每個數字指向的功能,進行詳細說明

1 選擇索引

支持多種配置方式

  1. 指定單個索引 gb 在 gb 索引中搜索所有的文檔
  2. 指定多個索引 gb,us 在 gb 和 us 索引中搜索所有的文檔
  3. 指定索引前綴 g*,u* 在任何以 g 或者 u 開頭的索引中搜索所有的文檔

2 設置過濾條件

目前支持的是 query string 語法,詳細的語法可以參考 ES 文檔

3 設置日誌字段

點擊可以選擇日誌中的日期字段

4 設置查詢日誌的時間範圍

如果是 5 分鐘,表示在做告警查詢時,會查詢過去 5 分鐘內的日誌

5 數值提取

對日誌進行統計分析的函數,比如 count、sum、avg、min、max 等

6 Group By

對日誌進行分組,比如按照 host 字段進行分組,進行 count 統計,查詢到的結果會按照 host 字段進行分組

7 告警條件

統計分析得到的數值,會賦值給告警條件中的 A、B、C 等變量,然後根據這些變量進行告警條件判斷,比如 $A > 10 表示日誌數量大於10條時觸發告警

8 高級配置

在有的場景,日誌會出現延遲,如果延遲3分鐘,查詢最近3分鐘的數據,會查不到數據,這時,可以在高級配置中,設置延遲查詢時間,比如延遲180s,表示查詢查詢的時候,把終止時間設置為當前時間減去180s

使用範例

例子1:HTTP CODE 為4xx的告警條件

說明:在每10分鐘的時間段內,檢查日誌中的 message 字段。如果 4xx 的日誌數量超過 2 次,產生告警,並且按照 host.hostname 字段進行分組統計,配置方式如下

ES 日誌告警

例子2:接口耗時大於1秒時觸發告警

說明:根據 http_method 分組統計某個請求接口耗時大於1秒,配置方式如下

ES 日誌告警

例子3:request_time 大於1900ms,匹配日誌超過10條時觸發告警

說明:在每2分鐘的時間段內,篩選出 request_time 大於1900ms 的日誌。按 request_uri 維度進行分組,檢查日誌數量是否超過10條,配置方式如下

ES 日誌告警

在配置完成所需的數據字段後,還可以通過數據預覽按鈕來預覽查詢結果。

ES 日誌告警

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat