夜莺-Nightingale
夜莺V7
项目介绍 功能概览
部署升级 部署升级
数据接入 数据接入
告警管理 告警管理
数据查看 数据查看
功能介绍 功能介绍
API FAQ
夜莺V6
项目介绍 架构介绍
快速开始 快速开始
黄埔营
安装部署 安装部署
升级
采集器 采集器
使用手册 使用手册
API API
数据库表结构 数据库表结构
FAQ FAQ
开源生态
Prometheus
版权声明
第1章:天降奇兵 第1章:天降奇兵
第2章:探索PromQL 第2章:探索PromQL
第3章:Prometheus告警处理 第3章:Prometheus告警处理
第4章:Exporter详解 第4章:Exporter详解
第5章:数据与可视化 第5章:数据与可视化
第6章:集群与高可用 第6章:集群与高可用
第7章:Prometheus服务发现 第7章:Prometheus服务发现
第8章:监控Kubernetes 第8章:监控Kubernetes
第9章:Prometheus Operator 第9章:Prometheus Operator
参考资料

告警订阅

订阅规则

在使用监控平台的时候,有这样一种场景,一些机器和基础组件的告警规则是由基础架构的同学维护管理的,但业务的同学也想接收和自己业务相关的机器和基础组件的告警,如果直接去修改对应的告警规则的话,其实不太合适,这个时候,可以使用订阅规则,来订阅自己感兴趣的告警事件,当告警事件产生之后,通知到自己。

image-20230724152914632

  • 告警类型:想要订阅的告警事件的类型
  • 订阅告警规则:一种告警事件的订阅筛选方式,根据订阅规则来筛选
  • 告警事件等级:可以只订阅某个等级的告警事件
  • 订阅事件标签:和屏蔽规则中的标签筛选类似,是有和配置的标签匹配的事件,才会走订阅逻辑
  • 订阅事件持续时长:这个功能在告警升级的场景比较有用,如果告警事件产生之后,持续了很久还没恢复,再次出发的时候,如果满足的持续时长,可以把告警发送给业务负责人或者备值班人。
  • 告警级别、通知媒介、回调地址:对于筛选到的告警事件,在发送的时候,我们可以修改原来的告警级别、通知媒介和回调地址
  • 订阅接收组:订阅的告警事件,重新发给哪些团队
  • 通知聚合(专业版功能):配置之后,告警通知会等待一段时间聚合之后,一起发送,减少对接收方的打扰

订阅规则使用方式推荐

服务级别的告警订阅,机器混部的场景

不同redis实例的告警,需要发给不同的业务组,在配置采集的时候,不同的redis服务,可以配一个 service=abc 的标签,在订阅规则中,每个服务创建一个订阅规则,订阅自己的 service 标签

只想订阅机器系统指标,不想订阅机器上报的服务指标

在配置系统指标告警规则的时候,在附加标签配置一个标识是系统指标的标签,例如 alert_cate=host,之前在配置订阅规则的时候,通过配置 alert_cate=host,可以实现只订阅系统指标告警的效果

订阅的告警通知太频繁

可以开启聚合功能,设置聚合时间,这样通知会先进行聚合,在发送通知,减少对大家的打扰

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat