屏蔽告警
屏蔽规则是一种在特定情况下暂时禁止告警通知的功能。通过设置屏蔽规则,可以避免在特定场景下不必要的告警通知,减少对我们的打扰。屏蔽规则一般有以下使用场景
-
计划性维护工作:在计划性维护期间,由于系统或服务可能会暂时关闭,这可能导致大量告警触发。通过设置屏蔽规则,可以在维护期间暂时禁止告警通知,避免造成不必要的打扰。
-
已知问题处理:对于已知问题,我们可能已经在处理了,此时不希望接收到重复的告警通知,可以设置屏蔽规则,暂时禁止这些告警通知,直到问题解决。
-
针对随机问题进行临时性屏蔽:在某些非关键时间段,如节假日、夜间等,我们可能希望暂时禁止部分非关键告警通知。通过设置规则中的生效时间,可以满足这个需求,确保我们能够专注于关键任务。
筛选条件
屏蔽规则像一个漏斗一样,根据筛选条件层层过滤条件,直到完成筛选条件并完全匹配上才会进行屏蔽。
业务组:屏蔽规则只会对指定业务内的告警事件进行屏蔽。
数据源类型、数据源、事件等级:设定好后基本就可以将想要屏蔽的告警分类筛选出来了。
事件标签 Key:核心细化筛选条件字段,提高屏蔽规则的准确性。告警事件中所有事件标签都是可以作为过滤条件的。
匹配操作符:目前支持 ‘==’、’=~’、’ !=’、’ !~’、‘in’、’not in’ 6种操作符。
匹配操作符介绍:
"==":绝对匹配标签的value
屏蔽对匹配标签 rulename 的值是“测试服务器挂载多个业务组告警”的告警规则。
"=~":通过正则表达式匹配标签value
屏蔽正则表达式匹配标签 ident 的值是包含 flashcat 或者是 v63-192.168.0.2 的告警规则;
"!=":绝对不匹标签的value(取反)
屏蔽匹配标签 ident 的值不是 pushgw-flashcat02-192.168.0.2 的告警规则。
"!~":通过正则表达式不匹配标签 value (取反)
屏蔽正则表达式匹配 ident 的值是不包含 flashcat 关键词的告警规则;
“in”
屏蔽 ident 标签的值是 flashcat01-192.168.0.2 或 pushgw-flashcat02-192.168.0.2 的告警规则;
“not in”
屏蔽 ident 标签的值不是 flashcat01-192.168.0.2 或 pushgw-flashcat02-192.168.0.2 的告警规则;
匹配逻辑:多个事件标签匹配条件是自上而下的过滤,每个事件标签匹配条件之间是’且’的关系。
匹配条件范围:告警事件中的所有标签
屏蔽时长
针对屏蔽策略生效的时间范围,可以是一次性的,也可以是循环周期性的。
注意:需要屏蔽的告警事件的 triggertime 一定要在屏蔽时间范围之内,否则告警屏蔽规则无法生效。
屏蔽时长默认是无法选择分钟级别,不过通过屏蔽开始和结束时间设定精确到分和秒。