事件墙

关键事件的分析中心,事件墙通过收集和展示当前系统中发生的重要事件,如变更、报警、运营事件等,方便故障定位中将北极星指标报警和事件进行对照分析,辅助定位触发故障的关键事件。

产品介绍

针对故障数据的分析显示,约60%~80%的故障起源于线上的变更,因此故障定位中首先要追查的根因就是变更事件。同时,系统的关键报警、运营事件等信息也是分析故障触发原因的重要参考。问题是业务的这类事件往往分散在各个系统,且查看方式各异,要统一观测非常困难。

事件墙系统提供了多种方式,将业务的变更事件、报警事件、运营事件集中到事件系统,并以统一友好的方式展示出来,同时关联北极星报警事件,加速基于事件分析的故障定位过程。

接入简单

支持主动上报及针对主流事件源系统(prometheus、zabbix等)的标准上报方式

分析方便

接入事件和北极星报警事件统一按事件流的方式展示在事件墙,方便进行对照分析

聚合灵活

支持对上报的事件设置灵活的聚合规则,消除报警风暴,加速关键事件的分析过程

产品架构

开源版
Flashcat
Flashduty