夜莺 v8 正式版,来了
今天在北京举办了 第三届CCF·夜莺开源创新论坛 的线下大会,正式发布夜莺 V8 版本,一直在等待正式版再上生产的小伙伴们,可以升级啦!
先给大家贴几张照片,感受一下大会的盛况,再给大家介绍一下 V8 版本的主要更新 😎
首先由尊敬的 中国计算机学会开源发展委员会主任王怀民,为大会做了致辞。夜莺项目作为中国计算机学会开源发展委员会成立之后接收的第一个捐赠项目,王主任非常重视。
内核观测、SRE、AI、故障定位、观测数据的存储,讲师有深度,观众提问也能切重点 :)
今年没有到场的朋友,明年记得来呀 :) OK,下面为大家介绍一下 V8 的主要更新。
感谢各位开源社区小伙伴为项目输入的各种产品建议和 PR。V8 这个版本,产品完成度已经很高,明年的 V9 我都不知道该搞什么大的迭代了,哈哈哈。
更多数据源的告警支持
夜莺的核心定位就是做一款告警引擎,对接不同的数据源产生告警事件,并对事件做后续处理。那告警这块自然要支持更多数据源。
开源版支持了常见的一些数据源。注意,由于产品定位的考虑,后面支持的数据源都不支持看图,只支持告警,侧重把告警能力打透。
引入事件 Pipeline
告警事件产生之后,会有一些额外的处理需求:
- 与内部系统联动,查询一些信息附加到告警事件上,为事件增加更多上下文信息,方便 On-call 人员根据告警信息快速定位问题
- 与内部系统联动,对事件做判断,如果是符合某些条件,就 Drop 掉
- 与 AI 整合,把事件丢给 AI 让 AI 帮忙分析、总结
- 对事件做 Relabel,类似 Prometheus 对指标做 Relabel 的逻辑
- Callback 给第三方系统,把告警事件扔过去,第三方系统做一些自动化的逻辑
这个功能很有想象空间,因为很方便和内部系统打通,更多落地场景欢迎大家分享哈。下面两篇文章是之前网友的投稿,可以参考:
抽象出通知规则
重新设计了整个通知链路,抽象了通知规则、通知媒介、消息模板等。内置支持了 20 种通知媒介,也很方便对接外部通知脚本、HTTP 地址。
优化机器告警
- 机器支持挂载多个业务组,解决生产环境里机器混部的场景,机器分类不止有标签机制,更有分组机制,降低了类别信息硬要使用标签导致的非稳态概率
- 告警规则支持变量,配合机器的业务组挂载关系,可以灵活定义不同业务组的机器不同的阈值,且支持底层节点的阈值高优覆盖上层通用阈值的情况
场景举例: 我们团队所有机器都使用一个通用的 CPU 使用率告警阈值,但是部分机器比较特殊,需要使用不同的阈值,这部分机器里有个别机器更特殊,还要使用更特殊的阈值。老运维应该懂得这类痛苦。🤣
新版告警全景看板
夜莺侧重在产生告警事件,那告警事件的展示,自然也很关键。我们优化了活跃告警事件的全景看板,更好的 UI、更方便的聚类和筛选,易用性大幅提升。
怎么都是告警相关的?仪表盘、可视化相关的没有增强么?也有一些,不过夜莺侧重点是告警,所以重点做的是告警能力。
如上就是 V8 版本的重点改进啦,更多信息可以参考: