夜莺监控 v7.beta8 发版,引入模板中心,修复边缘机房机器失联告警问题

巴辉特 2024年6月3日

夜莺 v7 进展到 beta8 了,beta6、beta7、beta8 这三个版本一起发一个升级通告,主要改动点有三个:

  • 引入模板中心,把 mysql、redis、automq 等各个组件的采集说明、指标、仪表盘、告警规则等都集中到集成中心,方便用户查看和管理
  • 机器联动指标视图,在机器列表选中多台机器,点击右上角的看图按钮,即可打开指标视图,方便的查看这些机器的指标
  • 修复边缘机房机器失联告警问题,边缘机房的指标告警没有问题,机器失联告警有问题,这个版本修复了这个问题

下面做一个详细的介绍。

模板中心

菜单位置:集成中心 -> 模板中心。我们发现,监控系统的知识太过驳杂,如果能在平台上沉淀最佳实践,那将是极好的。于是,我们建立了模板中心这个功能,把各类监控目标的采集说明、指标、仪表盘、告警规则等都集中到模板中心,方便用户查看,用户可以直接把模板中心的内容导入自己的业务组下使用。当然,目前只是把框架上线了,很多组件的模板还在陆续补充中。

夜莺安装完毕后,会默认导入一些模板,这些内容来自 integrations 目录(如果想和社区分享你的成果,也是往这个目录提 PR),所以,老版本升级过来的用户,记得要替换 integrations 目录。integrations 目录下的内容组织结构如下:

  • 顶层目录是模板名称,比如 Linux、MySQL、Redis 等,每个目录就是一个模板类别,里边包含了多个子目录
  • alerts 子目录下放置告警规则,就是在告警规则页面导出的那个 JSON 文件
  • dashboards 子目录下放置仪表盘,就是在仪表盘页面导出的那个 JSON 文件,每个仪表盘一个 JSON 文件
  • metrics 子目录下放置指标,就是在指标页面导出的那个 JSON 文件
  • icon 子目录下放置插件的图标
  • markdown 子目录下放置模板的说明文档,比如讲解如何采集该类别的数据
  • collect 子目录是给商业版本用的,下面包含多个子目录,每个子目录对应一个 categraf 的采集插件,插件目录下包含多个 toml 文件,每一个 toml 文件就是一个采集规则配置模板,商业版本可以在页面上统一管理并下发采集规则

最近和 AutoMQ 的同学一起整理了 AutoMQ 的模板,最终的效果如下。

AutoMQ 是一款消息中间件,和 Kafka 完全兼容,但是成本是 Kafka 的十分之一,其官网地址:https://www.automq.com/

首先是采集说明,一般每个模板都会讲解相关数据是如何采集的,比如 AutoMQ 官网其实提供了 3 种采集方式,这里我们使用 Categraf 的 prometheus 插件拉取 OTel Collector 的数据方式:

AutoMQ 这个模板类别有哪些指标,分别代表什么意思,大家也会非常关注,这里会整理常用的 PromQL,方便用户直接使用,对于不熟悉 PromQL 的用户,这绝对是福音了:

指标的内容比较多,最常用的指标,我们会放在仪表盘中,仪表盘相互之间可以联动,比如 AutoMQ,首先看的是 Cluster Overview,可以从这个总览图跳转到某个具体的 Consumer Group 或者某个具体的 Broker、Topic 等。

最后就是 AutoMQ 的告警规则,也给大家内置好了,大家可以直接导入,截图如下:

其他的模板也是类似的,后面我们会多花费精力来整理这些各种各样的模板,也欢迎社区的广大小伙伴一起参与贡献。

机器联动指标视图

机器列表视图右上角增加了一个看图功能,选中多台机器,点击看图的按钮,即可打开指标视图,方便的查看这些机器的指标。

比如上面我选中了两台机器,点击看图之后,侧拉板中会展示指标列表,可以筛选你感兴趣的指标,然后点击具体的指标查看数据:

上图也可以看出,自动拼接的 Promql 中已经包含了我刚才选中的两台机器作为过滤条件了。

边缘机房机器失联告警问题修复

边缘机房的指标告警没有问题,机器失联告警有问题,这个版本修复了这个问题。这个 Bug 还挺重要的,如果你用到了边缘机房模式,建议尽快升级。

v7 正式版何时发版?

按每年惯例,v7 正式版会在 7 月底发版,每个大版本会持续支持 2 年。这也意味着,v5 版本将不再提供社区支持,建议 v5 版本的用户尽快升级到 v7 版本。升级方案可以查阅如下链接:

https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/upgrade/

开源版
Flashcat
Flashduty