为 Prometheus 告警规则增加 UI 管理能力
Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。但是,Prometheus 实际在应用时,通常会遇到一个典型问题:告警规则管理问题。今天为大家介绍一个开源项目,就是来解决这个问题的,它的名字是:Nightingale,即夜莺监控。
汇总 Flashcat 博客中与 夜莺监控 相关的文章,方便按主题连续阅读实践、案例、选型和产品更新。
Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。但是,Prometheus 实际在应用时,通常会遇到一个典型问题:告警规则管理问题。今天为大家介绍一个开源项目,就是来解决这个问题的,它的名字是:Nightingale,即夜莺监控。
总结夜莺 v8 正式版的核心升级,包括更多数据源告警支持、事件 Pipeline、通知规则抽象、机器告警优化和新版告警全景看板。
使用夜莺监控 Pipeline 功能,轻松实现发版时告警静默,减少告警噪声,提高运维效率。
夜莺监控发布了 v8.beta14 版本,新增 Postgres 告警支持和 AI Summary 处理器,增强业务监控能力。
演示如何用 Keycloak 和 OIDC 统一夜莺与 Grafana 的登录,并把 Grafana 内嵌到夜莺中,实现一个入口看图和管告警。
本文介绍夜莺监控项目的最新版本 v8.0.0-beta13,新增了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。
本文介绍夜莺监控项目的最新版本 v8.0.0-beta11,新增了对 ClickHouse 的告警支持、事件 Pipeline 功能等。这个版本的更新进一步增强了夜莺的功能和灵活性,适用于更广泛的监控场景。
在夜莺里重新整理了机器的仪表盘,包括 Categraf 作为采集器和 NodeExporter 作为采集器两种指标的仪表盘。也整理了夜莺 v8 版本的自身监控数据的仪表盘。自取。
夜莺监控的仪表盘支持变量功能,和 Grafana 类似,本文给新手一个简单的使用说明。
夜莺监控系统有两个版本,一个是开源版,一个是 Flashcat 商业版,开源版是免费的,主打的功能是统一告警引擎,商业版侧重点是一站式智能观测平台
本文讲解在夜莺监控 Nightingale 中如何自定义告警通知的消息模板,达到简洁、可读的效果。做到和 Prometheus 类似的效果。
本文介绍夜莺新版本的一个重要更新,支持在中心端无法连通的时序库的告警。这个版本的更新增强了夜莺的灵活性和可用性,尤其是在复杂网络环境下的应用场景。希望大家能在实际使用中体验到这个新功能的便利。
夜莺 v8 从 beta7 版本开始,抽象了通知规则的概念,可以非常方便的配置各种通知媒介,比如钉钉、短信、电话等。而且还有非常通用的 HTTP、脚本 通知方式,那么是不是就不需要 Flashduty 了呢?
夜莺监控在 v8.beta7 中做了一个巨大革新,抽象了一个通知规则的概念,来增强告警通知的灵活性,解决多年来的夙愿。
从 Categraf、Prometheus 到夜莺,完整演示如何搭建机器监控、导入仪表盘和告警规则,并配置通知流程,适合快速上手主机监控。
夜莺类似 Grafana 可以接入多个数据源,查询数据源的数据做告警和展示。但是有些数据源所在的机房和中心机房之间网络链路不好,如果由 n9e 进程去周期性查询数据并判定告警,那在网络链路抖动或拥塞的时候,告警就不稳定了。所以,夜莺引入了边缘告警引擎:n9e-edge。n9e-edge 进程部署在边缘机房,和边缘机房的时序库部署在一起,由 n9e-edge 负责边缘机房的告警判定工作,这样整个架构就稳定的多了。
Prometheus 生态的 step 参数是一个很重要的概念,对于监控数据的查询有着重要的影响。大部分情况下,用户不需要关心这个参数,因为监控系统会自动计算 step,以保证查询效率和数据展示的合理性。但是如果你想看原始数据,或者想了解监控数据的采集频率,那就需要了解 step 参数的含义,以及如何手工指定 step 参数啦。
监控系统里最重要的概念就是监控指标了,监控指标很多,而且都是英文的,分别代表什么意思
夜莺监控发布 v8.beta5 版本,优化 UI,新增接口认证方式便于鉴权。同时对仪表盘的一些细节做了优化。
夜莺监控从 v8.beta3 开始,支持了 ElasticSearch 的告警,这是社区一直心心念念的功能。日志告警是重要监控手段,对服务稳定性很是关键,欢迎大家体验起来。