夜莺监控 这个话题主要看什么
夜莺最初由滴滴开发和开源,并于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。夜莺的核心研发团队,也是 Open-Falcon 项目原核心研发人员,从 2014 年(Open-Falcon 是 2014 年开源)算起来,也有 10 年了,只为把监控这个事情做好。
夜莺监控是一款开源云原生观测分析工具,采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。
围绕 夜莺监控 的实践、选型、案例和产品内容,按同一阅读路径持续整理。
夜莺里如何引用标签和注解变量?本文集中介绍了夜莺里引用标签和注解变量的两种场景,分别是告警规则和消息模板。
Grafana可以对接多种数据源,对其中的数据做可视化分析。实际上,Grafana也可以配置告警规则,只是设计上相对拧巴,用户用的比较少。今天为大家介绍另一款开源项目,侧重点就是多数据源告警,希望可以帮到大家。这个项目叫夜莺监控。
本文介绍夜莺监控(Nightingale)的几种架构模式,包括仅作为告警引擎、数据流经夜莺、边缘架构等
Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。但是,Prometheus 实际在应用时,通常会遇到一个典型问题:告警规则管理问题。今天为大家介绍一个开源项目,就是来解决这个问题的,它的名字是:Nightingale,即夜莺监控。
总结夜莺 v8 正式版的核心升级,包括更多数据源告警支持、事件 Pipeline、通知规则抽象、机器告警优化和新版告警全景看板。
使用夜莺监控 Pipeline 功能,轻松实现发版时告警静默,减少告警噪声,提高运维效率。
夜莺监控发布了 v8.beta14 版本,新增 Postgres 告警支持和 AI Summary 处理器,增强业务监控能力。
演示如何用 Keycloak 和 OIDC 统一夜莺与 Grafana 的登录,并把 Grafana 内嵌到夜莺中,实现一个入口看图和管告警。
本文介绍夜莺监控项目的最新版本 v8.0.0-beta13,新增了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。
本文介绍夜莺监控项目的最新版本 v8.0.0-beta11,新增了对 ClickHouse 的告警支持、事件 Pipeline 功能等。这个版本的更新进一步增强了夜莺的功能和灵活性,适用于更广泛的监控场景。
在夜莺里重新整理了机器的仪表盘,包括 Categraf 作为采集器和 NodeExporter 作为采集器两种指标的仪表盘。也整理了夜莺 v8 版本的自身监控数据的仪表盘。自取。
夜莺监控的仪表盘支持变量功能,和 Grafana 类似,本文给新手一个简单的使用说明。
夜莺监控系统有两个版本,一个是开源版,一个是 Flashcat 商业版,开源版是免费的,主打的功能是统一告警引擎,商业版侧重点是一站式智能观测平台
本文讲解在夜莺监控 Nightingale 中如何自定义告警通知的消息模板,达到简洁、可读的效果。做到和 Prometheus 类似的效果。
本文介绍夜莺新版本的一个重要更新,支持在中心端无法连通的时序库的告警。这个版本的更新增强了夜莺的灵活性和可用性,尤其是在复杂网络环境下的应用场景。希望大家能在实际使用中体验到这个新功能的便利。
夜莺 v8 从 beta7 版本开始,抽象了通知规则的概念,可以非常方便的配置各种通知媒介,比如钉钉、短信、电话等。而且还有非常通用的 HTTP、脚本 通知方式,那么是不是就不需要 Flashduty 了呢?
夜莺监控在 v8.beta7 中做了一个巨大革新,抽象了一个通知规则的概念,来增强告警通知的灵活性,解决多年来的夙愿。
从 Categraf、Prometheus 到夜莺,完整演示如何搭建机器监控、导入仪表盘和告警规则,并配置通知流程,适合快速上手主机监控。
夜莺类似 Grafana 可以接入多个数据源,查询数据源的数据做告警和展示。但是有些数据源所在的机房和中心机房之间网络链路不好,如果由 n9e 进程去周期性查询数据并判定告警,那在网络链路抖动或拥塞的时候,告警就不稳定了。所以,夜莺引入了边缘告警引擎:n9e-edge。n9e-edge 进程部署在边缘机房,和边缘机房的时序库部署在一起,由 n9e-edge 负责边缘机房的告警判定工作,这样整个架构就稳定的多了。
Prometheus 生态的 step 参数是一个很重要的概念,对于监控数据的查询有着重要的影响。大部分情况下,用户不需要关心这个参数,因为监控系统会自动计算 step,以保证查询效率和数据展示的合理性。但是如果你想看原始数据,或者想了解监控数据的采集频率,那就需要了解 step 参数的含义,以及如何手工指定 step 参数啦。