夜莺监控 v7.beta8 发版,引入模板中心,修复边缘机房机器失联告警问题
这个版本建立了集成中心的框架,并且修复了边缘机房机器失联告警的Bug,建议升级
汇总 Flashcat 博客中与 Nightingale 相关的文章,方便按主题连续阅读实践、案例、选型和产品更新。
这个版本建立了集成中心的框架,并且修复了边缘机房机器失联告警的Bug,建议升级
Prometheus 生态的原生做法,由于阈值是放在 promql 中的,恢复时的消息中难以拿到恢复时的值,夜莺 v7.0.0.beta10 版本开始,提供了一种较为简单的内置方式,解决这个问题
仪表盘中的变量获取来源通常来自时序库,如果要查看机器相关的仪表盘数据,并做到方便的筛选,需要机器相关的指标提前打上各类标签,这个版本开始,仪表盘变量提供了一个新的筛选方式,可以和仪表盘所在业务组联动,自动获取业务组下的机器了
Prometheus 生态里如果要查询数据,需要编写 promql,对于普通用户来说,门槛有点高。通常有两种解法,一个是通过 AI 的手段做翻译,你用大白话跟 AI 提出你的诉求,让 AI 帮你写 promql,另一种是平台里内置现成的 promql,覆盖常用场景开箱即用。夜莺监控(Nightingale)最近上线了内置指标功能,即采用方案二,效果很棒值得尝试。
Prometheus 和 Nightingale 都被看做是监控系统,这俩是什么关系?相互替代还是相互协同?
虽说监控系统最侧重的功能是指标采集、存储、分析、告警,为了能够快速恢复故障,告警自愈机制也是需要重点投入建设的,所有可以固化为脚本的应急预案都可以使用告警自愈机制来快速驱动
夜莺监控 V5 和 V6 版本都支持故障自愈功能,但是均需要单独部署 ibex 模块,从 V7 beta2 版本开始,夜莺内置集成了 ibex 模块,无需单独部署 ibex,大大简化了部署流程。
熟悉夜莺的小伙伴都知道夜莺分为开源版、专业版、企业版,三个版本良性发展。近期夜莺团队发布了 v6.7 版本,把机器Metadata管理功能推送到了开源版。
夜莺项目发布 v6.5.0 版本,启用新 Logo,菜单支持换肤,支持了暗黑版本的菜单,全站暗黑主题在路上。
夜莺 Nightingale v6.4.0 版本发布:新增全局宏变量功能支持密码等敏感信息加密,HTTP access log 支持打印 body,仪表盘 Legend 展示统计值等多项优化。
夜莺 Nightingale v6.3.0 版本发布:新增 Loki 和 TDEngine 数据源支持,打造纯国产化监控方案,优化 edge 心跳接口统一、Elasticsearch 即时查询等多项功能。
IT的归宿是运维,运维的归宿是监控。天下没有不宕机的系统,选择一个好用的、趁手的监控工具,是 IT 人明哲保身的必备利器。今天要给大家推介的是“100%国产”的开源监控工具夜莺监控(Nightingale)
夜莺项目发布 v6.1.0 版本,增强可观测性数据串联,内置自动更新 v6 所有小版本的表结构,无需再手工更新数据库表结构。
Categraf 默认带了 PostgreSQL 数据库监控插件,可以直接使用,使用 Categraf 的 PostgreSQL 插件监控 PostgreSQL 数据库,也可以使用夜莺的内置 PostgreSQL 仪表盘和告警规则
夜莺项目发布v6.0.3版本,增强告警订阅功能,优化大盘全屏展示效果,优化Grafana大盘导入的问题等等
夜莺项目发布v6.0.2版本,增强日志查看能力,提升大盘排错能力,订阅规则支持订阅业务组,仪表盘页面支持调试功能,优化Loki数据源校验逻辑。
MySQL 主从延迟,大都知道如何监控,但是怎么处理?
SigNoz号称自己是开源领域的Datadog,基于OpenTelemetry做了一套可观测性方案。夜莺从V6版本开始,也希望做全栈可观测性方案,巧了,大家目标一致,今天我们一起来对SigNoz做个初步了解,看看其产品设计如何,也帮大家未来选型做参考。
本期新东方的技术朋友分享了一个硬件监控的方案,使用 Telegraf 做数据采集,使用 Loki 做日志存储,使用 Nightingale 做告警规则配置,玩的挺花的,我们一起来学习一下吧
Nightingale 夜莺 6.x 版本架构上做了调整,本文从中心部署架构和下沉部署架构两个常见场景进行介绍。