夜莺监控

夜莺监控是一款开源云原生观测分析工具,采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。夜莺于 2020 年 3 月 20 日,在 github 上发布 v1 版本,已累计迭代 100 多个版本。

夜莺最初由滴滴开发和开源,并于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。夜莺的核心研发团队,也是 Open-Falcon 项目原核心研发人员,从 2014 年(Open-Falcon 是 2014 年开源)算起来,也有 10 年了,只为把监控这个事情做好。

夜莺项目整体介绍

夜莺项目是一款侧重告警的监控类开源项目。类似 Grafana 的数据源集成方式,夜莺也是对接多种既有的数据源,不过 Grafana 侧重在可视化,夜莺是侧重在告警引擎。当然,夜莺也提供可视化能力,并且和 Categraf 丝滑对接,共同组成一个完整的监控系统
夜莺项目整体介绍

夜莺功能概览

夜莺( Nightingale )最核心的功能是作为一个高可用的告警引擎,提供灵活的告警规则、屏蔽规则、订阅规则配置能力,提供告警事件归档分析能力,提供告警自愈能力,当然,夜莺也可以查看监控数据,是一个 All-in-one 的监控平台。
夜莺功能概览

使用二进制方式部署夜莺

使用二进制方式部署夜莺( Nightingale ),适合生产环境部署,本文讲解中心化部署方式,对于边缘机房部署模式会在后续文档中介绍
使用二进制方式部署夜莺

青山工业基于夜莺搭建统一应用可观测平台,实现智能根因分析与告警治理

青山工业基于开源夜莺(Nightingale)打造统一应用可观测平台,整合IT/OT混合架构监控,结合OpenClaw实现AI故障智能根因研判,MTTR降低60%,无效告警减少95%,为汽车零部件行业数字化转型提供落地参考。
青山工业基于夜莺搭建统一应用可观测平台,实现智能根因分析与告警治理

博威尔特夜莺监控用户案例:越南三地工厂、ITSM 工单闭环与 MES

博威尔特(博威集团越南光伏制造)夜莺(Nightingale)监控落地案例:夜莺+Prometheus+Categraf 覆盖三地工厂虚拟化、Oracle/MySQL/SQL Server 与产线 MES;告警自动转 ITSM 并联钉钉与知识库,越南语二开。替代 Zabbix 复杂配置与 Excel 巡检,实现告警闭环与运维可视化。
博威尔特夜莺监控用户案例:越南三地工厂、ITSM 工单闭环与 MES

品高软件夜莺监控实践:私有云统一可观测与云平台融合

品高软件分享基于夜莺(Nightingale)的云平台统一监控落地实践:通过 bingoMS、bingo_categraf 与夜莺深度融合,实现云平台概览、巡检式监控、虚拟机无 Agent 监控、Ceph 存储详情、磁盘网卡精确告警及错误日志告警,最大规模 500+ 云节点、3000+ 虚拟机、240+ 告警规则。含选型对比、架构设计与实施建议。
品高软件夜莺监控实践:私有云统一可观测与云平台融合

联易融夜莺+FlashDuty 实践:Event Processor 告警增强与故障闭环管理

联易融数字科技分享基于夜莺 v8 Event Processor 与 FlashDuty 的告警增强与闭环实践:通过 Event Update 自动关联日志与 K8s 事件、Callback 执行 SOP 自动诊断、FlashDuty 实现值班与故障闭环,告警噪音降低超 60%,值班体验与故障可追溯性显著提升。含架构设计、实施经验与 AI 值守规划。
联易融夜莺+FlashDuty 实践:Event Processor 告警增强与故障闭环管理

极豆科技夜莺监控实践:20 个 K8s 集群统一监控与告警治理

极豆科技分享基于夜莺(Nightingale)的统一监控落地实践:面对 20 个 Kubernetes 集群的监控碎片化,用夜莺替代多套 Prometheus+Grafana,实现多数据源接入、告警动态路由与智能抑制,故障定位时间缩短至 15 分钟内,告警误报率下降 76%。含选型对比、架构设计与告警治理经验。
极豆科技夜莺监控实践:20 个 K8s 集群统一监控与告警治理

恒生电子实践:基于夜莺+eBPF构建金融级万节点一体化监控体系

恒生电子介绍了如何基于夜莺(Nightingale)+ Categraf + VictoriaMetrics + VictoriaLogs,在万级节点、数十万应用实例的金融场景下,构建指标+日志+网络链路一体化监控体系,并通过自研 eBPF 抓包插件实现网络故障的秒级发现与分钟级定位。文章涵盖选型对比、架构设计、eBPF 关键指标、动态 label 治理等实战经验。
恒生电子实践:基于夜莺+eBPF构建金融级万节点一体化监控体系

夜莺监控设计思考(五)告警原理和处理流程深度剖析

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺最核心的逻辑:告警。涉及告警事件的产生、告警事件的后续处理、告警事件的通知。
夜莺监控设计思考(五)告警原理和处理流程深度剖析

夜莺监控设计思考(四)关于机器那些事儿

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺里跟机器相关的那些事,机器的数据采集、机器的归组打标签、机器的元信息、机器的告警分派等。
夜莺监控设计思考(四)关于机器那些事儿

夜莺监控设计思考(三)时序库、agent 的一些设计考量

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺和时序库、agent 的一些设计考量。
夜莺监控设计思考(三)时序库、agent 的一些设计考量

夜莺监控设计思考(二)边缘机房架构思考

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺边缘机房架构思考。
夜莺监控设计思考(二)边缘机房架构思考

夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计

这将是一个系列,讲解夜莺监控的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。
夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计

如何监控多个进程的存活和CPU、内存占用

本文介绍如何使用夜莺监控(Nightingale)和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。
如何监控多个进程的存活和CPU、内存占用

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云