项目介绍
项目介绍
夜莺监控是一款开源云原生观测分析工具,采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。夜莺于 2020 年 3 月 20 日,在 github 上发布 v1 版本,已累计迭代 100 多个版本。
夜莺最初由滴滴开发和开源,并于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。夜莺的核心研发团队,也是 Open-Falcon 项目原核心研发人员。
项目代码
欢迎大家在 Github 上关注夜莺项目,及时获取项目更新动态,有任何问题,也欢迎提交 Issue,以及提交 PR,开源社区,需要大家一起参与才能有蓬勃的生命力。
关于文档
V6版本的文档已趋完善。请各位小伙伴先通读文档,大部分问题就可以解决了。一部分常见问题也录制了答疑小视频,放到了 SRETalk 视频号,欢迎关注学习:
另外,之前在极客时间开设过一个专栏,系统性的讲解了运维监控相关知识,建议大家也都看一下:《运维监控实战笔记》,专栏里提过的知识,本文档将不再赘述。
对比 Prometheus
这是经常被问到的问题。如果您当前使用的是 Prometheus,而且没有痛点,那么就不需要考虑夜莺了,用好现在的体系就可以了。如果您用了多个时序库,比如 Prometheus、VictoriaMetrics、Thanos 等等,需要一个统一的平台来管理告警、看图,夜莺是一个选择。如果您想把监控的能力开放给公司所有研发团队,让研发团队自助服务,Prometheus 使用配置文件的告警规则管理方式不方便,夜莺是一个选择。如果您需要更为灵活的告警策略配置,比如控制生效时间、一套规则生效多个集群,夜莺是一个选择。如果您需要告警自愈能力,告警之后自动执行个脚本啥的,夜莺是一个选择。如果您需要一个统一的事件 OnCall 中心,聚合各个监控系统的告警,做统一的告警聚合降噪、排班认领升级、灵活的分发和协同,FlashDuty 是一个选择。
另外,相比 Grafana,夜莺的看图能力还是差一些,因为 Grafana 是 agpl 协议,我们也没法封装 Grafana 进夜莺,所以夜莺的看图是自研的,和 Grafana 没法 100% 兼容,当然,夜莺支持导入 Grafana 的仪表盘 JSON,基础的图表都是兼容的。另外,夜莺设计了内置告警规则和内置仪表盘,方便用户开箱即用,现在覆盖了常用组件,后面随着时间推移,这个体验也会越来越好,期待大家一起共建。
以笔者观察来看,很多公司是一套组合方案(成年人的世界,没有非黑即白,都要):
- 数据采集:组合使用了各种 agent 和 exporter
- 存储:时序库主要使用 VictoriaMetrics,因为 VictoriaMetrics 兼容 Prometheus,而且性能更好且有集群版本
- 告警引擎:使用夜莺,方便不同的团队管理协作,内置了一些规则开箱即用
- 看图可视化:使用 Grafana,图表更为炫酷,社区非常庞大
- 告警事件OnCall分发:使用 FlashDuty,聚合了 Zabbix、Prometheus、夜莺、Open-Falcon、云监控、Elastalert 等各类告警事件,统一聚合降噪、排班、认领升级等
企业版
快猫星云技术团队是夜莺监控的创始团队。 点击查看以下 PDF 材料,了解更多企业版功能。
点击 联系我们,与快猫团队交流 !
当然,我们也提供性价比极高的专业版,提供商业技术支持服务,以及对监控功能的增强,具体可以从这里了解。
获得帮助
- 方式1:github issue,提问题提 Bug 都可以从这个入口进入,信息给的尽量详细些,问题的话给出复现步骤,附上截图、日志、配置等信息,这样大家才能帮你解决问题
- 方式2:微信用户互助交流群,加我微信好友(我的微信:
picobyte
),备注:夜莺群-<您的公司>-<您的姓名>,我会拉你入群。
注意:您当前查看的是 v6 版本的文档,我们建议您尽快升级到 v7 版本(可以平滑升级,先备份,然后替换二进制、integrations目录、配置文件即可),左侧菜单可以看到 v7 版本的文档,也可以点击 这里 直达。