开源监控 - 夜莺项目 v7 正式发版了

经过一年的迭代,夜莺 v7 于 2024.7.26 在第二届 CCF·夜莺 开发者创新论坛上正式发版

Jenkins 高可用,到底怎么搞?

该博客涵盖了基本的 Jenkins 架构及其相关组件。如果您是 Jenkins 的初学者,它将帮助您了解 Jenkins 组件如何协同工作以及涉及的关键配置。
Jenkins 高可用,到底怎么搞?

Jenkins 架构详解 - 初学者指南

该博客涵盖了基本的 Jenkins 架构及其相关组件。如果您是 Jenkins 的初学者,它将帮助您了解 Jenkins 组件如何协同工作以及涉及的关键配置。
Jenkins 架构详解 - 初学者指南

实施 SLA、SLO 和 SLI:SRE 实用指南

探索相关术语定义以及 SLA、SLO 和 SLI 如何帮助有效监控和维护系统性能。

用实际例子讲透 Kubernetes Pod

在本指南中,我将使用实际例子讲解 Kubernetes Pod 的概念。
用实际例子讲透 Kubernetes Pod

夜莺 v7.beta14 发版,支持灵活定义告警事件标签

告警事件中一大堆标签不胜其扰?尤其是 Kubernetes 的告警事件,夜莺 v7.beta14 发版,支持灵活定义告警事件标签,用最简单的方式干掉没用的标签

一张图详解开源监控夜莺(Nightingale)的架构

本文详解夜莺的架构
一张图详解开源监控夜莺(Nightingale)的架构

7 张图,彻底讲透 Prometheus 架构原理

在本指南中,我们将详细了解 Prometheus 架构,以有效地理解、配置和利用 Prometheus。
7 张图,彻底讲透 Prometheus 架构原理

10 张图,说透 Kubernetes 架构和数据流

这本关于 Kubernetes 架构的综合指南旨在通过插图详细解释每个 Kubernetes 组件。
10 张图,说透 Kubernetes 架构和数据流

运维工程师(SRE)必须掌握的技能有哪些?

运维工程师、SRE,应该掌握哪些技能才算合格?
运维工程师(SRE)必须掌握的技能有哪些?

适合初学者的 17 个最佳 Linux 网络和故障排除命令

网络配置、诊断和一般Linux 故障排除是 系统管理的重要组成部分。即使对于使用 Linux 系统的开发人员来说,了解Linux 网络命令也是一个优势。这篇文章将介绍Linux 系统中原生可用的重要的Linux 网络和故障排除命令。
适合初学者的 17 个最佳 Linux 网络和故障排除命令

监控都没做好,你还要可观测性...

很多公司听说可观测性好,就要上马可观测性项目,自研/采购,各种投入,结果发现效果很差,业务不认可,最终一地鸡毛
监控都没做好,你还要可观测性...

最佳实践:OnCall 文化值得落地,晚上被告警吵醒的概率确实大大降低了

作为运维人员,晚上被告警吵醒绝对是最痛苦的经历之一。听说行业里有专门做 OnCall 的产品,比如 PagerDuty、Flashduty 等,莫非这些 OnCall 产品可以让运维人员晚上避免起床?本文从几个方面来介绍一下如何才能睡个好觉。
最佳实践:OnCall 文化值得落地,晚上被告警吵醒的概率确实大大降低了

夜莺 v7.beta13 发版,继续优化细节

夜莺 v7.beta13 发版,继续优化细节,主要变更是提供日志的 KQL 查询模式、Prometheus 类型的数据源在即时查询时提供历史查询记录功能、记录规则提供 CRON 方式控制执行频率,可以借此指定固定时刻执行

Flashduty vs Pagerduty,产品、服务和价格深入对比

从产品、服务与价格三个维度探讨IT管理人员在为开发运维团队寻找高效协作的故障管理解决方案时应该提出的问题。
Flashduty vs Pagerduty,产品、服务和价格深入对比

晚上总被电话吵醒?OnCall来帮你

告警风暴是作为技术人员尤其是运维人员的巨大痛点,有时甚至一周七天每天被吵醒,而老板安排的活白天还要照干不误,导致精神疲惫,有没有什么办法可以破解这个难题呢?
晚上总被电话吵醒?OnCall来帮你

使用 夜莺+Categraf 快速建设 Redis 监控

Redis 是极为常用的缓存数据库,本文介绍使用 Categraf 快速建设 Redis 监控,夜莺的模板中心中已经内置了一些模板,可以直接导入使用
使用 夜莺+Categraf 快速建设 Redis 监控

使用 Categraf 快速建设 MySQL 监控,同时介绍夜莺模板中心

MySQL 是极为常用的数据库,本文介绍使用 Categraf 快速建设 MySQL 监控,夜莺的模板中心中已经内置了一些模板,可以直接导入使用
使用 Categraf 快速建设 MySQL 监控,同时介绍夜莺模板中心

夜莺 v7.beta12.1 发版,支持集成 Grafana

夜莺擅长处理多 Prometheus 集群的告警管理,在仪表盘这块,提供了一些内置仪表盘,但从完善度来讲,是没法和 Grafana 生态相比的,从 v7.beta12.1 版本开始,夜莺支持了内置 Grafana 仪表盘,省得大家在系统之间跳来跳去了,对于已经习惯使用 Grafana 的用户,可以考虑升级到此版本

文件句柄的监控,别等故障了再回来加监控

讲解 node-exporter 的 filefd 插件如何监控文件句柄,以及 ulimit 的一些坑

标签
ai aiops alertmanager apache apiserver apm azure categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl faq featureflag filelog flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google gpu grafana grok_exporter hadoop hana haproxy hdfs helm httpstat huatuo iac ibex ilo im协同 incident it监控 jaeger jenkins jmx jmx-exporter jolokia jvm k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki metrics metricshub metricsql mimir mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis rum salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre syslog telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 出海业务 创业 错误预算 错误预算机制 大厂实践 大模型 大模型智能oncall 滴滴夜莺 钉钉 钉钉通知 飞书 飞书通知 服务稳定性 告警 告警oncall 告警丰富 告警风暴 告警规则 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警数据孤岛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障复盘 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控告警 监控工具 监控设计思考 监控系统 监控系统合规 进程监控 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 连锁门店 链路追踪 埋点监控 面试题 灭火图 普罗米修斯 企微通知 企业微信 人工智能 日志 日志采集 日志存储 日志分析 日志告警 日志监控 容器 熔断 时序库 时序数据库 事件监控 手把手构建生产级监控系统 他山之石 提问的智慧 通知规则 统一监控 网络可观测性 网络排障 尾采样 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 系统架构设计 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能oncall 智能告警 自监控 最佳实践
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
Flashduty
Flashduty