告警事件如何与 CMDB 打通附加更多元信息

告警事件产生之后,如果能够附加更多元信息,对于降低沟通成本、提高排障效率都有帮助,那告警事件如何与 CMDB 等打通获取元信息并附加到事件之上呢,本文会分享一些思路
告警事件如何与 CMDB 打通附加更多元信息

进程监控,有效的黑盒监控手段

进程监控是一种黑盒监控手段,可以监控进程的运行状态,进程的 CPU、内存、IO等资源消耗情况。本文会介绍使用 Categraf 进行进程监控的方法

两种告警降噪的思路

告警风暴是一个挺头疼的问题。通过技术手段可以解决,本文会提供两种告警降噪的思路,如果你也有告警降噪的需求,可以参考本文
两种告警降噪的思路

ElasticSearch query_string 语法样例,收藏备用

ElasticSearch 支持多种查询语法,DSL、SQL、EQL 等,其中 DSL 中的 query_string 极为灵活,可以看做一种小型查询语法,本文介绍一下 query_string 的几个简单样例,帮助你快速入门

Grafana统一可视化了,告警如何统一?

对于大部分公司,通常都不止一套监控、可观测性相关的系统,云上的、云下的,开源的、商业的,指标的、日志的、链路的,各个系统体验不同,权限难管,如何统一化并为各个团队赋能,是很多技术负责人极为头疼的问题。
Grafana统一可视化了,告警如何统一?

数据可视化用 Grafana,告警就用 Flashduty

对于大部分公司,通常都不止一套监控、可观测性相关的系统,各个系统体验不同,有些技术人员甚至都不知道公司有这么多套更遑论使用了,如何统一化?可视化方面一般会选择 Grafana,告警方面,推荐 Flashduty
数据可视化用 Grafana,告警就用 Flashduty

Flashduty 支持了引擎失联告警功能,大幅提升可用性

Flashduty 告警引擎功能提供了失联告警能力,即在引擎失联之后可以自动生成告警事件,通知系统维护人员,大大提升了 Flashduty 告警引擎的可用性
Flashduty 支持了引擎失联告警功能,大幅提升可用性

做开源商业化创业3年,一点小感悟

夜莺开源项目背后是有一个商业团队持续支持的,这样项目的生命力会更为持久,基于这个开源项目做商业化也有3年了,本文是一些创业思考
做开源商业化创业3年,一点小感悟

高效的OnCall机制:从理念到实践

告警 OnCall 机制是企业运维团队保障业务连续性的重要手段,本文介绍了为什么要有值班制度、设计高效值班制度的核心要素、在 Flashduty 中的值班实践以及案例分享。
高效的OnCall机制:从理念到实践

夜莺监控支持 ES 日志告警了

夜莺监控从 v8.beta3 开始,支持了 ElasticSearch 的告警,这是社区一直心心念念的功能。日志告警是重要监控手段,对服务稳定性很是关键,欢迎大家体验起来。
夜莺监控支持 ES 日志告警了

Flashduty 监控告警功能简介

Flashduty 作为一款 OnCall 平台,核心解决的是告警事件产生之后的环节,包括收敛降噪、排班、认领升级、分发、协同等。实际 Flashduty 也提供了告警引擎功能,可以在 Flashduty 上管理告警规则,Flashduty 根据规则去查询各类数据源做异常判定,进而生成告警事件,类似 vmalert 的功能。
Flashduty 监控告警功能简介

ETCD 关键监控指标

在本文中,我们将了解 etcd 如何存储和管理 Kubernetes 集群的状态数据,以及它如何提供高可用性和数据一致性。我们还将了解应监控的关键指标,以确保 etcd 有效支持 Kubernetes 集群的运行状况和性能。通过监控 etcd 的资源、监视和 Raft 指标,您可以了解 etcd 集群的运行状况,并及时发现潜在的问题。这将有助于您确保 etcd 集群的稳定性和可靠性,从而提高 Kubernetes 集群的性能和可用性。
ETCD 关键监控指标

Kubernetes 重度依赖 ETCD,如何确保 ETCD 集群稳定?

Kubernetes 集群逐渐变大,其中 ETCD 作为 Kubernetes 的存储,其稳定性尤为关键,我想确保 ETCD 集群稳定,应该从哪些方面着手落实?
Kubernetes 重度依赖 ETCD,如何确保 ETCD 集群稳定?

SNMPTrap 消息发送到 Flashduty 平台

SNMP 是监控网络设备的主要协议,但是确实比较麻烦,如果只是想简单高效的监控网络设备的关键问题并告警,使用 SNMP Trap 是一个不错的方式,本文介绍使用 snmptrapd、snmptt 搭配 FlashDuty 完成 Trap 消息的告警
SNMPTrap 消息发送到 Flashduty 平台

夜莺开源监控突破一万 star,当我们离开的时候希望世人还记得我们

夜莺监控项目在上周突破了一万 star,算是一个小小的里程碑。本文聊聊做开源这几年的心路历程。一些小小的感悟。
夜莺开源监控突破一万 star,当我们离开的时候希望世人还记得我们

使用 snmptrapd 和 snmptt 解析 SNMP Trap

SNMP trap 消息是 SNMP 设备主动向管理系统发送的异步通知,本文介绍如何使用 snmptrapd 和 snmptt 解析 SNMP Trap 消息,对于一些关键事件可以进行实时监控和告警,对系统稳定性有极大帮助

SNMP trap PDU 是何含义?

当我们聊 SNMP 的时候,提到的 SNMP trap PDU 是何含义?

/proc/meminfo 文件详解

Linux 中内存信息取自 /proc/meminfo,这个文件字段较多,很多新手不清楚每个字段的含义,本文做一个解释。
/proc/meminfo 文件详解

为什么主动网站监控是您提高客户满意度的秘密工具

主动网站监控是企业提高客户满意度的秘密武器,通过确保网站的持续可用性、优化网站性能、提升网站内容的准确性和及时性、增强客户服务响应能力等方面,为客户提供更好的体验,赢得客户的信任和忠诚,实现企业的长期发展和商业成功。
为什么主动网站监控是您提高客户满意度的秘密工具

Helm Chart 教程:初学者简单指南

Helm Chart 是 Kubernetes 应用程序的包装和部署工具。它使我们能够轻松地在多个环境中部署应用程序。在本 Helm Chart 教程中,我们了解了 Helm Chart 的结构、组件和最佳实践。
Helm Chart 教程:初学者简单指南

标签
aiops alertmanager apache apiserver apm categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl flashcat flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google grok_exporter hadoop hana haproxy hdfs helm httpstat iac ibex ilo im协同 it监控 jaeger jenkins jmx-exporter jolokia kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux log log-monitor logging logs loki metrics metricsql mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 错误预算 错误预算机制 滴滴夜莺 钉钉 飞书 服务稳定性 告警 告警oncall 告警丰富 告警风暴 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控工具 监控设计思考 监控系统 监控系统合规 进程监控 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 链路追踪 埋点监控 灭火图 普罗米修斯 企业微信 人工智能 日志 日志存储 日志分析 日志告警 日志监控 容器 时序库 时序数据库 事件监控 手把手构建生产级监控系统 提问的智慧 统一监控 网络可观测性 网络排障 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能告警 自监控
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat