做开源商业化创业3年,一点小感悟

夜莺开源项目背后是有一个商业团队持续支持的,这样项目的生命力会更为持久,基于这个开源项目做商业化也有3年了,本文是一些创业思考
做开源商业化创业3年,一点小感悟

高效的OnCall机制:从理念到实践

告警 OnCall 机制是企业运维团队保障业务连续性的重要手段,本文介绍了为什么要有值班制度、设计高效值班制度的核心要素、在 Flashduty 中的值班实践以及案例分享。
高效的OnCall机制:从理念到实践

夜莺监控支持 ES 日志告警了

夜莺监控从 v8.beta3 开始,支持了 ElasticSearch 的告警,这是社区一直心心念念的功能。日志告警是重要监控手段,对服务稳定性很是关键,欢迎大家体验起来。
夜莺监控支持 ES 日志告警了

Flashduty 监控告警功能简介

Flashduty 作为一款 OnCall 平台,核心解决的是告警事件产生之后的环节,包括收敛降噪、排班、认领升级、分发、协同等。实际 Flashduty 也提供了告警引擎功能,可以在 Flashduty 上管理告警规则,Flashduty 根据规则去查询各类数据源做异常判定,进而生成告警事件,类似 vmalert 的功能。
Flashduty 监控告警功能简介

ETCD 关键监控指标

在本文中,我们将了解 etcd 如何存储和管理 Kubernetes 集群的状态数据,以及它如何提供高可用性和数据一致性。我们还将了解应监控的关键指标,以确保 etcd 有效支持 Kubernetes 集群的运行状况和性能。通过监控 etcd 的资源、监视和 Raft 指标,您可以了解 etcd 集群的运行状况,并及时发现潜在的问题。这将有助于您确保 etcd 集群的稳定性和可靠性,从而提高 Kubernetes 集群的性能和可用性。
ETCD 关键监控指标

Kubernetes 重度依赖 ETCD,如何确保 ETCD 集群稳定?

Kubernetes 集群逐渐变大,其中 ETCD 作为 Kubernetes 的存储,其稳定性尤为关键,我想确保 ETCD 集群稳定,应该从哪些方面着手落实?
Kubernetes 重度依赖 ETCD,如何确保 ETCD 集群稳定?

SNMPTrap 消息发送到 Flashduty 平台

SNMP 是监控网络设备的主要协议,但是确实比较麻烦,如果只是想简单高效的监控网络设备的关键问题并告警,使用 SNMP Trap 是一个不错的方式,本文介绍使用 snmptrapd、snmptt 搭配 FlashDuty 完成 Trap 消息的告警
SNMPTrap 消息发送到 Flashduty 平台

夜莺开源监控突破一万 star,当我们离开的时候希望世人还记得我们

夜莺监控项目在上周突破了一万 star,算是一个小小的里程碑。本文聊聊做开源这几年的心路历程。一些小小的感悟。
夜莺开源监控突破一万 star,当我们离开的时候希望世人还记得我们

使用 snmptrapd 和 snmptt 解析 SNMP Trap

SNMP trap 消息是 SNMP 设备主动向管理系统发送的异步通知,本文介绍如何使用 snmptrapd 和 snmptt 解析 SNMP Trap 消息,对于一些关键事件可以进行实时监控和告警,对系统稳定性有极大帮助

SNMP trap PDU 是何含义?

当我们聊 SNMP 的时候,提到的 SNMP trap PDU 是何含义?

/proc/meminfo 文件详解

Linux 中内存信息取自 /proc/meminfo,这个文件字段较多,很多新手不清楚每个字段的含义,本文做一个解释。
/proc/meminfo 文件详解

为什么主动网站监控是您提高客户满意度的秘密工具

主动网站监控是企业提高客户满意度的秘密武器,通过确保网站的持续可用性、优化网站性能、提升网站内容的准确性和及时性、增强客户服务响应能力等方面,为客户提供更好的体验,赢得客户的信任和忠诚,实现企业的长期发展和商业成功。
为什么主动网站监控是您提高客户满意度的秘密工具

Helm Chart 教程:初学者简单指南

Helm Chart 是 Kubernetes 应用程序的包装和部署工具。它使我们能够轻松地在多个环境中部署应用程序。在本 Helm Chart 教程中,我们了解了 Helm Chart 的结构、组件和最佳实践。
Helm Chart 教程:初学者简单指南

Kafka Topic 概念以及如何规划 Topic

Kafka Topic 是 Kafka 消息队列中的核心概念,它提供了数据分类、隔离和并行处理的机制,帮助生产者和消费者之间实现解耦和高效通信。合理规划 Kafka Topic 对于构建高性能、高可用的数据处理系统至关重要,需要根据业务领域、数据量、一致性需求等因素来设计和管理 Topic,以确保系统的稳定性和可扩展性。
Kafka Topic 概念以及如何规划 Topic

MySQL的几个重要调优配置

文章介绍了MySQL的几个重要调优配置,包括innodb_buffer_pool_size、innodb_log_file_size、max_connections等,说明了各配置作用及设置建议,助提升数据库性能。

夜莺 v8 第一个版本来了,开始做有意思的功能了

夜莺 v8 大版本已经启动开发,预计 25 年 7 月份发正式版,相比 v7 大概会做四五个大功能,每个功能做完了做稳定了都会提前放出来供大家体验,以 beta 来命名,实际是稳定的,大家可以放心升级
夜莺 v8 第一个版本来了,开始做有意思的功能了

告警事件 OnCall 平台,如何选型

告警事件 OnCall 平台如何选型?本文罗列了两个开源项目和一个商业项目,介绍了其优缺点,希望对大家有所帮助。OnCall 平台是 OnCall 文化落地的重要依托,选型时需慎重考虑。
告警事件 OnCall 平台,如何选型

告警收敛:提升监控效率的关键策略

文章介绍告警收敛概念、方法(基于规则、机器学习、时间序列分析)、案例及发展趋势,助企业优化告警管理。
告警收敛:提升监控效率的关键策略

OpenTelemetry 101:面向 IT 领导者和爱好者的非技术指南

OpenTelemetry 是一个开源项目,旨在标准化遥测数据的收集和处理。通过提供一组 API、库和代理,OpenTelemetry 使开发人员能够收集、处理和可视化来自应用程序、服务和系统的遥测数据。

什么是 OpenTelemetry?日志、指标、跟踪的开源标准

OpenTelemetry 是一个开源可观测性框架,旨在提供统一的标准和工具,以便开发人员可以轻松地收集、生成、收集和导出遥测数据。这些数据包括日志、指标和跟踪,这些数据对于了解应用程序和基础设施的执行情况至关重要
什么是 OpenTelemetry?日志、指标、跟踪的开源标准

标签
aiops alertmanager apache apiserver apm categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl flashcat flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google grok_exporter hadoop hana haproxy hdfs helm httpstat iac ibex ilo im协同 it监控 jaeger jenkins jmx-exporter jolokia kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux log log-monitor logging logs loki metrics metricsql mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 错误预算 错误预算机制 滴滴夜莺 钉钉 飞书 服务稳定性 告警 告警oncall 告警风暴 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控工具 监控设计思考 监控系统 监控系统合规 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 链路追踪 埋点监控 灭火图 普罗米修斯 企业微信 人工智能 日志 日志存储 日志分析 日志告警 日志监控 容器 时序库 时序数据库 事件监控 手把手构建生产级监控系统 提问的智慧 统一监控 网络可观测性 网络排障 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能告警 自监控
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat