快猫星云博客 | 一站式智能观测平台 | 可观测性

可观测性的 AI-Ready 之路

任何方向要真正落地智能化，首先要完成数据建设，以达到AI-Ready状态，再用AI做最后一公里的催化剂。可观测性方向如何才能做到AI-Ready？本文介绍Flashcat完成AI-Ready建设的方法。

Posted by 快猫技术 on 2026-01-22 15:00:00

Flashcat产品 Flashcat 产品技术 Flashcat 可观测性稳定性保障灭火图告警 Observability Opentelementry AI

夜莺监控设计思考（五）告警原理和处理流程深度剖析

这将是一个系列，讲解夜莺监控的设计思考，可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺最核心的逻辑：告警。涉及告警事件的产生、告警事件的后续处理、告警事件的通知。

Posted by 巴辉特 on 2026-01-18 19:11:51

夜莺夜莺监控 Nightingale

夜莺监控设计思考（四）关于机器那些事儿

这将是一个系列，讲解夜莺监控的设计思考，可以理解为原理+最佳实践+产品设计时的折中取舍。本篇聊聊夜莺里跟机器相关的那些事，机器的数据采集、机器的归组打标签、机器的元信息、机器的告警分派等。

Posted by 巴辉特 on 2026-01-18 19:11:38

夜莺夜莺监控 Nightingale

夜莺监控设计思考（三）时序库、agent 的一些设计考量

这将是一个系列，讲解夜莺监控的设计思考，可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺和时序库、agent 的一些设计考量。

Posted by 巴辉特 on 2026-01-18 19:11:27

夜莺夜莺监控 Nightingale

夜莺监控设计思考（二）边缘机房架构思考

这将是一个系列，讲解夜莺监控的设计思考，可以理解为原理+最佳实践+产品设计时的折中取舍。本篇介绍夜莺边缘机房架构思考。

Posted by 巴辉特 on 2026-01-18 19:11:14

夜莺夜莺监控 Nightingale

夜莺监控设计思考（一）整体定位、架构设计、单进程多进程选择、高可用设计

这将是一个系列，讲解夜莺监控的设计思考，可以理解为原理+最佳实践+产品设计时的折中取舍。

Posted by 巴辉特 on 2026-01-18 19:11:04

夜莺夜莺监控 Nightingale

日志告警新选择：Flashduty Monitors 全面支持 Loki 和 VictoriaLogs

在云原生时代，日志监控已成为可观测性体系的核心支柱。Flashduty Monitors 告警引擎现已全面支持 Grafana Loki 和 VictoriaLogs 数据源，提供原生查询语法兼容、三种告警模式、智能恢复机制等强大功能，助力团队构建可靠的日志告警能力。

Posted by 巴辉特 on 2026-01-09 15:28:07

Flashduty

Vector 日志采集实战：采集夜莺日志推送 VictoriaLogs 完整教程

详细教程：使用 Vector 采集 Nightingale 夜莺监控系统日志并推送至 VictoriaLogs，包含 Docker 容器化部署、VRL 日志解析配置、Elasticsearch 协议对接等完整实践步骤。

Posted by 巴辉特 on 2026-01-09 11:17:57

夜莺日志采集 VictoriaLogs Vector

UDP端口探活的那些细节

UDP 是无连接的，无法用建立连接的形式判断端口是否存活，如何为 Categraf 实现一个简单通用的 UDP 探测插件呢？

Posted by 孔飞@快猫星云 on 2026-01-09 11:16:02

Categraf Categraf Nightingale

重构 Categraf SNMP 调度器：从随机抖动到确定性自适应

剖析 Categraf 针对 SNMP 插件的调度重构过程。从最初的简单 Ticker 到参考 Zabbix 实现最小堆与墙上时钟对齐，再到通过 0.85 因子实现自适应流量整形，解决采集周期漂移与设备负载突增问题。

Posted by 宋芮涛@Zenlayer 孔飞@快猫星云 on 2026-01-09 11:15:10

Categraf Categraf SNMP Observability

网络监控：交换机监控新姿势

来自社区用户写的文章，在网络监控领域利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus，使其更加友好和方便，并且性能和扩展性进一步提高

Posted by 网络小斐 on 2026-01-09 11:14:43

Categraf categraf SNMP

Categraf 监控采集器常见问题汇总

本文汇总了 Categraf 监控采集器在使用过程中常见的问题及其解决方案，帮助用户更好地配置和使用 Categraf，实现高效的监控数据采集与上报。

Posted by 巴辉特 on 2026-01-09 11:12:15

Categraf

Categraf 托管与自升级

本文介绍 Categraf 如何通过一条命令完成自身的托管、服务启停、状态查看、自动升级。

Posted by 孔飞@快猫星云 on 2026-01-09 11:11:46

Categraf Categraf Nightingale

网络监控：无线监控这个面板好养眼

来自社区用户写的文章，利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus，紧接上篇对交换机的监控，本篇是一个无线设备的监控的案例

Posted by 网络小斐 on 2026-01-09 11:10:09

Categraf Categraf SNMP

通过 Categraf SNMP 插件采集监控数据

支持 SNMP 方式采集数据的 agent 有很多，Telegraf、Categraf、Datadog-agent、snmp-exporter等，我们这次来介绍 Categraf，举一反三，原理上都是一样的。

Posted by 秦晓辉@快猫星云 on 2026-01-09 11:09:44

Categraf SNMP Categraf

Categraf SNMP 插件优化：解析带单位的监控指标

Categraf SNMP 插件通过启发式算法自动提取带单位字符串中的数值，解决浪潮等服务器返回 60 degree Celsius 格式导致指标采集失败的问题，无需正则即可智能解析温度、电流等复杂格式。

Posted by 孔飞@快猫星云 on 2026-01-09 11:09:22

Categraf Categraf SNMP

如何监控多个进程的存活和CPU、内存占用

本文介绍如何使用夜莺监控（Nightingale）和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。

Posted by 快猫运营 on 2026-01-09 11:08:50

Categraf 夜莺监控 Categraf VictoriaMetrics

Nginx stub status采集

本文讲解如何从头开始编译http_stub_status_module模块，并使用input.nginx插件采集指标。

Posted by 孔飞@快猫星云 on 2026-01-09 11:07:00

Categraf Categraf Nightingale

Nginx upstream采集

本文讲解如何添加nginx_upstream_check模块，并使用input.nginx_upstream_check插件采集指标。

Posted by 孔飞@快猫星云 on 2026-01-09 11:07:00

Categraf Categraf Nightingale

Nginx vts采集

本文讲解如何添加vts模块，并使用input.prometheus插件采集指标。

Posted by 孔飞@快猫星云 on 2026-01-09 11:07:00

Categraf Categraf Nightingale

ai aiagent aiops alertmanager apache apiserver apm azure categraf catpaw ccf cdn chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl faq featureflag filelog flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google gpu grafana grok_exporter hadoop hana haproxy hdfs helm httpstat huatuo iac ibex ilo im协同 incident it监控 jaeger jenkins jmx jmx-exporter jolokia jvm k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki mcp-server metrics metricshub metricsql mimir mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis rum salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre syslog telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星不可变基础设施出海出海业务创业错误预算错误预算机制大厂实践大模型大模型智能oncall 滴滴夜莺钉钉钉钉通知飞书飞书通知分布式追踪服务稳定性告警告警oncall 告警丰富告警风暴告警规则告警降噪告警聚合告警排班告警认领告警升级告警事件告警收敛告警数据孤岛告警通知告警响应告警协同告警抑制告警引擎告警值班告警指派告警自愈根因定位故障故障复盘故障管理计算机学会架构师监控监控agent 监控方法论监控告警监控工具监控设计思考监控系统监控系统合规进程监控开源开源监控开源商业化开源夜莺可观测平台可观测性可观测性论坛可观测性体系建设客户案例快猫快猫星云连锁门店链路追踪埋点监控面试题灭火图普罗米修斯企微通知企业微信前端监控人工智能日志日志采集日志存储日志分析日志告警日志监控容器熔断时序库时序数据库事件监控手把手构建生产级监控系统他山之石提问的智慧通知规则统一监控网络可观测性网络排障尾采样稳定性保障稳定性方法论稳定性体系稳定性体系建设系统架构设计信创业务监控夜莺夜莺v8 夜莺短信告警夜莺黄埔营夜莺监控夜莺开发者创新论坛夜莺开源项目夜莺业务组夜莺用户案例医药健康仪表盘用户案例云厂商云原生监控云原生组织运维运维百家讲坛运维告警运维监控运维监控系统运维监控系统实战笔记智能oncall 智能告警自监控最佳实践