Categraf

Categraf 是一款 All-in-One 的数据采集器,支持指标、日志采集;支持物理机、虚拟机、交换机、容器、K8s、多种中间件/数据库的数据采集,支持混合云架构、云原生架构、多云架构。同时,Categraf 期望不止提供采集能力,还附带提供仪表盘和告警规则,力求开箱即用。

Categraf 总体介绍

Categraf 是快猫团队开源的一款采集器,All-in-one 的设计,既可以采集指标,也可以采集日志、链路数据

从一个 Issue 谈 PID 1 与 Reaping 机制

深入解析 Categraf 僵尸进程治理方案。本文基于 GitHub Issue #1261,详细剖析了在容器化环境下 PID 1 导致的资源泄漏问题,并展示了如何通过 Go 语言实现 reapDaemon、利用 SIGCHLD 信号与 wait4 系统调用优雅地清理僵尸进程,提升系统稳定性

重构 Categraf SNMP 调度器:从随机抖动到确定性自适应

剖析 Categraf 针对 SNMP 插件的调度重构过程。从最初的简单 Ticker 到参考 Zabbix 实现最小堆与墙上时钟对齐,再到通过 0.85 因子实现自适应流量整形,解决采集周期漂移与设备负载突增问题。

Categraf SNMP 插件优化:解析带单位的监控指标

Categraf SNMP 插件通过启发式算法自动提取带单位字符串中的数值,解决浪潮等服务器返回 60 degree Celsius 格式导致指标采集失败的问题,无需正则即可智能解析温度、电流等复杂格式。

记一次被社区用户逼着修Bug经历

记录 Categraf http_response 插件报错 TLS handshake failure 的排查过程。分析 IPv4/IPv6 入口 TLS 配置差异、Go 1.24 默认加密套件变更导致的握手失败,提供 tls_cipher_suites 配置方案解决兼容性问题。
记一次被社区用户逼着修Bug经历

如何监控多个进程的存活和CPU、内存占用

本文介绍如何使用夜莺监控(Nightingale)和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。
如何监控多个进程的存活和CPU、内存占用

categraf 主配置文件解析

本文介绍categraf主配置文件config.toml解析
categraf 主配置文件解析

监控指标的含义说明在哪里看

监控系统里最重要的概念就是监控指标了,监控指标很多,而且都是英文的,分别代表什么意思
监控指标的含义说明在哪里看

使用 Categraf 监控 Apache Web Server

Apache 是老一辈 Web Server,LAMP 中的 A 就是 Apache,占据了很高的市场份额。Apache 的进程是 httpd,其服务稳定性至关重要,本文讲解如何使用 Categraf 监控 Apache 的性能指标,及时发现可能的故障,保障 Apache Web Server 的稳定性。
使用 Categraf 监控 Apache Web Server

UDP端口探活的那些细节

UDP 是无连接的,无法用建立连接的形式判断端口是否存活,如何为 Categraf 实现一个简单通用的 UDP 探测插件呢?
UDP端口探活的那些细节

categraf托管与自升级

本文介绍categraf如何通过一条命令完成自身的托管、服务启停、状态查看、自动升级。
categraf托管与自升级

Nginx vts采集

本文讲解如何添加vts模块,并使用input.prometheus插件采集指标。
Nginx vts采集

Nginx upstream采集

本文讲解如何添加nginx_upstream_check模块,并使用input.nginx_upstream_check插件采集指标。
Nginx upstream采集

Categraf 下载、安装和使用

如何下载、安装、使用Categraf

Categraf 主配置说明

Categraf 配置说明,本章先介绍主配置文件config.toml的配置项

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
Flashduty
Flashduty