Categraf
Categraf 是一款 All-in-One 的数据采集器,支持指标、日志采集;支持物理机、虚拟机、交换机、容器、K8s、多种中间件/数据库的数据采集,支持混合云架构、云原生架构、多云架构。同时,Categraf 期望不止提供采集能力,还附带提供仪表盘和告警规则,力求开箱即用。
Categraf 相关文章
围绕 Categraf 的实践、选型、案例和产品内容,按同一阅读路径持续整理。
Categraf 总体介绍
Categraf 是快猫团队开源的一款采集器,All-in-one 的设计,既可以采集指标,也可以采集日志、链路数据
All-in-one 的监控数据采集器 Categraf 正式开源
Categraf,一站式的监控数据采集Agent,支持混合云架构和云原生架构,由夜莺监控核心团队开发。
UDP端口探活的那些细节
UDP 是无连接的,无法用建立连接的形式判断端口是否存活,如何为 Categraf 实现一个简单通用的 UDP 探测插件呢?
重构 Categraf SNMP 调度器:从随机抖动到确定性自适应
剖析 Categraf 针对 SNMP 插件的调度重构过程。从最初的简单 Ticker 到参考 Zabbix 实现最小堆与墙上时钟对齐,再到通过 0.85 因子实现自适应流量整形,解决采集周期漂移与设备负载突增问题。
Categraf 监控采集器常见问题汇总
本文汇总了 Categraf 监控采集器在使用过程中常见的问题及其解决方案,帮助用户更好地配置和使用 Categraf,实现高效的监控数据采集与上报。
Categraf 托管与自升级
本文介绍 Categraf 如何通过一条命令完成自身的托管、服务启停、状态查看、自动升级。
网络监控:无线监控这个面板好养眼
来自社区用户写的文章,利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus,紧接上篇对交换机的监控,本篇是一个无线设备的监控的案例
通过 Categraf SNMP 插件采集监控数据
支持 SNMP 方式采集数据的 agent 有很多,Telegraf、Categraf、Datadog-agent、snmp-exporter等,我们这次来介绍 Categraf,举一反三,原理上都是一样的。
Categraf SNMP 插件优化:解析带单位的监控指标
Categraf SNMP 插件通过启发式算法自动提取带单位字符串中的数值,解决浪潮等服务器返回 60 degree Celsius 格式导致指标采集失败的问题,无需正则即可智能解析温度、电流等复杂格式。
如何监控多个进程的存活和CPU、内存占用
本文介绍如何使用夜莺监控(Nightingale)和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。
Nginx vts采集
本文讲解如何添加vts模块,并使用input.prometheus插件采集指标。
Nginx upstream采集
本文讲解如何添加nginx_upstream_check模块,并使用input.nginx_upstream_check插件采集指标。
Nginx stub status采集
本文讲解如何从头开始编译http_stub_status_module模块,并使用input.nginx插件采集指标。
巧用Categraf探针mtail插件实现系统日志监控告警
目前市面上对于日志监控告警的主流方案主要围绕ELK及其变种展开,通过探针采集系统日志写入Kafka,然后基于Kakfa消费数据写入ES,采用定时查询ES 做异常告警;另一种方案则是基于Kafka流式数据,采用Flink直接做异常告警,架构上比较复杂。这里介绍使用mtail的轻量级方案。
从一个 Issue 谈 PID 1 与 Reaping 机制
深入解析 Categraf 僵尸进程治理方案。本文基于 GitHub Issue #1261,详细剖析了在容器化环境下 PID 1 导致的资源泄漏问题,并展示了如何通过 Go 语言实现 reapDaemon、利用 SIGCHLD 信号与 wait4 系统调用优雅地清理僵尸进程,提升系统稳定性
记一次被社区用户逼着修Bug经历
记录 Categraf http_response 插件报错 TLS handshake failure 的排查过程。分析 IPv4/IPv6 入口 TLS 配置差异、Go 1.24 默认加密套件变更导致的握手失败,提供 tls_cipher_suites 配置方案解决兼容性问题。
categraf 主配置文件解析
逐项解析 Categraf 主配置文件 config.toml,说明采集来源、上报地址、心跳、日志、HTTP 服务和 ibex 等关键参数。
监控指标的含义说明在哪里看
监控系统里最重要的概念就是监控指标了,监控指标很多,而且都是英文的,分别代表什么意思
使用 Categraf 监控 Apache Web Server
Apache 是老一辈 Web Server,LAMP 中的 A 就是 Apache,占据了很高的市场份额。Apache 的进程是 httpd,其服务稳定性至关重要,本文讲解如何使用 Categraf 监控 Apache 的性能指标,及时发现可能的故障,保障 Apache Web Server 的稳定性。
Kubernetes监控手册05-监控Kubelet
Kubernetes监控手册第5篇,讲解Kubelet的监控,Kubelet部署在工作负载节点,相比Kube-Proxy的监控数据采集,需要引入认证和HTTPS,更复杂了一些,遵循渐进式学习原则,本文带着大家在Kubernetes监控的路上,再往前一步