All-in-one 的监控数据采集器 Categraf 正式开源
Categraf,一站式的监控数据采集Agent,支持混合云架构和云原生架构,由夜莺监控核心团队开发。
汇总 Flashcat 博客中与 Categraf 相关的文章,方便按主题连续阅读实践、案例、选型和产品更新。
Categraf,一站式的监控数据采集Agent,支持混合云架构和云原生架构,由夜莺监控核心团队开发。
UDP 是无连接的,无法用建立连接的形式判断端口是否存活,如何为 Categraf 实现一个简单通用的 UDP 探测插件呢?
剖析 Categraf 针对 SNMP 插件的调度重构过程。从最初的简单 Ticker 到参考 Zabbix 实现最小堆与墙上时钟对齐,再到通过 0.85 因子实现自适应流量整形,解决采集周期漂移与设备负载突增问题。
介绍网络监控的新方案,用 Categraf 的 SNMP 插件配合 VictoriaMetrics 和 Grafana 替代 SNMP Exporter 加 Prometheus,并演示采集配置。
本文汇总了 Categraf 监控采集器在使用过程中常见的问题及其解决方案,帮助用户更好地配置和使用 Categraf,实现高效的监控数据采集与上报。
本文介绍 Categraf 如何通过一条命令完成自身的托管、服务启停、状态查看、自动升级。
来自社区用户写的文章,利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus,紧接上篇对交换机的监控,本篇是一个无线设备的监控的案例
支持 SNMP 方式采集数据的 agent 有很多,Telegraf、Categraf、Datadog-agent、snmp-exporter等,我们这次来介绍 Categraf,举一反三,原理上都是一样的。
Categraf SNMP 插件通过启发式算法自动提取带单位字符串中的数值,解决浪潮等服务器返回 60 degree Celsius 格式导致指标采集失败的问题,无需正则即可智能解析温度、电流等复杂格式。
本文介绍如何使用夜莺监控(Nightingale)和 Categraf 来监控多个进程的存活性以及 CPU、内存等资源占用情况。
本文讲解如何添加vts模块,并使用input.prometheus插件采集指标。
本文讲解如何添加nginx_upstream_check模块,并使用input.nginx_upstream_check插件采集指标。
本文讲解如何从头开始编译http_stub_status_module模块,并使用input.nginx插件采集指标。
目前市面上对于日志监控告警的主流方案主要围绕ELK及其变种展开,通过探针采集系统日志写入Kafka,然后基于Kakfa消费数据写入ES,采用定时查询ES 做异常告警;另一种方案则是基于Kafka流式数据,采用Flink直接做异常告警,架构上比较复杂。这里介绍使用mtail的轻量级方案。
深入解析 Categraf 僵尸进程治理方案。本文基于 GitHub Issue #1261,详细剖析了在容器化环境下 PID 1 导致的资源泄漏问题,并展示了如何通过 Go 语言实现 reapDaemon、利用 SIGCHLD 信号与 wait4 系统调用优雅地清理僵尸进程,提升系统稳定性
记录 Categraf http_response 插件报错 TLS handshake failure 的排查过程。分析 IPv4/IPv6 入口 TLS 配置差异、Go 1.24 默认加密套件变更导致的握手失败,提供 tls_cipher_suites 配置方案解决兼容性问题。
逐项解析 Categraf 主配置文件 config.toml,说明采集来源、上报地址、心跳、日志、HTTP 服务和 ibex 等关键参数。
监控系统里最重要的概念就是监控指标了,监控指标很多,而且都是英文的,分别代表什么意思
Apache 是老一辈 Web Server,LAMP 中的 A 就是 Apache,占据了很高的市场份额。Apache 的进程是 httpd,其服务稳定性至关重要,本文讲解如何使用 Categraf 监控 Apache 的性能指标,及时发现可能的故障,保障 Apache Web Server 的稳定性。
Kubernetes监控手册第5篇,讲解Kubelet的监控,Kubelet部署在工作负载节点,相比Kube-Proxy的监控数据采集,需要引入认证和HTTPS,更复杂了一些,遵循渐进式学习原则,本文带着大家在Kubernetes监控的路上,再往前一步