日志监控

日志监控是指对系统、应用程序或网络设备生成的日志文件进行实时收集、ETL、分析和可视化、告警的过程,以便于监控系统的健康状态、性能以及安全性。

Topic Overview

日志监控 这个话题主要看什么

日志监控是指对系统、应用程序或网络设备生成的日志文件进行实时收集、ETL、分析和可视化、告警的过程,以便于监控系统的健康状态、性能以及安全性。典型的日志方案比如 ELK(ElasticSearch、Logstash、Kibana) 生态、ClickHouse 生态(ClickHouse、Clickvisual、Grafana)。S3 生态,很多日志分析软件使用 S3 作为日志存储的主要方式,比如 Loki、OpenObserve。

如果只是对日志做告警,则还有 ElastAlert、Flashduty、Flashcat 等方案。
25 已收录内容
0 人工精选
21 自动聚合
4 补充阅读

日志监控 相关文章

围绕 日志监控 的实践、选型、案例和产品内容,按同一阅读路径持续整理。

25 篇

怎么记日志才算专业,SRE、DEV 都应该了解的实践指南

Mike Shi · 2025-12-05

日志记录不是随意的流水账,而是有目的的证据收集。每一条日志都应为未来的你和你的团队提供清晰、有用的信息,帮助你们理解系统的运行状态、排查问题并优化性能。通过结构化日志、添加上下文信息、明确日志级别,并善用现代工具进行过滤和控制,你可以打造一个高效、可靠的日志记录体系 —— 让日志真正成为可观测性实践中的宝贵资产,而非无用信息的堆积。

Fluentbit 入门教程(2):使用正则表达式解析日志

译文 · 2024-10-15

在本博客中,我们会学习如何使用正则表达式在 Fluent bit 中解析日志消息。正则表达式是一种强大的工具,可以帮助用户从非结构化或半结构化日志数据中提取有用的信息。我们还了解了如何定义自定义解析器,以便 Fluent Bit 可以正确解析日志消息。这是学习 Fluent Bit 的重要一步,因为它有助于理解日志数据并将其转化为有价值的见解。

史上最简单的日志告警方案,没有之一

快猫星云 · 2024-01-23

如果你在意生产环境的稳定性,希望自己的服务出问题时及时发现,大概率就有日志监控告警的需求,比如发现日志中有 Error 或 Exception 关键字就告警,比如通过日志统计某个服务的 95 分位延迟数据,延迟过高就告警,比如通过日志统计某个服务的 status code,出现多个 5xx 就告警,等等。日志可能存储在 ElasticSearch、Loki、ClickHouse 等系统中,告警系统的核心逻辑也比较清晰,就是根据用户配置的查询语句,周期性查询这些存储,并对查询结果做阈值判定,如果达到阈值就触发告警。比如统计 5 分钟内出现的 Error 数量,如果大于 10 就告警。

可观测性数据收集集大成者 Vector 介绍

秦晓辉 · 2023-09-27

如果企业提供 IT 在线服务,那么可观测性能力是必不可少的。“可观测性” 这个词近来也越发火爆,不懂 “可观测性” 都不好意思出门了。但是可观测性能力的构建却着实不易,每个企业都会用到一堆技术栈来组装建设。比如数据收集,可能来自某个 exporter,可能来自 telegraf,可能来自 OTEL,可能来自某个日志文件,可能来自 statsd,收集到数据之后还需要做各种过滤、转换、聚合、采样等操作,烦不胜烦,今天我们就给大家介绍一款开源的数据收集+路由器工具:Vector,解除你的上述烦恼。

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云