快猫星云博客 | 一站式智能观测平台 | 可观测性

VictoriaMetrics 中文教程（03）如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics

讲解如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics，这样就可以实现 Prometheus 的数据高可用和持久化。同时，我们也会了解如何给 Prometheus 添加标签，以及如何调整 remote write 的配置参数。

Posted by 快猫运营团队 on 2024-10-19 12:05:42

Prometheus VictoriaMetrics

Nightingale 和 Flashcat 的区别

Nightingale 和 Flashcat 是两个不同的监控系统，本文将介绍它们的区别。简单来讲 Nightingale 是一款开源监控系统，Flashcat 是 Nightingale 的商业版本，主导这两个项目的是一波人

Posted by 秦晓辉 on 2024-10-18 18:05:08

夜莺 Nightingale Flashcat

VictoriaMetrics 中文教程（02）安装

VictoriaMetrics 是一个非常优秀的时序数据库，它的性能、稳定性、易用性都非常好，是国内很多大厂的选择。本文是 VictoriaMetrics 中文教程第 02 篇，讲解 VictoriaMetrics 的安装，VictoriatMetrics 支持多种不同的安装方式，极为方便

Posted by 快猫运营团队 on 2024-10-18 15:08:59

VictoriaMetrics

VictoriaMetrics 中文教程（01）简介

VictoriaMetrics 是一个非常优秀的时序数据库，它的性能、稳定性、易用性都非常好，是国内很多大厂的选择。本文是 VictoriaMetrics 中文教程第 01 篇，对 VictoriaMetrics 进行了简单的介绍

Posted by 快猫运营团队 on 2024-10-18 10:08:59

VictoriaMetrics

IT 监控有哪些监控数据采集方式

IT 监控系统是周期性采集监控数据，进而进行分析、可视化、告警的系统，对于故障发现、定位具有极大的帮助。监控数据采集是监控系统的基础，本文介绍了 IT 监控系统中常见的监控数据采集方式。

Posted by 快猫运营团队 on 2024-10-18 08:39:06

IT监控

什么是开源监控系统？

运开源监控系统是基于开放源代码的监控工具，帮助运维团队实时跟踪、分析和管理服务器、网络、应用程序等IT基础设施的运行状态。这些系统通过收集、存储、分析和展示各种性能数据、日志信息和告警事件，为运维人员提供全面的系统视图，帮助他们快速发现并解决问题，保障系统的稳定运行。

Posted by 快猫运营团队 on 2024-10-17 08:26:05

开源监控

可观测平台是什么？

可观测平台是集成多种监控、日志、跟踪和告警功能的系统，实时监测和分析IT系统的运行状态。通过收集、存储、处理和分析大量数据，提供全面、详细的系统运行视图，帮助运维团队快速发现和解决问题。

Posted by 快猫运营团队 on 2024-10-16 14:49:05

可观测平台

OpenTelemetry 和 Fluent Bit 集成，入门教程

通过将 OpenTelemetry Collector 与 FluentBit 集成，用户可以简化其可观察性，并为日志、指标和跟踪创建高效、可扩展的数据管道。通过提供的配置文件和 Docker Compose 设置，开始使用这个强大的组合变得简单明了。

Posted by 译文 on 2024-10-16 12:05:08

OpenTelemetry Fluentbit

什么是可观测平台？

可观测平台是集成多种监控、日志、跟踪和告警功能的系统，实时监测和分析IT系统的运行状态。通过收集、存储、处理和分析大量数据，可观测平台能够提供全面、详细的系统运行视图，帮助运维团队快速发现、解决问题。

Posted by 快猫运营团队 on 2024-10-16 10:08:34

可观测平台

Fluentbit 入门教程（3）：多行日志解析的最佳实践

使用 Fluentbit 解析多行日志的最佳实践。本文是 Fluentbit 入门系列教程的第三篇。Fluentbit 是一款轻量的日志采集器，通常用于容器、嵌入式环境。

Posted by 译文 on 2024-10-15 17:09:33

Fluentbit 日志监控

Fluentbit 入门教程（2）：使用正则表达式解析日志

在本博客中，我们会学习如何使用正则表达式在 Fluent bit 中解析日志消息。正则表达式是一种强大的工具，可以帮助用户从非结构化或半结构化日志数据中提取有用的信息。我们还了解了如何定义自定义解析器，以便 Fluent Bit 可以正确解析日志消息。这是学习 Fluent Bit 的重要一步，因为它有助于理解日志数据并将其转化为有价值的见解。

Posted by 译文 on 2024-10-15 14:37:47

Fluentbit 日志监控

如何实现好的告警收敛效果？

告警收敛是运维监控中不可或缺的功能之一，通过智能化的算法和策略，降低告警信息的冗余度，提高运维效率。要实现好的告警收敛效果，需要合理设置告警规则、采用智能告警算法、优化告警通知渠道等多方面入手，持续优化和改进告警系统，提升运维工作的效率和准确性。

Posted by 快猫运营团队 on 2024-10-15 14:00:29

告警告警收敛

Fluentbit 入门教程（1）：tail 插件

Fluentbit 是一个轻量级的日志收集器，适用于容器化环境和边缘设备。本教程介绍了 Fluentbit 的基本概念和使用方法，以及如何使用 tail 插件收集日志。

Posted by 译文 on 2024-10-15 09:22:57

Fluentbit 日志监控

告警收敛概念及功能应用场景

在现代信息技术领域，运维（Operations and Maintenance,简称O&M）是确保系统和服务稳定运行的关键环节。服务器作为提供计算服务的核心设备，其运维工作尤为重要。在运维监控系统中，告警收敛是关键功能，用来提高运维效率，减少误报和误判，确保服务器的稳定运行。

Posted by 快猫运营团队 on 2024-10-14 16:38:19

告警告警收敛

使用自定义 Fluent Bit 配置解析多行日志

如何使用自定义 Fluent Bit 配置解析多行日志。通过配置多行解析器，您可以将多行日志消息合并到单个日志记录中，从而使日志更易于理解并节省时间。这种方法可以帮助您更好地管理和处理日志信息，提高运维效率。

Posted by Diogo Daniel Pacheco on 2024-10-14 14:56:54

Fluentbit 日志监控

什么是告警收敛？用途是什么？

在现代信息技术（IT）领域，运维（Operations and Maintenance,简称O&M）是确保系统和服务稳定运行的关键环节。服务器运维作为运维的重要组成部分，涉及保持服务器的稳定运行、优化其性能、数据备份、安全措施的实施等多方面工作。

Posted by 快猫运营团队 on 2024-10-14 11:01:58

告警告警收敛

有哪些常见的运维监控方向？

在现代信息化环境中，运维监控是保障系统稳定运行、及时发现并处理潜在问题的基石。运维监控关乎硬件层面的健康状态，深入到软件、网络及应用等多个维度，形成全面、细致的监控体系。

Posted by 快猫运营团队 on 2024-10-13 16:16:30

运维监控

什么是可观测性？可观测性成功指南

可观察性是一种方法，可以帮助您预测和预防未来的问题。它有助于根据外部输出的知识确定系统的状态。本文将详细介绍可观测性的定义、重要性、好处、挑战、支柱及其如何运作。

Posted by 译文 on 2024-10-12 10:13:08

Observability 可观测性

巧用Flashcat“定时功能”监控大数据平台的任务超时

“定时”类型的需求，在很多场景下也有用武之地，比如批处理任务类型，甚至是在某些行业中，都需要“定时”类型的功能才能满足告警。目前Flashcat已经在支持了“定时的执行数据采集”、“定时的执行记录规则”、“定时的执行报警策略”等，满足各类业务场景

Posted by gene on 2024-10-12 07:31:12

hana

Fluent Bit 对比 Fluentd

Fluent Bit 和 Fluentd 都是流行的日志收集和处理工具，它们有一些相似之处，但也存在一些差异。本文介绍两个软件的详细对比。

Posted by 快猫运营团队 on 2024-10-11 16:33:50

Fluentbit 日志监控 Fluentd

ai aiagent aiops alertmanager apache apiserver apm azure categraf catpaw ccf cdn chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl faq featureflag filelog flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google gpu grafana grok_exporter hadoop hana haproxy hdfs helm httpstat huatuo iac ibex ilo im协同 incident it监控 jaeger jenkins jmx jmx-exporter jolokia jvm k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki mcp-server metrics metricshub metricsql mimir mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis rum salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre syslog telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星不可变基础设施出海出海业务创业错误预算错误预算机制大厂实践大模型大模型智能oncall 滴滴夜莺钉钉钉钉通知飞书飞书通知分布式追踪服务稳定性告警告警oncall 告警丰富告警风暴告警规则告警降噪告警聚合告警排班告警认领告警升级告警事件告警收敛告警数据孤岛告警通知告警响应告警协同告警抑制告警引擎告警值班告警指派告警自愈根因定位故障故障复盘故障管理计算机学会架构师监控监控agent 监控方法论监控告警监控工具监控设计思考监控系统监控系统合规进程监控开源开源监控开源商业化开源夜莺可观测平台可观测性可观测性论坛可观测性体系建设客户案例快猫快猫星云连锁门店链路追踪埋点监控面试题灭火图普罗米修斯企微通知企业微信前端监控人工智能日志日志采集日志存储日志分析日志告警日志监控容器熔断时序库时序数据库事件监控手把手构建生产级监控系统他山之石提问的智慧通知规则统一监控网络可观测性网络排障尾采样稳定性保障稳定性方法论稳定性体系稳定性体系建设系统架构设计信创业务监控夜莺夜莺v8 夜莺短信告警夜莺黄埔营夜莺监控夜莺开发者创新论坛夜莺开源项目夜莺业务组夜莺用户案例医药健康仪表盘用户案例云厂商云原生监控云原生组织运维运维百家讲坛运维告警运维监控运维监控系统运维监控系统实战笔记智能oncall 智能告警自监控最佳实践