VictoriaMetrics 中文教程(03)如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics
讲解如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics,这样就可以实现 Prometheus 的数据高可用和持久化。同时,我们也会了解如何给 Prometheus 添加标签,以及如何调整 remote write 的配置参数。
汇总 Flashcat 博客中与 Prometheus 相关的文章,方便按主题连续阅读实践、案例、选型和产品更新。
讲解如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics,这样就可以实现 Prometheus 的数据高可用和持久化。同时,我们也会了解如何给 Prometheus 添加标签,以及如何调整 remote write 的配置参数。
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第五篇,讲解 PromQL 中的常用函数
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第四篇,讲解 PromQL 中的向量匹配
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第三篇,讲解 PromQL 入门操作
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第二篇,讲解 Prometheus 数据类型
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第一篇,初识PromQL,主要介绍PromQL的概念、用途、时序数据、数据点、查询类型等知识。
Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
Kubernetes 是当下最火爆的容器编排平台,很多软件都逐步迁移到了 Kubernetes,对于 Kubernetes 配套的监控系统,很多公司采用的是 Prometheus,Prometheus 配套的告警事件处理工具就是 Alertmanager,本文我们来看一下如何在 Kubernetes 中部署 Alertmanager
在本指南中,我们将详细了解 Prometheus 架构,以有效地理解、配置和利用 Prometheus。
node-exporter 是 Prometheus 的官方 exporter 之一,用于监控 Linux 系统的各种指标。本文是专栏第一篇,介绍 node-exporter 的框架,后面会逐步深入 node-exporter 的原理和实现。
多个 Prometheus 集群或者多个 VictoriaMetrics 集群,在 Grafana 和夜莺里通常需要创建多个不同的数据源,这也就意味着,数据没法聚合查询,比如统一做一下 sum 之类的运算会比较麻烦,本文讲述两种 Prometheus 生态的聚合查询方案,以供参考。
Prometheus 是一个非常流行的监控系统,作为运维或者 SRE 工程师一定要非常熟悉,即便是普通的研发,平时也要查问题,也要会使用 Prometheus。要了解一个开源项目,需要了解其架构和设计逻辑,本文会对 Prometheus 监控平台各个组件做深度讲解
Prometheus 和 Nightingale 都被看做是监控系统,这俩是什么关系?相互替代还是相互协同?
JVM 默认会通过 JMX 的方式暴露基础指标,很多中间件也会通过 JMX 的方式暴露业务指标,比如 Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、Flink 等等。掌握了 JMX 监控方式,就掌握了一批程序的监控方式。本节介绍 JMX-Exporter 的使用,利用 JMX-Exporter 把 JMX 监控数据暴露为 Prometheus 可识别的格式。
如果提高 Prometheus 的性能并解决高基数问题,本文作者 David Calvert 讲解了他的一些实践思路
Prometheus 中有很多指标,有些在 Dashboard 中使用,有些在告警规则、记录规则中使用,有些应该用但是没用起来,有些压根就不应该采集,这些指标值得好好分析,使用 mimirtool 工具可以帮我们做一些这方面的分析工作。
PromQL和MetricsQL是强大的查询语言。它们允许编写简单的查询,用于构建漂亮的时间序列数据图形。它们还允许编写复杂的查询,用于SLI / SLO计算和警报。但优化PromQL查询可能很困难。本文介绍了如何确定缓慢的PromQL查询,如何理解查询成本以及如何优化这些查询,使其执行更快并消耗更少的CPU和RAM。
Telegraf 作为一个指标层面的 all-in-one 的采集器,用途广泛,Telegraf 具备多种 output 插件,本篇介绍如何使用 prometheus remote write 方式发送数据给后端。
回顾过去二十年里 12 款典型开源监控工具,从数据采集、告警到图表展示梳理各自特点、优缺点与适用场景,适合做监控体系建设和技术选型参考。
有没有一个现代化的、简单好用的监控产品,既可以满足传统架构的监控需求,又可以适用K8s时代微服务架构的监控、混合云的监控