Prometheus
Prometheus 是一个开源的监控和警报工具,最初由 SoundCloud 开发,现已成为云原生计算基金会(CNCF)的一部分。它广泛用于收集和存储时间序列数据,尤其适合微服务架构和 Kubernetes 环境。
Prometheus 相关文章
围绕 Prometheus 的实践、选型、案例和产品内容,按同一阅读路径持续整理。
PromQL教程(二)Prometheus 数据类型
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第二篇,讲解 Prometheus 数据类型
PromQL教程(一)初识 PromQL
PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第一篇,初识PromQL,主要介绍PromQL的概念、用途、时序数据、数据点、查询类型等知识。
Prometheus 告警恢复时,怎么获取恢复时的值?
Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
在 Kubernetes 中部署 Alertmanager
Kubernetes 是当下最火爆的容器编排平台,很多软件都逐步迁移到了 Kubernetes,对于 Kubernetes 配套的监控系统,很多公司采用的是 Prometheus,Prometheus 配套的告警事件处理工具就是 Alertmanager,本文我们来看一下如何在 Kubernetes 中部署 Alertmanager
7 张图,彻底讲透 Prometheus 架构原理
在本指南中,我们将详细了解 Prometheus 架构,以有效地理解、配置和利用 Prometheus。
透过 node-exporter 彻底弄懂机器监控:01. node-exporter 框架讲解
node-exporter 是 Prometheus 的官方 exporter 之一,用于监控 Linux 系统的各种指标。本文是专栏第一篇,介绍 node-exporter 的框架,后面会逐步深入 node-exporter 的原理和实现。
Prometheus 聚合查询的两个方案
多个 Prometheus 集群或者多个 VictoriaMetrics 集群,在 Grafana 和夜莺里通常需要创建多个不同的数据源,这也就意味着,数据没法聚合查询,比如统一做一下 sum 之类的运算会比较麻烦,本文讲述两种 Prometheus 生态的聚合查询方案,以供参考。
Prometheus 监控平台组件深度讲解
Prometheus 是一个非常流行的监控系统,作为运维或者 SRE 工程师一定要非常熟悉,即便是普通的研发,平时也要查问题,也要会使用 Prometheus。要了解一个开源项目,需要了解其架构和设计逻辑,本文会对 Prometheus 监控平台各个组件做深度讲解
已经有 Prometheus 了,还需要夜莺?
Prometheus 和 Nightingale 都被看做是监控系统,这俩是什么关系?相互替代还是相互协同?
使用 JMX-Exporter 监控 Kafka 和 Zookeeper
JVM 默认会通过 JMX 的方式暴露基础指标,很多中间件也会通过 JMX 的方式暴露业务指标,比如 Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、Flink 等等。掌握了 JMX 监控方式,就掌握了一批程序的监控方式。本节介绍 JMX-Exporter 的使用,利用 JMX-Exporter 把 JMX 监控数据暴露为 Prometheus 可识别的格式。
优化实践:Prometheus 性能和高基数问题
如果提高 Prometheus 的性能并解决高基数问题,本文作者 David Calvert 讲解了他的一些实践思路
Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标
Prometheus 中有很多指标,有些在 Dashboard 中使用,有些在告警规则、记录规则中使用,有些应该用但是没用起来,有些压根就不应该采集,这些指标值得好好分析,使用 mimirtool 工具可以帮我们做一些这方面的分析工作。
如何优化 PromQL 和 MetricsQL 查询
PromQL和MetricsQL是强大的查询语言。它们允许编写简单的查询,用于构建漂亮的时间序列数据图形。它们还允许编写复杂的查询,用于SLI / SLO计算和警报。但优化PromQL查询可能很困难。本文介绍了如何确定缓慢的PromQL查询,如何理解查询成本以及如何优化这些查询,使其执行更快并消耗更少的CPU和RAM。
Telegraf 发送指标给 Prometheus
Telegraf 作为一个指标层面的 all-in-one 的采集器,用途广泛,Telegraf 具备多种 output 插件,本篇介绍如何使用 prometheus remote write 方式发送数据给后端。
Zabbix 和夜莺监控选型对比
有没有一个现代化的、简单好用的监控产品,既可以满足传统架构的监控需求,又可以适用K8s时代微服务架构的监控、混合云的监控