Prometheus

Prometheus 是一个开源的监控和警报工具,最初由 SoundCloud 开发,现已成为云原生计算基金会(CNCF)的一部分。它广泛用于收集和存储时间序列数据,尤其适合微服务架构和 Kubernetes 环境。主要特性包括:多维数据模型、强大的查询语言PromQL、PULL的数据收集方式、高效的时序数据存储、内置灵活的警报功能、可以和Grafana整合提供优秀的可视化能力。

Prometheus简介

Prometheus受启发于Google的Borgmon监控系统(相似的Kubernetes是从Google的Brog系统演变而来),从2012年开始由前Google工程师在Soundcloud以开源软件的形式进行研发,并且于2015年早期对外发布早期版本。2016年5月继Kubernetes之后成为第二个正式加入CNCF基金会的项目,同年6月正式发布1.0版本。2017年底发布了基于全新存储层的2.0版本,能更好地与容器平台、云平台配合
Prometheus简介

PromQL教程(二)Prometheus 数据类型

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第二篇,讲解 Prometheus 数据类型
PromQL教程(二)Prometheus 数据类型

PromQL教程(一)初识 PromQL

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第一篇,初识PromQL,主要介绍PromQL的概念、用途、时序数据、数据点、查询类型等知识。
PromQL教程(一)初识 PromQL

Prometheus 告警恢复时,怎么获取恢复时的值?

Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
Prometheus 告警恢复时,怎么获取恢复时的值?

在 Kubernetes 中部署 Alertmanager

Kubernetes 是当下最火爆的容器编排平台,很多软件都逐步迁移到了 Kubernetes,对于 Kubernetes 配套的监控系统,很多公司采用的是 Prometheus,Prometheus 配套的告警事件处理工具就是 Alertmanager,本文我们来看一下如何在 Kubernetes 中部署 Alertmanager
在 Kubernetes 中部署 Alertmanager

7 张图,彻底讲透 Prometheus 架构原理

在本指南中,我们将详细了解 Prometheus 架构,以有效地理解、配置和利用 Prometheus。
7 张图,彻底讲透 Prometheus 架构原理

透过 node-exporter 彻底弄懂机器监控:01. node-exporter 框架讲解

node-exporter 是 Prometheus 的官方 exporter 之一,用于监控 Linux 系统的各种指标。本文是专栏第一篇,介绍 node-exporter 的框架,后面会逐步深入 node-exporter 的原理和实现。

Prometheus 聚合查询的两个方案

多个 Prometheus 集群或者多个 VictoriaMetrics 集群,在 Grafana 和夜莺里通常需要创建多个不同的数据源,这也就意味着,数据没法聚合查询,比如统一做一下 sum 之类的运算会比较麻烦,本文讲述两种 Prometheus 生态的聚合查询方案,以供参考。
Prometheus 聚合查询的两个方案

Prometheus 监控平台组件深度讲解

Prometheus 是一个非常流行的监控系统,作为运维或者 SRE 工程师一定要非常熟悉,即便是普通的研发,平时也要查问题,也要会使用 Prometheus。要了解一个开源项目,需要了解其架构和设计逻辑,本文会对 Prometheus 监控平台各个组件做深度讲解
Prometheus 监控平台组件深度讲解

已经有 Prometheus 了,还需要夜莺?

Prometheus 和 Nightingale 都被看做是监控系统,这俩是什么关系?相互替代还是相互协同?
已经有 Prometheus 了,还需要夜莺?

Prometheus 14 点实践经验分享

这是 2017 年的 promcon 的分享,原文地址在这里,作者 Julius Volz,今天偶然看到,虽然已经过去 6 年,有些实践经验还是非常值得学习。做个意译,加入一些自己的理解,分享给大家。 埋点方面 1.
Prometheus 14 点实践经验分享

使用 JMX-Exporter 监控 Kafka 和 Zookeeper

JVM 默认会通过 JMX 的方式暴露基础指标,很多中间件也会通过 JMX 的方式暴露业务指标,比如 Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、Flink 等等。掌握了 JMX 监控方式,就掌握了一批程序的监控方式。本节介绍 JMX-Exporter 的使用,利用 JMX-Exporter 把 JMX 监控数据暴露为 Prometheus 可识别的格式。

优化实践:Prometheus 性能和高基数问题

如果提高 Prometheus 的性能并解决高基数问题,本文作者 David Calvert 讲解了他的一些实践思路
优化实践:Prometheus 性能和高基数问题

Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标

Prometheus 中有很多指标,有些在 Dashboard 中使用,有些在告警规则、记录规则中使用,有些应该用但是没用起来,有些压根就不应该采集,这些指标值得好好分析,使用 mimirtool 工具可以帮我们做一些这方面的分析工作。
Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标

如何优化 PromQL 和 MetricsQL 查询

PromQL和MetricsQL是强大的查询语言。它们允许编写简单的查询,用于构建漂亮的时间序列数据图形。它们还允许编写复杂的查询,用于SLI / SLO计算和警报。但优化PromQL查询可能很困难。本文介绍了如何确定缓慢的PromQL查询,如何理解查询成本以及如何优化这些查询,使其执行更快并消耗更少的CPU和RAM。
如何优化 PromQL 和 MetricsQL 查询

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
FlashDuty
Flashduty