包含标签 Prometheus 的文章

Zabbix 和 Prometheus 选型对比

Zabbix 和 Prometheus 是开源监控领域最值得了解的两个项目,Zabbix 更专注在设备监控,Prometheus 更专注在微服务、Kubernetes 监控,本文探讨企业中如何选型
Zabbix 和 Prometheus 选型对比

VictoriaMetrics 中文教程(03)如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics

讲解如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics,这样就可以实现 Prometheus 的数据高可用和持久化。同时,我们也会了解如何给 Prometheus 添加标签,以及如何调整 remote write 的配置参数。
VictoriaMetrics 中文教程(03)如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics

PromQL教程(五)PromQL 函数

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第五篇,讲解 PromQL 中的常用函数
PromQL教程(五)PromQL 函数

PromQL教程(四)PromQL 向量匹配

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第四篇,讲解 PromQL 中的向量匹配
PromQL教程(四)PromQL 向量匹配

PromQL教程(三)PromQL 入门操作

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第三篇,讲解 PromQL 入门操作
PromQL教程(三)PromQL 入门操作

PromQL教程(二)Prometheus 数据类型

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第二篇,讲解 Prometheus 数据类型
PromQL教程(二)Prometheus 数据类型

PromQL教程(一)初识 PromQL

PromQL是Prometheus的查询语言,想要学习Prometheus,PromQL是必学知识,本文是PromQL系列教程的第一篇,初识PromQL,主要介绍PromQL的概念、用途、时序数据、数据点、查询类型等知识。
PromQL教程(一)初识 PromQL

Prometheus 告警恢复时,怎么获取恢复时的值?

Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
Prometheus 告警恢复时,怎么获取恢复时的值?

在 Kubernetes 中部署 Alertmanager

Kubernetes 是当下最火爆的容器编排平台,很多软件都逐步迁移到了 Kubernetes,对于 Kubernetes 配套的监控系统,很多公司采用的是 Prometheus,Prometheus 配套的告警事件处理工具就是 Alertmanager,本文我们来看一下如何在 Kubernetes 中部署 Alertmanager
在 Kubernetes 中部署 Alertmanager

7 张图,彻底讲透 Prometheus 架构原理

在本指南中,我们将详细了解 Prometheus 架构,以有效地理解、配置和利用 Prometheus。
7 张图,彻底讲透 Prometheus 架构原理

透过 node-exporter 彻底弄懂机器监控:01. node-exporter 框架讲解

node-exporter 是 Prometheus 的官方 exporter 之一,用于监控 Linux 系统的各种指标。本文是专栏第一篇,介绍 node-exporter 的框架,后面会逐步深入 node-exporter 的原理和实现。

Prometheus 聚合查询的两个方案

多个 Prometheus 集群或者多个 VictoriaMetrics 集群,在 Grafana 和夜莺里通常需要创建多个不同的数据源,这也就意味着,数据没法聚合查询,比如统一做一下 sum 之类的运算会比较麻烦,本文讲述两种 Prometheus 生态的聚合查询方案,以供参考。
Prometheus 聚合查询的两个方案

Prometheus 监控平台组件深度讲解

Prometheus 是一个非常流行的监控系统,作为运维或者 SRE 工程师一定要非常熟悉,即便是普通的研发,平时也要查问题,也要会使用 Prometheus。要了解一个开源项目,需要了解其架构和设计逻辑,本文会对 Prometheus 监控平台各个组件做深度讲解
Prometheus 监控平台组件深度讲解

已经有 Prometheus 了,还需要夜莺?

Prometheus 和 Nightingale 都被看做是监控系统,这俩是什么关系?相互替代还是相互协同?
已经有 Prometheus 了,还需要夜莺?

Prometheus 14 点实践经验分享

这是 2017 年的 promcon 的分享,原文地址在这里,作者 Julius Volz,今天偶然看到,虽然已经过去 6 年,有些实践经验还是非常值得学习。做个意译,加入一些自己的理解,分享给大家。 埋点方面 1.
Prometheus 14 点实践经验分享

使用 JMX-Exporter 监控 Kafka 和 Zookeeper

JVM 默认会通过 JMX 的方式暴露基础指标,很多中间件也会通过 JMX 的方式暴露业务指标,比如 Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、Flink 等等。掌握了 JMX 监控方式,就掌握了一批程序的监控方式。本节介绍 JMX-Exporter 的使用,利用 JMX-Exporter 把 JMX 监控数据暴露为 Prometheus 可识别的格式。

优化实践:Prometheus 性能和高基数问题

如果提高 Prometheus 的性能并解决高基数问题,本文作者 David Calvert 讲解了他的一些实践思路
优化实践:Prometheus 性能和高基数问题

Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标

Prometheus 中有很多指标,有些在 Dashboard 中使用,有些在告警规则、记录规则中使用,有些应该用但是没用起来,有些压根就不应该采集,这些指标值得好好分析,使用 mimirtool 工具可以帮我们做一些这方面的分析工作。
Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标

如何优化 PromQL 和 MetricsQL 查询

PromQL和MetricsQL是强大的查询语言。它们允许编写简单的查询,用于构建漂亮的时间序列数据图形。它们还允许编写复杂的查询,用于SLI / SLO计算和警报。但优化PromQL查询可能很困难。本文介绍了如何确定缓慢的PromQL查询,如何理解查询成本以及如何优化这些查询,使其执行更快并消耗更少的CPU和RAM。
如何优化 PromQL 和 MetricsQL 查询

Telegraf 发送指标给 Prometheus

Telegraf 作为一个指标层面的 all-in-one 的采集器,用途广泛,Telegraf 具备多种 output 插件,本篇介绍如何使用 prometheus remote write 方式发送数据给后端。

二十年里12个开源监控工具大对比

过去20年里,都涌现出来了哪些典型的优秀开源监控工具,他们的优缺点如何?
二十年里12个开源监控工具大对比

Zabbix 和夜莺监控选型对比

有没有一个现代化的、简单好用的监控产品,既可以满足传统架构的监控需求,又可以适用K8s时代微服务架构的监控、混合云的监控
Zabbix 和夜莺监控选型对比

标签
aiops alertmanager apache apiserver apm categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl flashcat flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google grok_exporter hadoop hana haproxy hdfs httpstat iac ibex ilo im协同 it监控 jaeger jenkins jmx-exporter jolokia kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux log log-monitor logging logs loki metrics metricsql mimirtool mongodb mongodb监控 monitoring mtail mysql netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 错误预算 错误预算机制 滴滴夜莺 钉钉 飞书 服务稳定性 告警 告警oncall 告警风暴 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控工具 监控设计思考 监控系统 监控系统合规 开源 开源监控 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 链路追踪 灭火图 普罗米修斯 企业微信 人工智能 日志 日志存储 日志分析 日志告警 日志监控 容器 时序库 时序数据库 事件监控 手把手构建生产级监控系统 提问的智慧 统一监控 网络可观测性 网络排障 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 信创 业务监控 夜莺 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能告警 自监控
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat