标签：VictoriaMetrics

汇总 Flashcat 博客中与 VictoriaMetrics 相关的文章，方便按主题连续阅读实践、案例、选型和产品更新。

搜索 VictoriaMetrics

按主题浏览告警治理用户案例 Nightingale Categraf Prometheus Kubernetes Zabbix

VictoriaMetrics 相关文章

10 分钟跑起 Categraf + 夜莺 + VictoriaMetrics

快猫星云 · 2026-06-30

本文介绍如何使用 Docker Compose 快速启动 Categraf、夜莺和 VictoriaMetrics，完成从主机指标采集、remote write 写入、PromQL 查询到 Dashboard 展示的最小监控闭环。

八维通科技：20 多个机房、20+ 集群如何用夜莺实现统一监控与告警管理

快猫星云 · 2026-04-13

八维通科技在全国管理 20 多个机房、20+ 套集群和上千台服务器，原有 Prometheus、Zabbix、CAT 多套监控分散。本文介绍其基于 Nightingale 商业版、VictoriaMetrics 和 vmagent 实现统一监控、告警治理与日志查询，并将运维维护成本降低约 50% 的落地实践。

Zenlayer 公网质量监控平台实践：从 SmokePing 到拨测与 IQSM 评分模型

Zenlayer · 2026-04-13

本文介绍 Zenlayer 面向全球边缘云业务构建公网质量监控平台的实践，涵盖 SmokePing 与 SmokeCAT 的早期探索、分布式拨测、样本筛选、VictoriaMetrics/VictoriaLogs 数据底座以及 IQSM IP 质量评分模型。

新浪CDN监控实践：基于夜莺+VictoriaMetrics监控数千台边缘节点

新浪CDN技术团队 · 2026-02-28

新浪CDN技术团队分享基于夜莺监控（Nightingale）和VictoriaMetrics构建CDN边缘节点监控体系的实践经验，涵盖监控选型对比、架构设计、Categraf批量部署、API集成及自动化运维闭环等关键环节。

如何监控多个进程的存活和CPU、内存占用

快猫运营 · 2026-01-09

使用夜莺监控、Categraf 和 VictoriaMetrics 监控多个进程的存活、CPU、内存、句柄、IO 等指标，并配置 procstat 插件和进程存活告警。

监控指标太多，VictoriaMetrics 如何自保？

巴辉特 · 2025-04-03

VictoriaMetrics 面对突发指标暴增时如何自保：从业务沟通、按业务拆分、单机和集群选型、自监控、VMUI Explore、高基数治理、storage.maxHourlySeries 和 dedup.minScrapeInterval 等角度梳理实践。

VictoriaMetrics 中文教程（10）集群版简介

快猫运营团队 · 2024-10-23

VictoriaMetrics 集群版简介：说明 vmstorage、vminsert、vmselect 架构，多租户 URL，集群启动方式，只读模式，replication、deduplication 和数据安全注意事项。

VictoriaMetrics 中文教程（09）VictoriaMetrics 18 条 Troubleshooting 建议和提示

快猫运营团队 · 2024-10-23

VictoriaMetrics Troubleshooting 清单：从默认参数、日志、版本升级、CPU/RAM/磁盘资源、慢写入、高基数、缓存间隙、损坏 part 和 NaN 值等角度排查性能与运维问题。

VictoriaMetrics 中文教程（08）VictoriaMetrics 的存储

快猫运营团队 · 2024-10-22

本文解释 VictoriaMetrics 的存储结构、part、block、IndexDB、后台合并和 retentionPeriod 保留策略，帮助理解数据如何写入、查询、合并、清理以及如何为不同数据设置不同保留期。

VictoriaMetrics 中文教程（07）高可用（High availability）方案

快猫运营团队 · 2024-10-22

本文讲解 VictoriaMetrics 单机版高可用方案，包括跨可用区双写、vmagent 多 remoteWrite.url、Prometheus remote_write 多目标、vmauth 查询故障转移，以及 Deduplication、dedup.minScrapeInterval、promscrape.cluster.name 等去重配置。

VictoriaMetrics 中文教程（06）容量规划

快猫运营团队 · 2024-10-21

本文讲解 VictoriaMetrics 容量规划方法，包括如何用测试运行估算存储空间、CPU/RAM/磁盘备用资源建议，以及 memory、search、labels API、series、Graphite 等资源限制参数的使用场景。

VictoriaMetrics 中文教程（05）对接各类监控数据采集器

快猫运营团队 · 2024-10-21

本文介绍 VictoriaMetrics 如何对接 Prometheus Exporter、Datadog Agent、Telegraf、Graphite/StatsD、OpenTSDB collector 和 NewRelic Infrastructure agent，包括 promscrape、DD_DD_URL、InfluxDB line protocol、Graphite、OpenTSDB telnet/HTTP 等写入方式。

VictoriaMetrics 中文教程（04）对接 Grafana 同时介绍 vmui

快猫运营团队 · 2024-10-21

本文介绍如何在 Grafana 中以 Prometheus 数据源方式接入 VictoriaMetrics，并说明 vmui 的访问地址、Explore 查询、Metrics explorer、Cardinality explorer、Top Queries、Query analyzer、WITH expressions playground 和 step 参数。

VictoriaMetrics 中文教程（03）如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics

快猫运营团队 · 2024-10-19

本文讲解如何通过 Prometheus remote_write 把监控数据远程写入 VictoriaMetrics，包括 remote_write 配置、external_labels、多 Prometheus 区分、高负载 queue_config 调整、help 信息缺失原因，以及 vmagent 的替代思路。

VictoriaMetrics 中文教程（02）安装

快猫运营团队 · 2024-10-18

本文讲解 VictoriaMetrics 的安装方式，包括二进制启动、关键启动参数、环境变量引用、envflag 配置规则，以及如何在 Windows 上通过 WinSW 把 VictoriaMetrics 注册为服务。

VictoriaMetrics 中文教程（01）简介

快猫运营团队 · 2024-10-18

VictoriaMetrics 是一个高性能、低资源消耗的时序数据库和监控解决方案。本文介绍 VictoriaMetrics 的定位、社区版与商业版、核心特点、支持的数据接入协议，以及 vmagent、vmalert、vmauth、vmbackup、VictoriaLogs 等生态组件。

Prometheus 聚合查询的两个方案

巴辉特 · 2024-05-22

多个 Prometheus 或 VictoriaMetrics 集群需要统一查询时，可以用 promxy 或 VictoriaMetrics vmselect 做聚合入口。本文基于本地模拟环境说明数据源聚合、server_group 标签和查询验证方法。

如何优化 PromQL 和 MetricsQL 查询

Aliaksandr Valialkin · 2023-04-10

优化 PromQL 和 MetricsQL 查询，先判断慢查询，再分别检查时间序列数量、原始样本数量、重复处理样本、高流失率标签和复杂二元运算，最后通过标签过滤、缩短窗口、调大 Grafana step 等方式降低 CPU、RAM 和 IO 消耗。

如何在 VictoriaMetrics 中删除或修改指标

秦晓辉@快猫星云 · 2023-03-23

说明如何在 VictoriaMetrics 中使用 delete_series 删除指标，以及通过导出、修改、删除、重新导入的流程间接更新指标数据，并提示删除 API 的性能和合规边界。