夜莺即时查询功能详解
夜莺即时查询是可视化的基础功能。通过即时查询可以方便调试 PromQL,调试好的 PromQL 可以用在告警规则、仪表盘等地方。本文详细介绍了即时查询页面的所有功能点。
围绕可观测性、AI SRE、告警治理、On-call、Nightingale、Categraf、Prometheus、Kubernetes、Zabbix、用户案例和产品更新,沉淀一线工程实践、选型参考和稳定性治理方法。
夜莺即时查询是可视化的基础功能。通过即时查询可以方便调试 PromQL,调试好的 PromQL 可以用在告警规则、仪表盘等地方。本文详细介绍了即时查询页面的所有功能点。
介绍 OpenTelemetry Collector 的部署方式,包括 sidecar 模式、daemonset 模式和中心集群模式。不同的部署方式适用于不同的场景,需要根据实际情况选择合适的部署方式。
本文链路追踪的关键概念:Trace、Span、Span Context、Attributes、Span Events、Span Links、Span Status 和 Span Kind。这些概念是 OpenTelemetry 中链路追踪的基础,帮助我们更好的理解 Tracing 的逻辑。
OpenTelemetry 是一个用于分布式系统的观测性框架,旨在提供可观测性数据(如追踪、度量和日志)的统一标准和工具。它是由 OpenTelemetry 工作组开发的,结合了 OpenTracing 和 OpenCensus 两个项目的优势。
链路追踪是现代分布式系统监控的重要组成部分,通过提供对请求流转的深入洞察,帮助团队识别性能问题和故障,提升系统的可观测性。选择合适的链路追踪工具和策略,将对系统的稳定性和用户体验产生积极影响。
Fluentbit 是非常流行的日志采集器,本文以夜莺的日志举例,使用 Fluentbit 采集,并直接写入 ElasticSearch,最终使用 Kibana 查看。借此实践过程,让读者熟悉 Fluentbit 的使用。
Fluentbit 是一个轻量级的日志收集器,适用于容器化环境和边缘设备。除了采集日志之外,也支持采集指标,默认支持 CPU、内存相关的指标,还支持 Node-Exporter 的指标。本文介绍了如何配置 Fluentbit 采集 Node-Exporter 的指标。
ictoriaMetrics 集群版相比单机版,更适合大规模的监控数据存储和查询。本文介绍集群版本的搭建方式,以及一些重要参数和注意事项。
VictoriaMetrics 18 条 Troubleshooting 建议,解决性能问题、部署运维问题、使用问题、以及一些关键指标等
VictoriaMetrics 的磁盘文件存储结构讲解,包括小 part、大 part、块、索引等。同时讲解 VictoriaMetrics 的存储保留时长。开源版可以通过搭建多个实例的方式对不同的数据设置不同的存储时长。
夜莺 v7.5 发版,优化了一波小功能。首先是告警规则页面的优化,其次是仪表盘的跳转链接的优化。再有一两个小版本,v7 就差不多了,后面的大功能会放到 v8 版本,敬请期待
讲解 VictoriaMetrics 的高可以用(High availability)方案,即双写方案,这种方案简单,鲁棒性高。前面使用 vmauth 做 Proxy。如果采集侧也要使用多个 vmagent 做高可以用,那就需要在服务端启用 Deduplication
告警事件大家都不陌生,但是要把告警事件处理好并不容易,一般监控系统不会着力优化告警事件的后续处理逻辑,这催生了统一告警事件中心的需求,像 PagerDuty、Flashduty 都是个中翘楚
讲解 VictoriaMetrics 的容量规划,以及如何根据实际情况调整 VictoriaMetrics 的资源限制参数
VictoriaMetrics 期望做大一统的时序数据存储,可以对接各类采集器,比如 Prometheus 生态的各类 Exporter、Telegraf、Datadog-Agent、OpenTSDB collector、StatsD 等等。
如何在 Grafana 中对接 VictoriaMetrics,实现数据可视化展示。由于 VictoriaMetrics 完全兼容 Prometheus 的接口协议,可以把 VictoriaMetrics 看做是 Prometheus
运维工作通常分三大方向,监控、变更、资产管理。运维监控是运维工作的重中之重,因为做好监控是稳定性保障的前提,如果监控都没做好,更何谈故障及时发现、故障快速定位呢
讲解如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics,这样就可以实现 Prometheus 的数据高可用和持久化。同时,我们也会了解如何给 Prometheus 添加标签,以及如何调整 remote write 的配置参数。
Nightingale 和 Flashcat 是两个不同的监控系统,本文将介绍它们的区别。简单来讲 Nightingale 是一款开源监控系统,Flashcat 是 Nightingale 的商业版本,主导这两个项目的是一波人
VictoriaMetrics 是一个非常优秀的时序数据库,它的性能、稳定性、易用性都非常好,是国内很多大厂的选择。本文是 VictoriaMetrics 中文教程第 02 篇,讲解 VictoriaMetrics 的安装,VictoriatMetrics 支持多种不同的安装方式,极为方便