夜莺监控(Nightingale)6.x版本整体架构设计思考

夜莺监控(Nightingale)将会在2023年开始设计6.x版本,这个版本的架构会作何改造呢,通过本文做一个梳理,通过梳理的过程我自己也思考的更清晰一些,你也可以了解这个思考的过程。
夜莺监控(Nightingale)6.x版本整体架构设计思考

HAProxy 监控

HAProxy 作为一款非常流行的软件负载均衡器,在很多公司都有应用,本文介绍如何采集 HAProxy 的监控指标,对 HAProxy 做监控。
HAProxy 监控

互联网运维工作的演进和规划

一个典型的互联网企业运维工作和组织架构是怎么样的?运维的未来又是什么样的?
互联网运维工作的演进和规划

Apache Hadoop HDFS 监控

Hadoop HDFS 的监控非常典型,有两种数据采集方法,这一篇介绍第一种,通过 Jolokia 获取 JMX 数据的方式。
Apache Hadoop HDFS 监控

高济健康:基于Flashcat增强IT服务故障管理能力实践

医药健康企业如何建设自己的在线服务故障管理体系?本文结合大型医药企业的实践,分享Flashcat在保障医药企业服务稳定性中的价值和经验。
高济健康:基于Flashcat增强IT服务故障管理能力实践

使用 grok_exporter 从日志中提取指标(日志监控)

grok_exporter 是一个类似 mtail 的方案,可以流式读取日志文件,通过正则做匹配提取指标,相比 mtail 更为简单直观。不过数据计算方面灵活性稍差。
使用 grok_exporter 从日志中提取指标(日志监控)

Kubernetes监控手册11-针对部署到Pod里的应用做性能监控

Kubernetes监控手册第11篇,在Kubernetes体系里,应用程序部署在Pod里,针对这类程序应该监控,跟传统的物理机虚拟机的部署方式有何差别?
Kubernetes监控手册11-针对部署到Pod里的应用做性能监控

Kubernetes监控手册10-使用 kube-state-metrics 监控 Kubernetes 对象

Kubernetes监控手册第10篇,使用 kube-state-metrics 监控 Kubernetes 各类对象,比如某个 Deployment 有多少副本可用多少副本不可用,有多少 Pod 分别是什么状态之类的。
Kubernetes监控手册10-使用 kube-state-metrics 监控 Kubernetes 对象

Kubernetes监控手册09-监控ETCD

Kubernetes监控手册第9篇,讲解如何监控ETCD,ETCD现在使用已经越来越广泛了,不止是Kubernetes,很多业务方也在使用,需要有个深入了解。
Kubernetes监控手册09-监控ETCD

Kubernetes监控手册08-监控scheduler

Kubernetes监控手册第8篇,讲解 scheduler 的监控方法,scheduler 是负责调度对象到合适的 node 上,会有一系列的规则计算和筛选。重点关注调度相关的指标
Kubernetes监控手册08-监控scheduler

Kafka 关键概念,什么是AR、OSR、ISR、HW和LEO以及之间的关系

要做 Kafka 的监控,首先要了解 Kafka 的一些关键概念,Kafka 的关键概念还有点多,本文对这些关键概念做一个概要介绍。
Kafka 关键概念,什么是AR、OSR、ISR、HW和LEO以及之间的关系

Kubernetes监控手册07-监控controller-manager

Kubernetes监控手册第7篇,讲解 controller-manager 的监控方法,controller-manager 是负责监听对象状态,并与期望状态做对比,如果状态不一致则进行调谐,重点关注的是各个controller的运行情况,比如任务数量,队列深度
Kubernetes监控手册07-监控controller-manager

Kubernetes监控手册06-监控APIServer

Kubernetes监控手册第6篇,讲解APIServer的监控,APIServer作为Kubernetes全局统一API入口,是控制面的核心组件,APIServer如果出问题,各类增删改查都无法操作。
Kubernetes监控手册06-监控APIServer

手把手融汇贯通网络流量分析

我们生活在一个数据大爆炸的时代,网络是互联网的载体,网络流量分析也是技术人员日常最依赖的troubleshooting手段,本文手把手讲解网络流量捕获和分析的方方面面
手把手融汇贯通网络流量分析

二十年里12个开源监控工具大对比

过去20年里,都涌现出来了哪些典型的优秀开源监控工具,他们的优缺点如何?
二十年里12个开源监控工具大对比

服务器生命周期管理

如果您的业务还没有使用公有云,那么服务器的完整生命周期管理,是至关重要和绕不过的一个话题,本文介绍了自建IDC环境下服务器的生命周期管理。
服务器生命周期管理

站点可靠性运维综述

站点可靠性运维更贴近业务,可以说是业务的大管家,本文主要介绍站点可靠性运维工作的定位,以及相关的问题和积累的经验
站点可靠性运维综述

如何在监控大盘里配置图片

夜莺里有很多监控大盘,不同的组件都有自己的监控大盘,为了增强美观性,有时我们想把组件logo放到大盘里展示,具体应该如何做呢?
如何在监控大盘里配置图片

最佳实践:服务挂了,学费交了,掌握这6点就值了

服务一次次挂掉,技术团队一次次应急响应、一次次复盘,我们从中学到了什么?
最佳实践:服务挂了,学费交了,掌握这6点就值了

MySQL监控概述

MySQL监控应该关注哪些指标?哪些指标比较重要?这些指标从哪里可以获取到?
MySQL监控概述

标签
ai aiagent aiops alertmanager apache apiserver apm azure categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl faq featureflag filelog flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google gpu grafana grok_exporter hadoop hana haproxy hdfs helm httpstat huatuo iac ibex ilo im协同 incident it监控 jaeger jenkins jmx jmx-exporter jolokia jvm k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki metrics metricshub metricsql mimir mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis rum salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre syslog telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 出海业务 创业 错误预算 错误预算机制 大厂实践 大模型 大模型智能oncall 滴滴夜莺 钉钉 钉钉通知 飞书 飞书通知 服务稳定性 告警 告警oncall 告警丰富 告警风暴 告警规则 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警数据孤岛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障复盘 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控告警 监控工具 监控设计思考 监控系统 监控系统合规 进程监控 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 连锁门店 链路追踪 埋点监控 面试题 灭火图 普罗米修斯 企微通知 企业微信 人工智能 日志 日志采集 日志存储 日志分析 日志告警 日志监控 容器 熔断 时序库 时序数据库 事件监控 手把手构建生产级监控系统 他山之石 提问的智慧 通知规则 统一监控 网络可观测性 网络排障 尾采样 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 系统架构设计 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能oncall 智能告警 自监控 最佳实践
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
Flashduty
Flashduty