站点可靠性运维综述

站点可靠性运维更贴近业务,可以说是业务的大管家,本文主要介绍站点可靠性运维工作的定位,以及相关的问题和积累的经验

如何在监控大盘里配置图片

夜莺里有很多监控大盘,不同的组件都有自己的监控大盘,为了增强美观性,有时我们想把组件logo放到大盘里展示,具体应该如何做呢?

服务挂了,学费交了,掌握这6点就值了

服务一次次挂掉,技术团队一次次应急响应、一次次复盘,我们从中学到了什么?

MySQL监控概述

MySQL监控应该关注哪些指标?哪些指标比较重要?这些指标从哪里可以获取到?

夜莺监控(Nightingale)中的对象列表

夜莺监控(Nightingale)中的对象列表是从哪里来的,可以手工修改吗,为什么要设计这个功能,初衷是什么

Kubernetes监控手册05-监控Kubelet

Kubernetes监控手册第5篇,讲解Kubelet的监控,Kubelet部署在工作负载节点,相比Kube-Proxy的监控数据采集,需要引入认证和HTTPS,更复杂了一些,遵循渐进式学习原则,本文带着大家在Kubernetes监控的路上,再往前一步

Nightingale|夜莺监控机器分组的设计逻辑

Nightingale|夜莺监控,取消了树状结构的机器分组,引入了一维的业务组和标签机制,为何要这么设计?具体是如何思考的?

Kubernetes监控手册04-监控Kube-Proxy

Kubernetes监控手册第4篇,讲解Kube-Proxy的监控,这个组件的监控非常简单容易,我们从这个组件入手,降低学习难度。

通过 Categraf SNMP 插件采集监控数据

支持 SNMP 方式采集数据的 agent 有很多,Telegraf、Categraf、Datadog-agent、snmp-exporter等,我们这次来介绍 Categraf,举一反三,原理上都是一样的。

SNMP命令相关参数介绍

SNMP命令通常需要传入一些参数,各个参数分别代表什么意思?有哪些常见的选项?