Nginx stub status采集

本文讲解如何从头开始编译http_stub_status_module模块,并使用input.nginx插件采集指标。

Nginx upstream采集

本文讲解如何添加nginx_upstream_check模块,并使用input.nginx_upstream_check插件采集指标。

Nginx vts采集

本文讲解如何添加vts模块,并使用input.prometheus插件采集指标。

Netflix SRE 实践概述

NetFlix 的 SRE 实践是如何的?大家应该很好奇吧。NetFlix 全部采用 aws 构建他们的流媒体服务,体量巨大,他们的 SRE 文化是什么?主要干什么事情?且听本文分解。

运维百家讲坛第6期:途游邹轶 - 中小公司的运维怎么做?

这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。

夜莺V6.X架构介绍

Nightingale 夜莺 6.x 版本架构上做了调整,本文从中心部署架构和下沉部署架构两个常见场景进行介绍。

SRE接手新业务首要工作:运维准入测试

如果接手的是一坨随时可能散架的破车,就算SRE有通天之能,也很难通过运维手段给变成布加迪威龙。接手的时候一定要做好准入测试!很多公司会有运维准入规范,但是通常缺少运维准入测试,导致了后续诸多背锅问题。

如何做好今天的运维

优秀的运维和架构师应该是怎样的?运维能给人工智能时代带来价值吗?

如何在 VictoriaMetrics 中删除或修改指标

在 VictoriaMetrics 中,有些指标不想要了,如何删除?或者有些数据不对,如何更新?

阮一峰的网络日志:运维的未来是平台工程

转载自阮一峰的网络日志。老规矩,兼听则明,偏信则暗,听百家之言,自我决策。