所属分类 “快猫运维白皮书” 的文章

服务挂了,学费交了,掌握这6点就值了

服务一次次挂掉,技术团队一次次应急响应、一次次复盘,我们从中学到了什么?

稳定性保障一号位的进击之旅

稳定性一号位,或者说稳定性负责人,需要有哪些职责:承担责任,制定目标并拆解量化,确定预算,建立技术保障体系

SLO新解,一种行之有效的故障处理方法

SLO落地难,有哪些落地方法,Flashcat北极星、灭火图等产品可以帮助你

服务稳定性保障的五大误解

服务稳定性保障,如何站在用户视角看问题,大家有哪些误解,本文从服务可用性、故障、根本原因、根因定位、业务监控多个方面来讲解

云原生监控的十大特点和趋势

云原生时代,监控系统需要具备哪些能力和特点,云原生监控选型要注意这些点

建立云原生组织的8个要素

如何建立云原生组织,有8个要素分享给大家,分别是:平台团队、SRE团队、应用开发团队、Business KPIs、SLOs、DevOps、GitOps、IaC

是时候该从用户视角去看待系统稳定性问题了

通过几个方面来建设稳定性体系:建立全面的度量体系、重点加强信息协同/让数据说人话、特定场景下的智能辅助决策