如何做好今天的运维
优秀的运维和架构师应该是怎样的?运维能给人工智能时代带来价值吗?
汇总 Flashcat 博客中归属于 Flashcat方法 分类的文章,方便按内容类型连续阅读产品实践、客户案例和可观测性方法。
优秀的运维和架构师应该是怎样的?运维能给人工智能时代带来价值吗?
Flashcat的设计初衷是实现一个从数据到平台到场景真正一体化的统一监控,成为服务稳定性保障,特别是故障处理的真帮手。
稳定性体系建设是一个巨大的话题,实际上不止是运维人员关注,整个技术体系都非常关注,这个话题慢慢聊,今天我们先着眼在运维视角,看看如何构建稳定性体系。
服务一次次挂掉,技术团队一次次应急响应、一次次复盘,我们从中学到了什么?
稳定性一号位,或者说稳定性负责人,需要有哪些职责:承担责任,制定目标并拆解量化,确定预算,建立技术保障体系
SLO落地难,有哪些落地方法,Flashcat北极星、灭火图等产品可以帮助你
服务稳定性保障,如何站在用户视角看问题,大家有哪些误解,本文从服务可用性、故障、根本原因、根因定位、业务监控多个方面来讲解
云原生时代,监控系统需要具备哪些能力和特点,云原生监控选型要注意这些点
通过几个方面来建设稳定性体系:建立全面的度量体系、重点加强信息协同/让数据说人话、特定场景下的智能辅助决策
如何建立云原生组织,有8个要素分享给大家,分别是:平台团队、SRE团队、应用开发团队、Business KPIs、SLOs、DevOps、GitOps、IaC