告警疲劳不是通知问题,而是故障对象建模问题 快猫星云 · 2026-06-11 告警疲劳的根因往往不是通知渠道太吵,而是 Event、Alert、Incident 没有分层建模。本文拆解如何通过事件聚合、告警聚合、标签治理、静默、抑制、抖动检测和路由分派,让通知更接近真实故障对象。
如何更快处理故障 - 论心理模型重叠的重要性 快猫运营团队 · 2025-05-07 在处理复杂故障时,心理模型的重叠是至关重要的。通过扩展知识范围、跨团队轮换和事故演练,我们可以更快地解决问题,避免不必要的延误和损失。