案例摘要
| 维度 | 信息 |
|---|---|
| 行业 | 智能制造、汽车 |
| 企业背景 | 吉利集团加速推进电动化、智能化与全球化布局,IT 系统覆盖研发、制造、供应链、车联网与海外业务 |
| 核心痛点 | 多云与微服务架构下监控对象激增、告警来源分散、重复告警与级联噪声严重、7×24 全球运营带来跨区域值班协同复杂度 |
| 采用方案 | 引入 Flashduty 作为 SaaS 一站式告警与事件响应平台,统一接入、降噪、排班、升级、协同与事件管理 |
| 结果 | 从“分散告警处理”升级为“统一事件治理中枢”,建立高可用、可度量、可持续优化的现代化事件响应体系 |
| 相关页面 | Flashduty、告警治理与 On-call 响应解决方案 |
企业背景
吉利集团是全球知名的汽车制造商,总部位于中国杭州,业务覆盖整车制造、核心零部件、出行服务及新能源技术等多个领域,持续推进电动化、智能化和全球化转型。
随着业务版图不断扩大,吉利集团的 IT 系统已经覆盖研发、制造、供应链、车联网以及海外业务等多个关键场景。对于这样一个跨地域、跨团队、跨业务形态的大型组织而言,告警与事件响应体系不只是一个运维效率问题,更直接关系到关键业务的连续性和响应质量。
面临的挑战
在传统模式下,吉利集团需要同时面对多个层面的复杂性:
- 多云和微服务架构并存,监控对象数量持续增长;
- 告警来源分散,重复告警和级联噪声严重,工程师容易被大量无效信息打断;
- 7×24 全球运营要求跨区域值班协同,但传统流程缺少统一的调度与升级机制;
- MTTA、MTTR 等关键效率指标缺少统一记录和量化,难以形成持续优化闭环。
这些问题叠加在一起,意味着企业需要的不只是一个“收告警”的工具,而是一个能够承接告警、值班、升级、协同、复盘和持续优化的统一事件响应中枢。
解决方案
针对上述挑战,吉利集团引入 Flashduty 作为统一的事件响应平台,重点围绕以下几个能力展开建设:
1. 告警集中接入与智能降噪
通过统一接入不同来源的告警事件,将原本分散在各个系统中的告警流汇总到一个平台,再结合聚合与降噪机制,降低重复告警对值班人员的干扰。
2. 自动排班与升级机制
Flashduty 提供灵活的值班排班和自动升级机制,帮助企业将不同团队、不同班次、不同严重级别的响应路径标准化,降低跨团队协同成本。
3. IM / App 内闭环响应
针对高频、实时的响应场景,平台支持在 IM 或 App 内完成事件处理闭环,让告警认领、协同和推进不再依赖多个系统来回切换。
4. 全生命周期事件管理
从告警产生、触达、认领、升级、协同到关闭和复盘,平台统一记录整个事件生命周期,为后续分析和持续优化提供数据基础。
5. 数据驱动的运维优化
在统一事件中枢之上,企业可以基于事件数据持续观察告警噪声、团队响应效率和流程瓶颈,推动 On-call 体系持续迭代。
落地效果
通过这套方案,吉利集团实现了从“分散告警处理”到“统一事件治理中枢”的转变:
- 多源告警被统一收敛到一个平台中,事件管理更标准;
- 值班、升级和协同流程得到系统化支撑,跨区域响应更清晰;
- 事件全生命周期过程可追踪、可量化,便于度量和复盘;
- 整个告警与事件响应体系从“被动处理”转向“持续优化”。
对于大型制造企业来说,这种升级的价值不只是减少几条告警,而是在组织层面建立一套高可用、可度量、可持续优化的现代化事件响应体系。