Flashduty vs Pagerduty,产品、服务和价格深入对比

Product Team@快猫星云 2024-07-04 16:00:00

前言

在当今快速变化的IT环境中,组织越来越依赖于一套综合的监控和事件管理工具来确保业务连续性和服务稳定性。然而,随着监控系统的不断扩展,海量的警报和事件通知也随之产生,这给IT团队带来了前所未有的挑战。如何确保每一条告警都能被及时捕捉、准确投递,并得到有效响应,已成为确保服务质量的关键。

面对这一挑战,我们发现以下情况表明组织需要引入或升级其On-Call工具:

  • 全面跟踪与解决:确保每一条故障都能够得到跟踪、处理和解决,防止问题扩大,从而避免更大的资产损失。
  • 值班机制的建立:建立明确的On-Call人员值班机制,包括主备轮班制度,合理分担责任,避免告警信息泛滥。
  • 提升响应效率:当SRE或研发人员在日常On-Call工作中的投入超过25%,需要工具来降低噪音并提升工作效率。
  • 量化指标的建立:建立故障处理时效和人员负载的量化指标,以数据驱动服务稳定性的持续改进。

“在采购On-Call服务时,我们应该考虑哪些关键因素?” 本指南将为您提供全面的 On-Call 工具采购建议,我们将从产品服务价格三个维度出发,探讨IT管理人员在为其开发和运维团队寻找高效协作的故障管理解决方案时应该提出的问题。同时,针对每个细分维度,我们还会提供国内外主流On-Call供应商如 Flashduty 和 Pagerduty 的对比分析,以助您做出明智的选择。

产品

集成能力

故障管理系统作为流程处置中心,存储了全部的告警和故障数据。此类系统应该支持强大的数据接入和外呼能力,以便和其他各类系统或工作流集成,加速响应、增强协同。

产品能力 应该提出的问题 Flashduty vs. Pagerduty
告警集成 1. 是否支持您常用的告警系统?
2. 是否支持自定义告警集成?通过标准协议上报自研脚本监控数据?
3. 是否支持邮件集成?通过邮件触发或关闭故障?
4. 是否支持变更类集成?
故障一般由变更导致,集成变更有助于快速排障。
5. 集成文档是否易于查找,文字是否明确?
是否可以根据文档自助完成配置?
Flashduty ✅,Pagerduty ✅
Pagerduty 支持海外大部分监控工具。
Flashduty 支持国内外主流监控工具,也同时支持Pagerduty协议,部分工具可直接按Pagerduty方式将数据推送给Flashduty。
Webhooks 1. 是否支持故障操作对外推送 Webhook?以便集成自研流程或工具?
2. 是否支持针对事件类型或来源进行订阅?比如单独订阅所属订单系统的故障分派事件?
Flashduty ✅,Pagerduty ✅
Open APIs 是否支持丰富的 Open API,可以让客户通过 API 操作数据实体? Flashduty ✅,Pagerduty ✅
二者均提供丰富的 API 和说明文档。

故障处置

故障处置为系统的核心操作,该维度下主要考察产品功能的丰富度灵活性

产品能力 应该提出的问题 Flashduty vs. Pagerduty
告警路由 1. 是否支持专属集成?
无需路由直接到服务或协作空间?
2. 是否支持共享集成?以及灵活的路由规则?
Flashduty ✅,Pagerduty ✅
Pagerduty 仅支持共享的 integration_key,没有共享集成概念。 Flashduty 可以支持在集成页面设置路由规则,Pagerduty 则需通过复杂的 Event Orchestration 或 Workflow 来实现。
信息增强 是否支持设定自定义字段?
增加字段,定义类型和枚举值,对故障信息进行扩展
Flashduty ✅,Pagerduty ✅
是否支持通过已有信息正则提取出新的标签?
eg. 通过主机名提取出机房信息
Flashduty ✅,Pagerduty ✅
是否支持通过已有信息组合出新的标签?
eg. 通过服务和告警策略,生成 runbook 地址
Flashduty ✅,Pagerduty ✅
是否支持导入数据表,动态生成新标签?
eg. 导入 CMDB 数据,根据主机 ip 自动生成 owner 信息
Flashduty ✅,Pagerduty ❌
Flashduty支持灵活的数据映射方案。
告警降噪 是否支持告警聚合为故障?
1. 将相似的告警聚合到一起进行分派和通知以及处理,提升效率,减少告警疲劳?
2. 是否按照时间窗口聚合故障?
3. 是否支持基于 AI 进行合并?
Flashduty ✅,Pagerduty ✅
Pagerduty 支持智能聚合策略聚合
Flashduty 支持细粒度控制的策略聚合
是否支持故障屏蔽?
在休市或系统维护期间,停止告警通知?
Flashduty ✅,Pagerduty ✅
是否支持故障抑制?
比如宿主机发生故障,抑制 pod 故障?
Flashduty ✅,Pagerduty ❌
是否支持风暴预警?
当故障聚合告警数量太多,再次通知提升响应力度?
Flashduty ✅,Pagerduty ❌
是否支持故障抖动收敛?
相同的故障频繁发生与恢复,应该适当减少通知,避免精力浪费。
Flashduty ✅,Pagerduty ❌
是否支持故障延迟通知?
延后一个窗口通知故障,过滤掉那些发生后立即自动恢复的故障,减少精力浪费。
Flashduty ✅,Pagerduty ✅
故障分派 是否支持故障按策略分派?
1. 是否支持分派给值班、团队或个人?
2. 是否支持同时设定群聊或单聊通知方式?
Flashduty ✅,Pagerduty ✅
Flashduty 额外支持分派到团队以及设定通知方式。
Pagerduty 仅能全局配置单聊和群聊,无法匹配到故障层面。
是否支持按条件匹配进行分派?
1. 是否支持多个分派策略按权重匹配?
Flashduty ✅,Pagerduty ❌
Pagerduty 在一个 Service 下仅支持一个升级策略。
Flashduty 支持在一个协作空间下配置多个分派策略,每个策略可以在不同时间或匹配故障范围生效。
是否支持故障超时未解决自动升级?
1. 是否支持手动升级?
Flashduty ✅,Pagerduty ✅
是否支持基于参数或标签动态进行分派?
1. 根据标签动态替换分派人员,降低系统打通成本?
2. 根据标签动态替换群聊信息?降低配置维护成本?
Flashduty ✅ ,Pagerduty ❌
故障处理 是否支持手动创建故障? Flashduty ✅,Pagerduty ✅
是否支持故障认领、关闭、评论、暂缓与合并?
1. 是否支持超时自动关闭?
2. 是否支持暂缓超时自动取消?
Flashduty ✅,Pagerduty ✅
是否支持故障复盘? Flashduty ❌,Pagerduty ✅
是否支持相似故障? Flashduty ❌,Pagerduty ✅
是否支持详细的操作记录? Flashduty ✅,Pagerduty ✅
是否支持故障重新分派? Flashduty ✅,Pagerduty ✅
是否支持对故障添加自定义操作?
比如手动触发主机重启来故障自愈?
Flashduty ✅,Pagerduty ✅
是否支持故障关闭后重新打开以及通知? Flashduty ✅ ,Pagerduty ❌
是否支持设定自定义字段?
比如标记误报、添加会议链接等?
Flashduty ✅,Pagerduty ✅
双方均支持多种类型的自定义字段。
Flashduty 支持按照字段检索故障。
Pagerduty 仅能在故障详情中查看字段设置。
是否拥有强大的检索能力? Flashduty ✅ ,Pagerduty ❌
Flashduty 支持按照标签、自定义字段、标题、人员信息进行检索。
Flashduty 支持精确、通配以及正则匹配。
Flashduty 支持卡片角视图。
Flashduty 支持故障列表自定义渲染内容。
故障分析 是否支持依据时间、团队、服务等维度统计故障和事件数量? Flashduty ✅,Pagerduty ✅
是否支持依据时间、团队和服务等维度通知故障的处理指标?
如 MTTA 和 MTTR?
Flashduty ✅,Pagerduty ✅
是否支持统计人员处理故障指标?
如 MTTA?如处理故障数量?
Flashduty ✅,Pagerduty ✅
是否支持统计最频繁发生故障的主机和策略? Flashduty ✅,Pagerduty ❌
是否支持统计人员处理故障耗费的时间? Flashduty ❌,Pagerduty ✅
是否支持自定义统计报表? Flashduty ❌,Pagerduty ❌
是否支持定期发送统计报表? Flashduty ❌,Pagerduty ❌
是否支持大屏展示分析看板? Flashduty ❌,Pagerduty ❌
是否支持下载数据明细? Flashduty ❌,Pagerduty ✅

平台能力

平台能力主要在成员管理、值班响应和通知能力层面,系统要具备基本的审计和单点登录功能。通知渠道越丰富越好,本地化支持越多越好,值班管理最好能满足组织内的特殊场景。

产品能力 应该提出的问题 Flashduty vs. Pagerduty
值班管理 是否支持按照天、周或自定义周期进行轮换? Flashduty ✅,Pagerduty ✅
是否支持限定轮换周期内的值班时间? Flashduty ✅,Pagerduty ✅
是否支持不同时间段不同轮换规则? Flashduty ✅,Pagerduty ✅
Flashduty 可以设置周期结束时间。
是否支持设置临时调班? Flashduty ✅,Pagerduty ✅
是否支持设置值班角色?比如主备值班? Flashduty ✅,Pagerduty ❌
是否支持同时多人值班?一起轮换? Flashduty ✅,Pagerduty ❌
是否支持公平轮换?
比如 7 个人按天轮换,那么张三永远在周日值班是否公平?
Flashduty ✅,Pagerduty ❌
是否支持设定轮换通知包括提前通知? Flashduty ✅,Pagerduty ✅
Flashduty 支持更多通知方式
是否支持值班日历导出? Flashduty ❌,Pagerduty ✅
通知渠道 是否支持国内语音和短信? Flashduty ✅,Pagerduty ✅
Pagerduty 受限支持,不稳定
是否支持固定显号? Flashduty ✅,Pagerduty ✅
是否支持邮件通知? Flashduty ✅,Pagerduty ✅
是否支持国内主流 IM 应用协同? Flashduty ✅,Pagerduty ✅
Flashduty 支持:飞书、钉钉、企微应用集成。
是否支持国外主流 IM 应用协同? Flashduty ✅,Pagerduty ✅
二者均支持 Slack 和 Microsoft Teams应用。
Flashduty 额外支持 Zoom 和 Telegram 机器人。
是否支持移动端 App? Flashduty ❌,Pagerduty ✅
是否支持自定义通知模板? Flashduty ✅ ,Pagerduty ❌
Flashduty 支持丰富的模板语法。
单点登录 是否支持单点登录? 支持哪些协议? Flashduty ✅,Pagerduty ✅
Flashduty 支持 SAML、OIDC;
Pagerduty 支持 SAML、Oauth2
操作审计 是否支持操作审计? Flashduty ✅,Pagerduty ✅

价格

供应商一般提供多种订阅方式。但我们主要考虑在满足自身需求的情况下,哪一款更具性价比。确保实际使用不超预算,计价方式的简单性都很重要。

对比项 Flashduty Pagerduty
价格页面 price.flashcat.cloud price.pagerduty.com
收费方式 席位费+超额通信费用 席位费+Add-Ons
版本区分 专业版 ¥179/人/月,全功能 Business 版本 $41/人/月, Add-Ons 单独收费(如 AIops)
是否仅收取活跃用户费用? 是,
活跃用户标准为当月查看或处理故障的成员,仅接收通知不算作活跃用户
否,
处理告警需要买 Full License,仅接收告警需要买 Stakeholder License 包,50 个起卖,每个$3/人/月
免费试用 专业版 14 天免费,
完成配置额外赠送14天,一共28天
Business 版本 14 天免费

服务

服务维度主要考察供应商服务响应的方式以及时效性,即时消息远比其他方式要好。

对比项 Flashduty Pagerduty
是否提供 Email 支持?
是否提供专属支持? ✅,支持专属 IM 服务群 需要单独购买
是否提供专家远程支持? ✅,支持远程会议解决问题 需要单独购买
服务时间 标准版:5*8,专业版:7*8 未知
是否提供 Status Page? 是,status.flashcat.cloud 是,status.pagerduty.com
是否提供 Roadmap? 是,roadmap.flashcat.cloud

最后

我们建议您寻找能够根据您的需求进行定制,并适应您不同工作流程的解决方案。这主要取决于您对供应商的警报和通知工作流程、集成、排班和升级、定价以及其他各种功能的满意程度。建议您全面试用评估后选择。

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat