很多团队第一次评估 On-call 平台时,会先看单价。
这很自然。价格页最直观,采购也需要预算。但 On-call 工具真正容易算错的地方,不是单价,而是“谁需要付费”。
一个 100 人技术团队,可能只有 10 到 20 人每天参与值班、认领故障、调整分派策略和处理升级。但故障发生时,可能需要通知更多研发、测试、运维、DBA、网络、安全、业务负责人,甚至外部协作方。
如果工具按所有接收通知的人收费,成本会跟通知覆盖面一起增长。为了省钱,团队很容易把通知范围缩小到少数核心人员。这样做短期看省了预算,长期看会带来另一个问题:关键故障触达不到真正需要参与的人。
所以,On-call 成本不能只看“每人每月多少钱”。更准确的算法应该先回答三个问题:
- 有多少人需要登录平台处理故障?
- 有多少人只需要被动接收通知?
- 电话、短信、邮件等通知量是否会产生额外费用?
这三个问题,比产品单价更能决定总拥有成本。
先区分两类人:处理人和通知接收人
On-call 平台里的用户并不都承担同一种工作。
第一类是故障处理人。他们需要查看故障详情、认领故障、关闭故障、评论协同、调整值班表、配置分派策略、查看分析报表。这类人需要完整的平台权限,也应该进入 License 或席位测算。
第二类是通知接收人。他们不一定需要登录平台操作,只需要在特定故障发生时收到电话、短信、邮件、IM 或状态页通知。
在真实组织里,第二类人通常更多。
比如支付系统故障,核心处理人可能是当班 SRE、支付研发负责人、数据库负责人和业务系统 owner。但通知范围可能包括整个支付研发团队、客服接口人、业务值班人和管理者。
如果这两类人都按完整席位收费,100 人团队就很容易被算成 100 个席位。
如果工具允许把“处理权限”和“通知接收”拆开,成本模型就会完全不同。
Flashduty 的成本模型:按活跃处理人计算 License
Flashduty On-call 采用 License 订阅制,按活跃用户数量计费。每个 License 对应一个账户成员,持有 License 的成员可以使用 On-call 的完整功能。
关键点在于:只有需要查看和处理故障的成员才需要 License。只需要被动接收告警通知的成员,可以不持有 License。
这意味着 100 人技术团队不一定要买 100 个 License。
更常见的测算方式是:
Flashduty 月成本 = 需要查看和处理故障的人数 × License 单价 + 超额通信费用
Flashduty 专业版价格为 ¥199/人/月。标准版和专业版都不限最大用户数、最大值班表数、最大协作空间数和每日告警量;免费版适合体验,但最多 5 个用户、1 张值班表、1 个协作空间,每日最多接收 100 条告警,超出部分会被静默丢弃。
通知额度也需要纳入测算。标准版每用户每月包含 500 条免费短信、50 分钟免费电话和 2,000 封免费邮件;专业版每用户每月包含 1,000 条免费短信、100 分钟免费电话和 5,000 封免费邮件。标准版和专业版超出额度后按量计费:短信 ¥0.05/条,电话 ¥0.12/分钟,邮件 ¥0.0018/封。Webhook 不限。
所以 Flashduty 的成本测算要看两部分:
一部分是核心处理人的 License。
另一部分是电话、短信、邮件是否会超出套餐额度。
对大多数团队来说,第一部分是主要成本,第二部分是需要监控的变量成本。
PagerDuty 的成本模型:按用户席位和 Add-ons 计算
PagerDuty 官方价格页显示,Incident Management 当前包含 Free、Professional、Business、Enterprise 等计划。Business 年付价格为 $41/user/month,月付价格为 $49/user/month。Professional 年付价格为 $21/user/month,月付价格为 $25/user/month。Enterprise 为定制报价。
PagerDuty 的价格页还列出多类 Add-ons,例如 AIOps、Stakeholder License、Status Pages、Live Call Routing、PagerDuty Advance 等。AIOps 和 PagerDuty Advance 都是额外购买项,其中 PagerDuty Advance for Incident Management 起价为 $415/month,AIOps 起价为 $699/month。
这会影响成本判断。
如果团队只需要基础 On-call、值班表和升级策略,计算相对简单。
如果团队还需要 AIOps、更多状态页、Stakeholder 用户、Live Call Routing 或高级 AI 能力,就不能只拿基础席位单价做预算。
更重要的是,PagerDuty 官方 AIOps 价格页明确说明,添加到 PagerDuty 账户中的每个人都是付费用户,包括接收通知或在值班表中的用户。
因此,用 PagerDuty 做成本测算时,需要先确定要进入账户、接收通知、进入值班表或参与响应的人数。
一个简化公式是:
PagerDuty 月成本 = 付费用户数 × 计划单价 + Add-ons + 可能的通知或服务费用
这个“付费用户数”是成本差异的核心。
用 100 人团队做一次测算
假设一个 100 人技术团队,组织结构如下:
| 人员类型 | 人数 | 是否需要处理故障 | 是否需要接收通知 |
|---|---|---|---|
| 一线 SRE / 运维值班 | 8 | 是 | 是 |
| 核心研发 owner | 5 | 是 | 是 |
| 团队 Leader / 平台管理员 | 2 | 是 | 是 |
| 其他研发、测试、DBA、安全、业务接口人 | 85 | 否 | 是 |
这个团队有 15 人需要日常查看和处理故障,100 人都可能需要在相关故障发生时收到通知。
用 Flashduty 专业版测算:
15 个 License × ¥199/人/月 = ¥2,985/月
年度 License 成本 = ¥2,985 × 12 = ¥35,820/年
通知额度按 License 数累计:
专业版每月短信额度 = 15 × 1,000 = 15,000 条
专业版每月电话额度 = 15 × 100 = 1,500 分钟
专业版每月邮件额度 = 15 × 5,000 = 75,000 封
只要实际短信、电话、邮件用量在额度内,就没有额外通信费用。超出部分再按单价计费。
用 PagerDuty Business 年付价测算:
100 个用户 × $41/user/month = $4,100/月
年度席位成本 = $4,100 × 12 = $49,200/年
如果采购时需要人民币预算,可以用这个公式换算:
PagerDuty 年度人民币预算 ≈ $49,200 × 采购汇率
例如用 7.2 作为示例汇率:
$49,200 × 7.2 = ¥354,240/年
这个汇率只是测算变量,不是正式报价。采购时应使用合同汇率、付款汇率或财务口径。
在这个示例里,Flashduty 的年度 License 成本是 ¥35,820,PagerDuty Business 的年度席位成本约为 ¥354,240。差异主要来自计费对象不同:一个按 15 个故障处理人算,一个按 100 个需要覆盖的人算。
不要只算席位,还要算通知覆盖
很多团队做 On-call 预算时,会做一个看似合理的压缩:只给 15 个核心处理人买席位。
这样月成本会下降,但代价也很明显。
故障发生时,很多相关人员收不到通知。业务 owner 不知道影响范围,DBA 不知道需要介入,研发团队不知道自己负责的服务正在升级,管理者只能等别人转发群消息。
这不是健康的 On-call 机制。
On-call 平台的价值不是让少数人收到更多消息,而是让正确的人在正确时间收到可行动的信息。成本测算也应该围绕这个目标展开。
所以,比较两个方案时应该同时看两组数字:
| 指标 | 应该怎么问 |
|---|---|
| 处理席位成本 | 有多少人需要登录平台处理故障? |
| 通知覆盖成本 | 要覆盖 100 人、200 人或更多人时,是否每个人都要买席位? |
| 通知额度成本 | 电话、短信、邮件是否包含额度,超出如何计费? |
| 高级能力成本 | AIOps、状态页、工单、AI 摘要、复盘等是否包含在当前版本里? |
| 支持成本 | 专属服务、远程支持、私有化部署是否额外收费? |
只看第一行,容易低估成本。
不看第二行,容易牺牲通知覆盖。
不看第三行,容易在告警风暴或高频升级时出现费用偏差。
不看第四行,容易把 Add-ons 漏掉。
不看第五行,容易低估落地成本。
100 人团队怎么判断自己需要多少 License
不要按组织总人数估算 License。应该按故障响应职责估算。
可以从四类人开始统计:
第一,实际参与值班的人。包括主值班、备值班、节假日值班和跨区域值班。
第二,需要在平台内处理故障的人。包括认领、关闭、暂缓、评论、合并、重新分派、手动升级等操作。
第三,需要配置 On-call 机制的人。包括值班表、分派策略、升级规则、通知模板、静默策略和抑制策略的管理员。
第四,需要长期查看故障详情和分析报表的人。包括 SRE 负责人、运维负责人、平台负责人和部分团队 Leader。
这四类人通常就是核心 License 人群。
其他人如果只是接收通知,可以先作为无 License 成员纳入通知范围。这样不会把通知覆盖和处理权限绑死,也不会为了省钱让告警只停留在小圈子里。
成本测算还要考虑版本能力
成本不是越低越好,关键是用最低的总成本覆盖必要能力。
Flashduty 免费版适合个人或小团队体验,但不适合生产级 100 人团队。原因很直接:免费版最大用户数 5,每日告警上限 100 条,最大值班表数和协作空间数都是 1,且不支持告警聚合、抑制策略、分析看板、IM 集成、服务日历、AI 故障摘要、故障复盘、作战室和工单集成等能力。
标准版适合中小型团队日常使用,包含基础 On-call 能力、抑制策略、告警聚合、规则告警聚合、告警风暴、分析看板、变更集成、Webhook 集成和自定义字段。
专业版适合企业级生产环境,包含智能告警聚合、IM 集成、服务日历、自定义通知模板、自定义值班角色、高级标签增强、历史故障查询、新奇故障识别、外部创建故障、故障复盘、内部状态页、AI 故障摘要、作战室,以及 Jira、ServiceNow 工单集成。
如果团队只是验证接入和通知,免费版或试用可以完成第一步。
如果要做正式 On-call、告警降噪、分派升级和数据分析,至少要按标准版或专业版能力来测算。
如果要覆盖飞书、钉钉、企业微信 IM 集成、AI 摘要、故障复盘、作战室和工单集成,应该直接按专业版能力评估。
这一步很重要。因为很多采购对比看似在比价格,实际在比不同能力集合。
一张可直接使用的 On-call 成本测算表
可以把下面这几行放进表格,快速算出团队预算:
| 项目 | 填写方式 |
|---|---|
| 技术团队总人数 | 例如 100 |
| 需要处理故障的人数 | 例如 15 |
| 只接收通知的人数 | 总人数 - 处理人数,例如 85 |
| Flashduty License 单价 | 专业版 ¥199/人/月 |
| Flashduty 月 License 成本 | 处理人数 × ¥199 |
| Flashduty 年 License 成本 | 月 License 成本 × 12 |
| PagerDuty 用户数 | 需要进入账户、接收通知或在值班表中的人数 |
| PagerDuty Business 年付单价 | $41/user/month |
| PagerDuty 月席位成本 | 用户数 × $41 |
| PagerDuty 年席位成本 | 月席位成本 × 12 |
| 汇率变量 | 采购或财务确认 |
| Add-ons | AIOps、Stakeholder License、Status Pages、Live Call Routing、PagerDuty Advance 等 |
| 通信费用 | 短信、电话、邮件额度与超额费用 |
这个表格的重点不是得出一个固定数字,而是把成本拆清楚。
当处理人数是 15、通知覆盖人数是 100 时,Flashduty 的成本优势会非常明显。
当处理人数和通知覆盖人数接近时,差异会缩小。
当需要大量 Add-ons 或私有化部署时,还要把合同报价、服务支持和实施成本放进同一张表。
什么时候应该重点关注 Flashduty 的成本优势
如果团队只有 5 到 10 人,且所有人都会处理故障,License 模式和全员席位模式的差异不一定明显。
但如果团队出现以下情况,就应该认真算一次:
- 技术团队超过 50 人,但日常处理故障的人只有一小部分。
- 需要把研发、运维、测试、安全、业务负责人都纳入通知范围。
- 告警源很多,包括 Prometheus、Zabbix、Nightingale、Grafana、云监控、蓝鲸、Open-Falcon 或自研系统。
- 已经出现“为了省席位而缩小通知范围”的情况。
- 需要飞书、钉钉、企业微信里的故障通知和协同。
- 需要电话、短信、App 推送作为关键告警兜底。
- 希望在不替换现有监控系统的前提下,先统一告警响应。
这类团队的问题不是买一个便宜通知工具,而是建立一套成本可控、覆盖完整、能持续治理的 On-call 机制。
最后的建议:用真实组织结构算,不要用平均单价猜
On-call 成本的正确算法,不是打开价格页,用单价乘总人数就结束。
先画出团队真实响应链路:
谁值班?
谁处理?
谁升级?
谁只需要接收通知?
谁需要看报表?
哪些故障要电话?
哪些故障只进 IM?
哪些团队需要状态页或工单同步?
然后把这些人和动作放进成本模型里。
对 100 人技术团队来说,最常见的浪费是把所有通知接收人都当成完整处理人付费。最常见的风险则是为了控制成本,只让少数人收到告警,导致故障响应链路断掉。
Flashduty 的 License 模式把这两件事拆开:需要处理故障的人持有 License,其他相关人员也可以接收通知。
这不是简单的价格差异,而是 On-call 成本结构的差异。
如果你正在评估 PagerDuty 或其他 On-call 工具,建议先用一个真实业务系统做 14 天试用:接入一个告警源,配置值班表和分派策略,跑一次短信、电话、IM、升级和关闭流程,再看告警量、通知量、处理人数和响应指标。
算清楚之后,再谈采购。
资料依据:
- Flashduty 产品定价:License 订阅制、通知额度、版本能力和资源限制。https://docs.flashcat.cloud/zh/platform/pricing
- Flashduty 产品对比:与 PagerDuty 的功能、服务和价格模型对比。https://docs.flashcat.cloud/zh/on-call/quickstart/comparison
- PagerDuty 官方价格页:Incident Management Professional / Business / Enterprise 价格、Add-ons 和 PagerDuty Advance 价格说明。https://www.pagerduty.com/pricing/
- PagerDuty AIOps 价格页:AIOps 起价与用户计费说明。https://www.pagerduty.com/pricing/aiops/