Flashcat | 智能全栈观测平台

Flashcat 是以开源夜莺为内核打造的智能全栈观测平台，覆盖指标、日志、链路，以及北极星、灭火图等稳定性保障产品。Flashcat 内置智能代理 FlashAI，用户用自然语言交互，AI 帮你配置、分析、定位根因，并直接修复问题！稳定性保障中 AI 的角色不再是「增强」而是「关键」。

联系销售白皮书产品介绍PPT PPT

产品介绍

Flashcat 以数据 → 平台 → 场景 → 智能四层架构建设真正的智能全栈观测平台。

数据：开源采集器 Categraf + 数据插线板纳管全企业观测数据；

平台：以开源夜莺为基础构建完备的观测平台，面向规模企业增强丰富大量观测功能，覆盖指标、日志、链路等所有观测维度；

场景：北极星 / 灭火图 / 事件墙解决稳定性保障场景问题，并把 IT 系统映射为可被 AI 理解的「知识图谱」；

智能：FlashAI（内置可观测性 AI Agent）让平台可以被自然语言端到端操控 —— 数据检索、视图创建、根因分析、系统巡检、故障修复全面智能化；

为什么选择 Flashcat

全栈

涵盖指标、日志、APM、RUM、监控告警与 On-Call，从用户终端到后台服务与基础设施，实现对每个请求的端到端追踪与监控，精准定位性能瓶颈，持续优化用户体验。

智能

以 AI Agent 为核心，用自然语言和智能定时任务端到端操控平台，从数据接入、到平台使用、到场景化分析、到修复动作的执行、到操作报告的输出，实现全流程智能化的闭环。

开源

源于开源夜莺（Nightingale），遵循 OpenTelemetry 标准规范，深度兼容 Prometheus 生态，all-in-one 采集器代码开源。面向 AI 生态，接入大模型可灵活切换。

产品特点

数据：可采集、可集成

从采集到存储到产品一体化。Categraf 采集器开箱即用；业界独有的 「数据插线板」 让 Prometheus、Elasticsearch、Doris、SLS、CLS、Skywalking 等存量观测系统即插即用，告警、仪表盘、数据查询在一个平台一站式完成。

生态：标准化、无锁定

基于开源夜莺实现，遵循 OpenTelemetry 协议，深度兼容 Prometheus 生态，能够从开源和生态的发展中长期获益；面向 AI 生态保持开放，可接入任意厂商大模型，并可自由切换，按需求和场景，灵活决定使用的模型服务。

场景分析：AI 数据基础

北极星 + 灭火图 + 事件墙把大型服务的稳定性保障经验产品化，将 IT 系统结构化为可被 AI 理解的知识图谱：实体（IT 对象）+ 关系（层级/下钻映射）+ 属性（健康量化指标）+ 实时状态。不仅让人看清系统，也让 AI 读得懂系统。知识图谱本身的建设过程也由 AI Agent 智能化完成并持续完善。

智能化：分析到修复闭环

FlashAI 是 Flashcat 内置的可观测性 AI Agent：基于灭火图「知识图谱」给出智能根因分析、智能巡检报告，以自然语言端到端操控平台。同时具备了在根因分析完成后直接给出修复方案，并直接执行修复方案的能力。可观测性已从分析到修复形成了智能闭环。

了解更多

Flashcat 产品介绍

了解更多

Flashcat 独特性

了解更多

Flashcat 和 AI

了解更多

核心功能 - 灭火图

了解更多

用户案例

Zenlayer如何将万台设备监控从Zabbix迁移到Flashcat

在 Zenlayer，监控系统不仅仅是作为一个内部工具服务于运维和研发团队，我们的售后团队高度依赖监控系统为客户提供高水平的技术支持服务，监控系统是 Zenlayer 最重要的基础服务和产品之一，是我们交付用户价值的关键所在。

了解更多

知乎的 SLO 运营实践

知乎的可观测性数据体量巨大，本文介绍了知乎的可观测性体系实践和经验，以及如何利用 SLO 持续的度量、追踪和改进系统可用性。

了解更多

海大集团的可观测平台建设实践

海大集团是以科技为主导的中国农业龙头企业，1998年成立于广东广州，目前业务涵盖饲料、种苗、动保疫苗、智慧养殖、食品加工等现代农牧全产业链。海大集团利用Flashcat构建了一体化的可观测性平台，覆盖了不同业务板块，支持异构的 IT 环境（容器/K8s、物理机、虚拟机、公有云并存），并打通了从业务视角到 IT 视角的监控，提升了故障发现和定位的能力。

了解更多

知名火锅连锁企业：IT 团队如何在数千家门店中先于用户发现故障

作为中国领先的餐饮企业，上千家门店遍布全球，由于门店餐饮行业的特殊性，需要靠前部署服务，所以在每家餐厅中，会部署相应的服务器，及相应IT设备，本地会运行 POS、会员、下单等业务。通过落地 Flashcat 平台，集中化的监控了所有门店，并采用数据驱动的理念，对所有的门店 IT 健康状态进行科学的量化，真正做到先于门店发现问题，及时高效治理有 IT 隐患的门店。

了解更多

20套监控平台统一成1套Flashcat，国泰君安监控选型提效之路

作为国内头部期货公司，随着行业的发展，国泰君安期货的业务不断增长，近年来各开发厂商对新技术的引用，其运维工作面临着系统种类多、主机数量多、技术栈多、机房多（跨地域）的难题，而原有监控A无法满足现有的监控需求，他们想找一个既能统一管理多平台、扩展性较好、满足现有场景且包含主流的技术，又能支持异地纳管统一上报的更高效的运维监控平台。

了解更多

Flashcat与出行科技企业一起实践多云可观测

某出行科技企业从单个公有云往多云转型，依托于国内领先的公有云提供商，采用多云架构，在可用性、弹性、成本、供应商依赖方面，拥有了显著的优势。相应的，多云架构也给技术团队带来了一定的复杂度和技术挑战，最显著的就是如何高效的构建跨云的可观测性体系，提升故障发现、问题排查、性能分析等方面的能力。

了解更多

13000+

Github Star

1700+

Github Fork

150+

开发者

数千家

终端用户

开源版与企业版对比

从 Open-Falcon 到 Nightingale、Categraf，快猫星云技术团队在监控领域已经深耕十年之久，支持和服务了数千家企业，是开源监控的行业引领者。我们看到很多公司从开源监控受益，也看到很多公司因为缺乏行业最佳实践，在可观测性体系建设中走了不少弯路，包括如何选型工具和构建平台，如何对可观测性数据进行治理，如何利用好可观测性数据，打通各个维度数据之间的串联关系，快速定位和止损故障。

快猫星云创始团队，均来自于阿里、百度、滴滴，快猫星云以开源夜莺为内核打造的统一可观测平台，是国内顶级互联网公司可观测性实践和服务稳定性保障方法论的产品化落地，我们致力于帮助企业快速构建统一的可观测性体系以及构建数据驱动的稳定性治理框架。下面是企业版与开源版的对比说明，您可以联系我们进一步了解企业版更多信息。

FlashAI

可观测性平台 AI Agent

北极星

业务指标实时看板：支持可视化大屏、指标异常波动智能检测

灭火图

IT系统可用性实时看板：支持实时度量应用/基础设施健康状态，智能设定可用性目标

事件墙

发布变更和异常事件看板：支持收集和展示当前发生的重要事件，如变更、报警、运营事件

日志分析

支持日志收集、提取、查看、分析等，自动推荐和快速定位故障原因和特征

On-Call 值班中心

支持告警聚合、降噪、认领、升级、排班、协同

数据源管理

Prometheus

ElasticSearch

Jaeger

OpenSearch

ClickHouse

阿里云 SLS

腾讯云 CLS

Zabbix

InfluxDB

MySQL/Oracle/PostgreSQL/SQLServer

SkyWalking

Zipkin

数据采集器

指标（Metrics）采集

日志（Logging）采集

Tracing 数据收集

物理机/虚拟机数据采集

容器/K8s数据采集

交换机/网络设备数据采集

常用中间件/数据库数据采集

Windows 数据采集

数据采集规则集中管理和下发

仪表盘

内置仪表盘模版

导入Grafana模版

指标仪表盘

日志仪表盘

多数据源支持

告警管理

指标（Metrics）阈值告警

主机（Host）失联告警/时间偏移告警

告警规则管理：屏蔽、订阅、记录规则

活跃告警/历史告警管理

内置众多告警策略模版

日志（Logging）告警

智能告警

内置电话/短信通道（阿里云/腾讯云）

告警聚合降噪

告警升级

告警自愈

告警自愈脚本管理，自愈脚本和告警规则关联管理

分布式链路追踪

Jaeger 数据源

SkyWalking 数据源

Zipkin 数据源

Elastic APM 数据源

阿里云 SLS trace 数据源

Pinpoint 数据源

基础设施

主机分组、标签管理

主机基础元信息（metadata）展示和管理

内置多种基础设施的数据采集规则模版

主机扩展元信息（metadata）展示和管理

Categraf 采集规则集中管理和下发

人员组织

用户管理

团队管理

组织管理

角色管理

权限管理

系统配置

数据源自定义配置

通知媒介、通知渠道、通知模版自定义配置

单点登录自定义配置（OAuth、LDAP、OIDC、CAS等）

操作审计

支持关键操作和敏感操作的审计记录

技术支持

技术支持获取途径

技术支持响应级别

专家解决方案

咨询实施

方案

支持

开源版

GitHub Issue

一周

企业版

专项支持群、视频会议

7×12

7×12 专家技术支持

常见问题

Flashcat 和 Nightingale 是什么关系？

Nightingale 是开源云原生监控分析系统，Flashcat 企业版以 Nightingale 开源内核为基础，面向企业场景增强了全栈可观测、场景化故障定位、AI 根因分析、私有化交付和商业技术支持等能力。

Flashcat 是否支持私有化部署？

Flashcat 企业版主打私有化部署，适合对数据安全、内网环境、权限控制、本地化交付和商业支持有要求的企业。

Flashcat 是否兼容 Prometheus、OpenTelemetry 和 Grafana？

Flashcat 遵循 OpenTelemetry 标准规范，兼容 Prometheus 生态，并支持导入 Grafana 仪表盘模板。对于已有 Prometheus、Grafana 或 OpenTelemetry 体系的团队，Flashcat 可以作为统一可观测平台入口逐步接入。

Flashcat 能否接入已有 Zabbix、云监控、日志和链路系统？

可以。Flashcat 支持多数据源集成，可接入 Prometheus、VictoriaMetrics、Elasticsearch、OpenSearch、ClickHouse、阿里云 SLS、腾讯云 CLS、Zabbix、InfluxDB、MySQL、Oracle、PostgreSQL、SQL Server、SkyWalking、Zipkin、Jaeger 等数据源，适合在保留已有系统的基础上逐步统一观测入口。

Flashcat 企业版适合什么规模的团队？

Flashcat 企业版更适合已经进入多系统、多数据源、多团队协作阶段的中大型技术团队。若只是少量机器的基础监控告警，Nightingale 开源版通常已经能满足；若需要统一指标、日志、链路、事件、RUM、On-call 和故障定位，建议评估 Flashcat 企业版。

Flashcat 的 AI 根因分析会访问哪些数据？

AI 根因分析需要基于被授权的观测上下文工作，包括指标、日志、链路、事件、告警、RUM、北极星、灭火图等数据。具体可访问范围应由企业按权限、数据安全和部署方式配置，不建议让 AI 越权访问生产数据。