AI 加速可观测
使用 Flashcat,在一个平台上完成指标、日志、链路追踪数据的统一采集、集成、可视化、监控告警、分析。
深度使用 AI 加速故障分析过程,大幅缩短故障恢复时间。
Metrics
Logs
Traces
Events
开箱即用的数据源
Metrics Datasources
Logging Datasources
Tracing Datasources
OLAP/OLTP Datasources
自研可视化引擎,对标Grafana,内置大屏
指标监控
日志监控
智能监控
告警聚合
告警降噪
告警认领
告警升级
排班
协同
为什么选择 Flashcat
多云
Flashcat 帮助技术团队屏蔽了使用太多分散的监控工具带来的不便,轻松监控多云、多区域,一个平台集中观测。
智能
Flashcat 内置了故障处理的最佳实践,当业务受损时,Flashcat 总能先于用户发现,并深度使用 AI 加速故障的分析过程。
一体化
从业务到应用,到基础设施。从物理机、网络设备,到容器、Kubernetes。从指标到日志,到链路跟踪。只需要一套 Flashcat,开箱即用。
11000+
Github Star
1500+
Github Fork
140+
开发者
10000+
终端用户
用户案例
在 Zenlayer,监控系统不仅仅是作为一个内部工具服务于运维和研发团队,我们的售后团队高度依赖监控系统为客户提供高水平的技术支持服务,监控系统是 Zenlayer 最重要的基础服务和产品之一,是我们交付用户价值的关键所在。
海大集团是以科技为主导的中国农业龙头企业,1998年成立于广东广州,目前业务涵盖饲料、种苗、动保疫苗、智慧养殖、食品加工等现代农牧全产业链。海大集团利用Flashcat构建了一体化的可观测性平台,覆盖了不同业务板块,支持异构的 IT 环境(容器/K8s、物理机、虚拟机、公有云并存),并打通了从业务视角到 IT 视角的监控,提升了故障发现和定位的能力。
作为中国领先的餐饮企业,上千家门店遍布全球,由于门店餐饮行业的特殊性,需要靠前部署服务,所以在每家餐厅中,会部署相应的服务器,及相应IT设备,本地会运行 POS、会员、下单等业务。通过落地 Flashcat 平台,集中化的监控了所有门店,并采用数据驱动的理念,对所有的门店 IT 健康状态进行科学的量化,真正做到先于门店发现问题,及时高效治理有 IT 隐患的门店。
作为国内头部期货公司,随着行业的发展,国泰君安期货的业务不断增长,近年来各开发厂商对新技术的引用,其运维工作面临着系统种类多、主机数量多、技术栈多、机房多(跨地域)的难题,而原有监控A无法满足现有的监控需求,他们想找一个既能统一管理多平台、扩展性较好、满足现有场景且包含主流的技术,又能支持异地纳管统一上报的更高效的运维监控平台。
某出行科技企业从单个公有云往多云转型,依托于国内领先的公有云提供商,采用多云架构,在可用性、弹性、成本、供应商依赖方面,拥有了显著的优势。相应的,多云架构也给技术团队带来了一定的复杂度和技术挑战,最显著的就是如何高效的构建跨云的可观测性体系,提升故障发现、问题排查、性能分析等方面的能力。
产品特点
工具
从采集到存储,到产品功能一体化。并可快速集成企业已有观测系统。观测系统核心的功能如告警配置、仪表盘建设、数据查询等都可以在平台一站式完成。
场景
基于北极星、灭火图、事件墙等系统实现业务和场景层的观测视角,联动起各维度和各数据源的观测数据,加速异常分析,提升稳定性保障能力。
生态
基于开源夜莺实现,遵循 OpenTelementry 协议,能够从开源和生态的发展中长期获益。
智能化
回答了智能化的三大问题:AI如何理解你的系统?AI如何无障碍地读取你的数据?如何与AI互动,共同走向最终答案?找到并实践了可观测性的 AI-Ready 之路。
开源版与企业版对比
从 Open-Falcon 到 Nightingale、Categraf,快猫星云技术团队在监控领域已经深耕十年之久,支持和服务了数千家企业,是开源监控的行业引领者。我们看到很多公司从开源监控受益,也看到很多公司因为缺乏行业最佳实践,在可观测性体系建设中走了不少弯路,包括如何选型工具和构建平台,如何对可观测性数据进行治理,如何利用好可观测性数据,打通各个维度数据之间的串联关系,快速定位和止损故障。
快猫星云创始团队,均来自于阿里、百度、滴滴,快猫星云以开源夜莺为内核打造的统一可观测平台,是国内顶级互联网公司可观测性实践和服务稳定性保障方法论的产品化落地,我们致力于帮助企业快速构建统一的可观测性体系以及构建数据驱动的稳定性治理框架。下面是企业版与开源版的对比说明,您可以联系我们进一步了解企业版更多信息。
快猫星云创始团队,均来自于阿里、百度、滴滴,快猫星云以开源夜莺为内核打造的统一可观测平台,是国内顶级互联网公司可观测性实践和服务稳定性保障方法论的产品化落地,我们致力于帮助企业快速构建统一的可观测性体系以及构建数据驱动的稳定性治理框架。下面是企业版与开源版的对比说明,您可以联系我们进一步了解企业版更多信息。
北极星
业务指标实时看板:支持可视化大屏、指标异常波动智能检测
灭火图
IT系统可用性实时看板:支持实时度量应用/基础设施健康状态,智能设定可用性目标
事件墙
发布变更和异常事件看板:支持收集和展示当前发生的重要事件,如变更、报警、运营事件
日志分析
支持日志收集、提取、查看、分析等,自动推荐和快速定位故障原因和特征
On-Call 值班中心
支持告警聚合、降噪、认领、升级、排班、协同
数据源管理
Prometheus
ElasticSearch
Jaeger
OpenSearch
ClickHouse
阿里云 SLS
腾讯云 CLS
Zabbix
InfluxDB
MySQL/Oracle/PostgreSQL/SQLServer
SkyWalking
Zipkin
数据采集器
指标(Metrics)采集
日志(Logging)采集
Tracing 数据收集
物理机/虚拟机数据采集
容器/K8s数据采集
交换机/网络设备数据采集
常用中间件/数据库数据采集
Windows 数据采集
数据采集规则集中管理和下发
仪表盘
内置仪表盘模版
导入Grafana模版
指标仪表盘
日志仪表盘
多数据源支持
告警管理
指标(Metrics)阈值告警
主机(Host)失联告警/时间偏移告警
告警规则管理:屏蔽、订阅、记录规则
活跃告警/历史告警管理
内置众多告警策略模版
日志(Logging)告警
智能告警
内置电话/短信通道(阿里云/腾讯云)
告警聚合降噪
告警升级
告警自愈
告警自愈脚本管理,自愈脚本和告警规则关联管理
分布式链路追踪
Jaeger 数据源
SkyWalking 数据源
Zipkin 数据源
Elastic APM 数据源
阿里云 SLS trace 数据源
Pinpoint 数据源
基础设施
主机分组、标签管理
主机基础元信息(metadata)展示和管理
内置多种基础设施的数据采集规则模版
主机扩展元信息(metadata)展示和管理
Categraf 采集规则集中管理和下发
人员组织
用户管理
团队管理
组织管理
角色管理
权限管理
系统配置
数据源自定义配置
通知媒介、通知渠道、通知模版自定义配置
单点登录自定义配置(OAuth、LDAP、OIDC、CAS等)
操作审计
支持关键操作和敏感操作的审计记录
技术支持
技术支持获取途径
技术支持响应级别
专家解决方案
咨询实施
方案
支持
开源版
GitHub Issue
一周
企业版
专项支持群、视频会议
7×12
7×12 专家技术支持