产品概览

使用 Flashcat,在一个平台上完成指标、日志、链路追踪数据的统一采集、可视化、告警、分析和OnCall,
免去搭建和维护多套 Prometheus/Zabbix/Grafana/ELK/Jaeger 的工作量,屏蔽多云监控的复杂度。

Metrics
Logs
Traces
Events
开箱即用的数据源
Metrics Datasources
Logging Datasources
Tracing Datasources
OLAP/OLTP Datasources
自研可视化引擎,对标Grafana,内置大屏
指标告警
日志告警
智能告警
告警聚合
告警降噪
告警认领
告警升级
排班
协同
北极星
灭火图
事件墙
日志分析

为什么选择 Flashcat

多云

Flashcat 帮助技术团队屏蔽了使用多个分散的监控工具带来的不便,轻松监控多云多 Region,从业务、到应用、基础设施,开箱即用。

智能

Flashcat 内置了故障处理的最佳实践,当业务受损时,Flashcat 总能第一时间发现,并和 IT 系统深入联动,辅助技术团队快速展开调查。

一体化

Flashcat 支持物理机、网络设备、容器、K8s,微服务、主流云产品,无论采用什么样的 IT 架构,只需要一套 Flashcat 平台。
9500+
Github Star
1300+
Github Fork
120+
开发者
10000+
终端用户

用户案例

Zenlayer如何将万台设备监控从Zabbix迁移到Flashcat
在 Zenlayer,监控系统不仅仅是作为一个内部工具服务于运维和研发团队,我们的售后团队高度依赖监控系统为客户提供高水平的技术支持服务,监控系统是 Zenlayer 最重要的基础服务和产品之一,是我们交付用户价值的关键所在。
知乎的 SLO 运营实践
知乎的可观测性数据体量巨大,本文介绍了知乎的可观测性体系实践和经验,以及如何利用 SLO 持续的度量、追踪和改进系统可用性。
海大集团的可观测平台建设实践
海大集团是以科技为主导的中国农业龙头企业,1998年成立于广东广州,目前业务涵盖饲料、种苗、动保疫苗、智慧养殖、食品加工等现代农牧全产业链。海大集团利用Flashcat构建了一体化的可观测性平台,覆盖了不同业务板块,支持异构的 IT 环境(容器/K8s、物理机、虚拟机、公有云并存),并打通了从业务视角到 IT 视角的监控,提升了故障发现和定位的能力。
六分科技利用Flashcat,打造统一观测平台,构建全局稳定性视图
通过 Flashcat 平台,六分科技整合了 Prometheus、ClickHouse、日志、云监控等多个数据源,其中包括近 10 个 Prometheus 集群,十余个日志主题,实现统一的报警管理、数据可视化,降低了监控工具的维护成本,只有一位工程师负责监控产品的对接,就满足了内部对于监控、报警功能的使用,节省了人力,节省出的人力就可以投入到其他更有挑战的方向上。
高济健康基于 Flashcat 有效加强 IT 服务故障管理能力
通过和快猫团队合作,建设并落地 Flashcat 平台,目前公司 A 级产品线北极星指标监控实现了全覆盖,P3 级及以上故障北极星监控发现率为100%,MTTI 控制在 5 分钟以内。真正做到了先于用户发现问题,让故障处理变被动为主动。
知名火锅连锁企业,IT 团队如何在数千家门店中先于用户发现问题
作为中国领先的餐饮企业,近 2000 家门店遍布全球,由于门店餐饮行业的特殊性,需要靠前部署服务,所以在每家餐厅中,会部署相应的服务器,及相应IT设备,本地会运行 POS、会员、下单等业务。通过落地 Flashcat 平台,集中化的监控了所有门店,并采用数据驱动的理念,对所有的门店 IT 健康状态进行科学的量化,真正做到先于门店发现问题,及时高效治理有IT 隐患的门店。
20套监控平台统一成1套Flashcat,国泰君安监控选型提效之路
作为国内头部期货公司,随着行业的发展,国泰君安期货的业务不断增长,近年来各开发厂商对新技术的引用,其运维工作面临着系统种类多、主机数量多、技术栈多、机房多(跨地域)的难题,而原有监控A无法满足现有的监控需求,他们想找一个既能统一管理多平台、扩展性较好、满足现有场景且包含主流的技术,又能支持异地纳管统一上报的更高效的运维监控平台。
途游游戏使用Flashduty减少了80%的告警
通过将夜莺和云平台的告警统一对接到 Flashduty 后,有效的落地了监控 Oncall 值班机制,同时在告警收敛上,更为便捷有效,解决了告警无法有效触达以及无法值班处理的难题。尤其要说的是告警收敛效果很好,在默认收敛配置下降噪比平均在 80% 以上。
Flashduty:益丰大药房的 OnCall 之选
Flashduty 作为功能完备的一站式告警响应平台,可以接入云上、云下不同监控系统发出的告警,通过告警降噪、分派、认领、升级、排班协同,大幅提升了益丰大药房技术团队的OnCall效率。
头部期货行业的 Oncall 实践
期货行业的运维保障,具有一定的特殊性和独特的挑战,如何把相应的管理机制、技术要求、运营机制,落地到统一的监控事件响应平台,对于提升告警响应速度、降低运行维护压力,是我们提高系统的可靠性的关键抓手。

产品特点

统一采集

采用插件化思路,内置集成上百种采集插件,服务器、网络设备、中间件、数据库、应用、业务,云上云下,均可监控,开箱即用。

集成融合

可集成企业内部已有的、云上云下的可观测配套系统,无需推倒重来,充分利旧,快速见效,串联打通数据,发挥协同分析的价值。

统一告警

支持指标告警、日志告警、智能告警,支持几十种数据源对接,收集各类监控系统的告警事件,进行统一的告警收敛、降噪、排班、认领、升级、协同,大幅提升告警处理效率。

统一观测

将 Metrics、Logs、Traces、Events、Profiling 等多种可观测性数据融会贯通,并预置行业最佳实践,既提供全局业务视角、技术视角的驾驶舱,也提供层层下钻的故障定位能力,有效缩短故障发现和定位时间。

我们的用户

香港医管局
海底捞
海大集团
益丰大药房
12306
高济健康
金拱门
莉莉丝游戏
悠星网络
鹰角网络
盛大
途游游戏
知乎
哈啰
阳光出行
嘀嗒出行
叮当快药
UU跑腿
中国电信
国泰君安期货
华盛证券
东莞证券
灵均投资
Zenlayer
吉野家
地平线
吉利汽车
路特斯科技
Porsche
六分科技
真点科技
畅捷通
鹿客科技
作业帮
八维通
海康威视
顺丰航空
马泷齿科
小马智行
紫光云
旭辉集团
荣庆物流

热门博客

快猫星云技术团队结合过去十年从事开源监控工具的开发经验,以及长期在一线互联网公司负责稳定性保障的实践出发,撰写了可观测性系列白皮书,分别是「可观测体系成熟度白皮书」、「稳定性体系建设白皮书」、「Flashcat产品白皮书——面向稳定性保障的可观测性平台」、「OnCall中心建设白皮书」,抛砖引玉,期待和各位同行深入交流探讨。
什么是可观测性?相比传统监控,可观测性是“新瓶装旧酒”吗?他们有哪些区别和联系,从传统监控到可观测性,Gap 到底有多大?
稳定性保障有没有「套路」?可观测性在稳定性保障中扮演什么样的角色和定位?
在传统监控领域,OnCall是最容易被技术团队忽视的一个概念,饱受困扰。一个好的 OnCall 工具,能够大幅提升团队的效率和幸福感。

最新博客

监控系统的职责并不仅限于故障症状检测。一旦您的监控系统告警了,那下一个工作就是通过查看各类监控数据,诊断问题原因。通常,这是监控中最不结构化(无法有章可循)的方面,主要由直觉驱动、由“猜测-检查”驱动。这篇文章描述了一种更直接的方法,可以帮助您更有效地找到并纠正根本原因。
监控数据有多种形式 - 一些系统不断地输出数据,而另一些系统仅在罕见事件发生时才产生数据。有些数据主要用于识别发现问题、有些数据主要用于调查问题。更宽泛地说,监控数据是观察系统内部运行情况的必要条件。
监控系统有很多,我们要把监控系统的告警事件聚合到一站式告警处理 OnCall 平台,做统一的事件处理,包括告警收敛、告警分发、告警处理、告警分析等。
自动警报对于监控至关重要。它们使您能够发现基础设施中任何地方的问题,以便您可以快速确定其原因并最大限度地减少服务降级和中断。指标和其他一些度量手段有助于可观察性,警报呢,会引起人们的注意。
开源版
Flashcat
Flashduty