产品概览
使用 Flashcat,在一个平台上完成指标、日志、链路追踪数据的统一采集、可视化、告警、分析和OnCall,
免去搭建和维护多套 Prometheus/Zabbix/Grafana/ELK/Jaeger 的工作量,屏蔽多云监控的复杂度。
Metrics
Logs
Traces
Events
开箱即用的数据源
Metrics Datasources
Logging Datasources
Tracing Datasources
OLAP/OLTP Datasources
自研可视化引擎,对标Grafana,内置大屏
指标告警
日志告警
智能告警
告警聚合
告警降噪
告警认领
告警升级
排班
协同
北极星
灭火图
事件墙
日志分析
为什么选择 Flashcat
易用
Flashcat 帮助技术人员屏蔽了使用多个分散的监控工具带来的不便,轻松监控多云多Region,从业务、到应用、基础设施,开箱即用。
有效
Flashcat 内置了故障处理的最佳实践,当业务受损时,Flashcat 总能第一时间发现,并和 IT 系统深入联动,辅助技术团队快速展开调查。
高效
Flashcat 支持物理机、网络设备、容器、K8s,微服务、主流云产品,无论采用什么样的 IT 架构,只需要一套 Flashcat 平台。
8500+
Github Star
1200+
Github Fork
100+
开发者
10000+
终端用户
用户案例
六分科技利用Flashcat,打造统一观测平台,构建全局稳定性视图
通过 Flashcat 平台,六分科技整合了 Prometheus、ClickHouse、日志、云监控等多个数据源,其中包括近 10 个 Prometheus 集群,十余个日志主题,实现统一的报警管理、数据可视化,降低了监控工具的维护成本,只有一位工程师负责监控产品的对接,就满足了内部对于监控、报警功能的使用,节省了人力,节省出的人力就可以投入到其他更有挑战的方向上。
高济健康基于 Flashcat 有效加强 IT 服务故障管理能力
通过和快猫团队合作,建设并落地 Flashcat 平台,目前公司 A 级产品线北极星指标监控实现了全覆盖,P3 级及以上故障北极星监控发现率为100%,MTTI 控制在 5 分钟以内。真正做到了先于用户发现问题,让故障处理变被动为主动。
知名火锅连锁企业,IT 团队如何在数千家门店中先于用户发现问题
作为中国领先的餐饮企业,近 2000 家门店遍布全球,由于门店餐饮行业的特殊性,需要靠前部署服务,所以在每家餐厅中,会部署相应的服务器,及相应IT设备,本地会运行 POS、会员、下单等业务。通过落地 Flashcat 平台,集中化的监控了所有门店,并采用数据驱动的理念,对所有的门店 IT 健康状态进行科学的量化,真正做到先于门店发现问题,及时高效治理有IT 隐患的门店。
20套监控平台统一成1套Flashcat,国泰君安监控选型提效之路
作为国内头部期货公司,随着行业的发展,国泰君安期货的业务不断增长,近年来各开发厂商对新技术的引用,其运维工作面临着系统种类多、主机数量多、技术栈多、机房多(跨地域)的难题,而原有监控A无法满足现有的监控需求,他们想找一个既能统一管理多平台、扩展性较好、满足现有场景且包含主流的技术,又能支持异地纳管统一上报的更高效的运维监控平台。
Flashduty:益丰大药房的 OnCall 之选
Flashduty 作为功能完备的一站式告警响应平台,可以接入云上、云下不同监控系统发出的告警,通过告警降噪、分派、认领、升级、排班协同,大幅提升了益丰大药房技术团队的OnCall效率。
途游游戏使用Flashduty减少了80%的告警
通过将夜莺和云平台的告警统一对接到 Flashduty 后,有效的落地了监控 Oncall 值班机制,同时在告警收敛上,更为便捷有效,解决了告警无法有效触达以及无法值班处理的难题。尤其要说的是告警收敛效果很好,在默认收敛配置下降噪比平均在 80% 以上。
映客直播使用夜莺监控,支撑5亿时间线节省8成费用
对于像映客直播这样的在线直播行业,运维监控对于整体直播稳定性的重要性不言而喻。映客直播运维团队在选择监控工具时,发现Prometheus对研发人员不太友好,配置也相对复杂,夜莺监控V5版无缝对接Prometheus、简单易上手的优势吸引了他们的目光。目前Nightingale(夜莺监控)已在其开发系统中运行了2个月,帮助其节约了85%的机器成本,大幅降低了中间件采集成本。
Zenlayer如何将万台设备监控从Zabbix迁移到Flashcat
在 Zenlayer,监控系统不仅仅是作为一个内部工具服务于运维和研发团队,我们的售后团队高度依赖监控系统为客户提供高水平的技术支持服务,监控系统是 Zenlayer 最重要的基础服务和产品之一,是我们交付用户价值的关键所在。
产品特点
一体化
集数据采集、可视化、监控告警、OnCall、数据分析为一体,融会贯通 Metrics、Logging、Tracing、Events,是一个从数据、到平台、再到场景真正一体化的统一观测平台。
场景化
是顶级互联网公司稳定性保障最佳实践和方法论的产品化落地,帮助企业技术人员,总能先于用户发现故障,并高效协同,快速定位关键问题,降低服务中断时间。
云原生
支持多云/混合云,支持多 Region 统一监控和管理,支持 Kubernetes,适配 OpenTelemetry 协议,兼容 Grafana 和 Prometheus,与云原生生态紧密集成。
开源开放
夜莺是 CCF 接受捐赠的首个开源项目,是国内领先的开源云原生可观测性解决方案,快猫星云技术团队是夜莺开源项目的核心开发者,为夜莺社区提供长期支撑。
我们的用户
海底捞
海大集团
益丰大药房
高济健康
莉莉丝游戏
悠星网络
哈啰
阳光出行
叮当快药
UU跑腿
香港医管局
国泰君安期货
小马智行
Zenlayer
吉野家
途游游戏
路特斯科技
地平线
六分科技
鹿客科技
畅捷通
八维通
海康威视
作业帮
中国电信
顺丰航空
当当
马泷齿科
方正证券
华东师范大学
热门博客
快猫星云技术团队结合过去十年从事开源监控工具的开发经验,以及长期在一线互联网公司负责稳定性保障的实践出发,撰写了可观测性系列白皮书,分别是「可观测体系成熟度白皮书」、「稳定性体系建设白皮书」、「Flashcat产品白皮书——面向稳定性保障的可观测性平台」、「OnCall中心建设白皮书」,抛砖引玉,期待和各位同行深入交流探讨。
可观测性与传统监控的区别和联系
什么是可观测性?相比传统监控,可观测性是“新瓶装旧酒”吗?他们有哪些区别和联系,从传统监控到可观测性,Gap 到底有多大?
面向故障处理的可观测性体系建设
稳定性保障有没有「套路」?可观测性在稳定性保障中扮演什么样的角色和定位?
Grafana 和 Prometheus 的国产化平替来了:手把手带你了解夜莺
夜莺集合了 Prometheus 和 Grafana 的优点,你可以在 UI 上管理和配置告警策略,也可以对多 Region 的指标、日志、链路追踪数据进行统一的可视化和分析。
告警聚合降噪、升级、认领、排班、协同,解决 OnCall 困扰
在传统监控领域,OnCall是最容易被技术团队忽视的一个概念,饱受困扰。一个好的 OnCall 工具,能够大幅提升团队的效率和幸福感。