Flashcat和其他可观测性产品有何不同?
Flashcat是我们创业后做的第一个产品,是一个一体化的IT服务可观测性产品。
目前国内外市场上有众多可观测性产品,Flashcat和其他可观测性产品有什么不同?
这也是很多用户接触我们的时候会问到的问题,今天这篇文章就全面的解答这个问题。
以下将从可观测性产品的工具、场景、生态,以及智能化几个角度来对比Flashcat和其他观测产品。
首先,简单解释一下可观测性。通俗的讲可观测性是传统IT监控的延伸,在可观测性的概念里,指标、日志、链路、事件等原本各自为阵的数据被统一到了一个可观测性体系里,以便于加速发现和分析IT系统的异常,增强IT系统稳定性的保障能力。
企业选择一个观测产品可能会在工具需求和场景需求上有所侧重。
比如处于早期阶段的企业,首先要把观测系统建立起来,这时候通常会侧重基本的工具需求,以解决可观测性产品“有没有”的问题。
企业的IT服务规模扩大后,就会发现告警繁多、故障的发现和分析困难,这时候通常就会寻求优化告警场景和稳定性保障场景的方案,以解决如何“用的好”问题。
工具层面
Flashcat 在数据和平台层面主要满足用户的工具需求,建设一个一体化的观测系统。
这个层面Flashcat以开源的采集器Categraf和开源夜莺为基础,并增强了很多便于管理和使用的产品功能,如中心化的采集点管理、增强的数据采集插件,以及补齐了日志、链路维度的功能等。
此外,Flashcat 在工具层面有别于其他观测产品的一个重要特点是,Flashcat 不但提供数据采集方案,还提供轻量的数据集成方案。
Flashcat 能够集成企业内部已有的观测系统,使已有数据发挥最大价值,避免完全推倒已有观测系统重来的成本和风险。Flashcat 的数据集成不涉及数据的同步和拷贝,是在产品和API层面的对齐和打通。这在当前国内和国外的同类产品中有可能是独一档的实现。
为何Flashcat选择了数据集成这条路,而其他厂商没有这么做?简而言之,核心是这条路虽然方便用户,但却会给产品的厂商带来相当的开发和适配成本。更为详细的介绍可见另一篇文章:统一观测系统建设中存量系统如何处理。
常见的开源和公有云观测系统Flashcat都已经实现了集成方案,如Prometheus、Elasticsearch、Doris、Clickhouse、阿里云监控、阿里云SLS、腾讯云CLS、Skywalking、Jaeger等等。
场景层面
目前市面上大多数观测产品都侧重在工具层面,场景层面则是 Flashcat 明显区别于其他观测产品的所在。
Flashcat 把大型服务保障的经验产品化,面向稳定性保障的场景,拆解稳定性保障的过程,针对性的设计实现了北极星、灭火图、事件墙、特征分析等子系统,帮助用户解决稳定性保障场景中各个环节的棘手问题。如故障的定义和快速发现、串联各维度数据快速定位问题等。
针对各个行业场景,Flashcat 也积累了越来越多的稳定性保障最佳实践,如toC、toB方向,连锁门店行业、出行行业、电商行业、出海业务等。通过将IT系统拆解为“观测对象”的思路,Flashcat的北极星、灭火图系统能够灵活地为各行各业和场景定制观测方案,满足不同视角的观测需求。实践中Flashcat的场景化方案切实增强了这些行业和场景的稳定性保障能力和观测体验。
事实上,场景化的观测能力也是将可观测性系统建设的能力和成果让更多部门和上级看得到、理解得了的关键。
生态层面
Flashcat 基于开源夜莺实现,开源夜莺的数据完全符合OpenTelementry协议规范,兼容Prometheus数据接口,链路数据的采集则完全使用OpenTelementry社区的SDK。OpenTelementry是可观测领域最大的生态,遵循生态的标准将从生态的发展中获益。
市面上很多商业观测产品起步早于OpenTelementry标准的出现,大多是基于Zabbix进行升级改造,而Zabbix并不在OpenTelementry的生态中,不能从这个大生态的长期发展中获益。而部分厂商自研数据标准,其实也存在同样的问题。
关于智能化
在人工智能发展日新月异的今天,如何通过人工智能来增强可观测系统的智能化是整个行业在探索的方向。
我们认为,人工智能要完全融入到可观测系统,需要先解决几个重要问题:
- 如何让人工智能理解所观测的系统或服务
- 人工智能需要无障碍地获取所观测系统的观测数据
- 人和AI能够基于可观测性数据和分析结论对话交互,共同走向最终答案
Flashcat 从工具到场景的建设过程,其实正是可观测性数据实现AI-Ready的过程。这个过程中,工具建设(包括数据和平台建设)是基础,而场景建设则是集大成者,是AI最终能够理解系统的关键,因为场景数据正是一个IT系统的“知识图谱”。
Flashcat 不断集成已有观测系统的能力,也为人工智能无障碍获取企业观测数据做好了准备。
Flashcat 已发布了智能分析和交互功能FlashAI,并且在持续迭代中 =》FlashAI 建设思路
Flashcat 是从工具到场景的一体化可观测性产品,既能够满足可观测性在工具层面的需求,也提供场景化的解决方案,同时符合 Opentelementry 生态规范。Flashcat 在以让人更好的理解和使用观测系统的同时,也为观测系统实现AI智能化做好了准备。
以上就是 Flashcat 不同于其他可观测性产品的地方,总结如下:
- 工具层面:各维度观测数据统一的一体化观测系统,以及快速兼容已有观测系统的数据集成能力;
- 场景层面:是区别于其他观测产品的重点所在,也是将可观测性系统建设的能力和成果让更多部门和上级看得到、理解得了的关键;
- 生态层面:基于开源夜莺并遵循OpenTelementry协议,能够从大生态的发展中获益;
- 智能化:相比于大多数厂商在个别点上实现智能化不同,Flashcat 已经可以回答可观测性+AI的关键问题,找到了可观测性的AI-Ready之路。