产品介绍
故障处理过程中止损是第一原则,应该避免陷入对问题根因细节的排查而延误服务核心功能和体验的恢复时间。
大部分的故障处理其实是连接故障特征和止损预案的一个过程。如,确定特征是单集群故障,则通过调度流量即可实现快速止损。确定异常都来源于某个通道的调用,则可快速收敛到对该通道问题的调查中。
但故障发生时,如何从大量的报警和异常中分析出故障特征,是故障定位的重要挑战。
日志分析系统基于业务的网关日志、模块日志,按最佳实践提供预置的分析维度,同时支持用户进行灵活的自定义。故障定位过程中,系统能够引导用户对维度特征进行观测,对特征进行分析,快速确定故障的关键特征和相应的止损预案。
大部分的故障处理其实是连接故障特征和止损预案的一个过程。如,确定特征是单集群故障,则通过调度流量即可实现快速止损。确定异常都来源于某个通道的调用,则可快速收敛到对该通道问题的调查中。
但故障发生时,如何从大量的报警和异常中分析出故障特征,是故障定位的重要挑战。
日志分析系统基于业务的网关日志、模块日志,按最佳实践提供预置的分析维度,同时支持用户进行灵活的自定义。故障定位过程中,系统能够引导用户对维度特征进行观测,对特征进行分析,快速确定故障的关键特征和相应的止损预案。
多点采集
日志可以通过安装开源采集器categraf采集,也可以从用户环境中已有的日志传输链路中获取,如kafka、redis、ES、阿里云sls等
配置灵活
支持日志的灵活抽取,支持对维度进行自定义,预置和沉淀最佳的观测维度和特征分析维度
分析高效
维度数据从采集到输出,延迟在60s内