兼顾合规、便捷、可扩展,全球化的监控平台怎么建

快猫星云 2024年8月19日

中国企业出海,考虑到数据保护规则的要求以及跨大洲的网络传输条件受限,服务往往部署在全球多个 Region 或者多云上,这给系统的运行维护带来了一定的挑战,特别的聚焦在可观测性体系的建设上:

  • 需要在每个region独立部署一套可观测性工具,很多维护性和配置性的工作,需要重复搞多次;
  • 某些场景下,需要跨区域进行数据分析、制作报表的时候,力不从心;

有的企业干脆选择把所有区域的可观测性数据,实时的汇聚到中心机房,集中维护和处理,也存在不小的隐患:

  • 需要确保汇聚的数据中,不包含受保护的信息,这项工作难度很高,容易出纰漏;
  • 数据汇聚,会耗费较大的带宽资源,有一定的成本支出;
  • 跨国的专线或者公网,时延较大,上百毫秒,这对于监控系统要求的时效性有差距;

最麻烦的是,一旦数据传输链路中断,各个区域就处于“不可观测状态”,属实“无人驾驶”了。

有没有方案,可以兼顾数据的合规性与管理的便捷性?给大家分享一个Flashcat的边缘部署模式。

Flashcat 是基于开源夜莺为基础构建的一体化的可观测性平台,是国内一线互联⽹公司可观测性实践的产品化落地,预置了行业领先的故障发现定位能力。云上、云下,只需一个 Flashcat 平台,就可以支持指标、日志、链路追踪数据的统一采集、告警、可视化、分析。

在Flashcat的边缘部署模式下,在每个边缘region,需要部署flashcat-edge组件,该组件负责从flashcat-centre同步本区域内所需要的配置数据(包括数据采集策略、数据加工策略、监控告警策略)。拿到配置数据之后,flashcat-edge组件:

  • 可以将采集、加工后的数据,按需实时回传给中心端,由中心端存储、分析、监控告警;
  • 也可以将采集、加工后的数据,完全闭环存储在本区域,在本地监控告警;

用户不需要直接面对flashcat-edge,只需访问flashcat-centre即可完成对所有edge区域的配置管理、集中可视化、集中监控、统一告警Oncall等工作。

当中心端和边缘端网络发生中断的时候,边缘端仍可以独立的、闭环的工作,数据采集不会中断,监控告警也不受影响。

Flashcat边缘部署模式

采用Flashcat边缘部署模式,可以高效的构建全球化的可观测性体系。

开源版
Flashcat
Flashduty