出海企业如何建设可观测性体系?
华明@快猫星云
2025-02-11 15:00:00
越来越多的企业选择出海拓展业务。企业出海后通常需要在海外部署在线服务,而出海服务的稳定性保障会面临很多新的挑战。如何建设一套适合出海业务的可观测性体系,既能够保障服务的稳定运行,又能够权衡好观测系统的用户体验和落地成本?
出海业务的可观测性体系建设会面临什么样的新挑战呢?
- 国内国外两地业务:很多企业会同时有国内和国外两地业务,条件允许的情况下(安全&合规)能否建设一套观测体系?既方便观测也方便使用。
- 安全合规和带宽成本:可观测体系的建设涉及数据传输,如何满足各地安全合规的要求?同时带宽成本是基础设施支出的一大部分,而观测数据的传输可能会占用大部分的带宽资源,如何控制带宽成本?
- 公有云多云:企业在海外通常会采购多家公有云的资源,如AWS、Azure等,每朵云上都可能配套多个观测系统,只要上了两朵或两朵以上的云,观测系统的使用和管理都可能面临混乱,能否集成到一个体系中使用和管理?
- 24小时轮班保障:海外业务的正常开展时间可能与国内的上下班时间不一致,如何根据业务的需要,设定和管理全球业务的值班排班,做到24小时有效保障?
除此之外,可能面临的问题还包括诸如:同一个观测系统的多语言支持、告警消息的多渠道支持(slack、lark …)、全球业务的统一观测需求、问题追查的加速等等。
快猫星云的可观测性产品Flashcat和Flashduty已经服务了多家出海企业,积累了丰富的可观测性体系建设经验,欢迎出海企业的朋友交流探讨。