可观测性

可观测性,类似软件可用性,是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态,我们就说软件具备很好的可观测性。

软件暴露的指标、状态页面、打印的日志、事件、吐出的链路追踪数据,Profiling,都是提升软件可观测性的手段;从软件运行环境中收集到的信息,比如从 OS 层面收集到的软件占用的 CPU、内存、句柄、IO 等,也是观测软件的有效手段,提升了软件的可观测性。

可观测性,亦可看做软件在线 debug 的能力,助力排查线上问题。当然,也可以用可观测性数据衡量成本、建立知识沉淀机制等等,可观测性数据在很多场景都有价值。

无需推翻既有的建设,这个可观测性产品思路清奇

市面上已经有很多开源、商业的可观测性类产品,比如 Zabbix、Prometheus、Nightingale、SigNoz、SkyWalking、ELK 等等,而且各类云厂商也会提供自己的可观测性套件,有些规划混乱的云厂商甚至会提供功能重叠的多套产品,这加剧了企业数据孤岛的现状。怎么解?
无需推翻既有的建设,这个可观测性产品思路清奇

面向故障处理的可观测性体系建设

可观测性不能只关注 metrics、logging、tracing 这些 raw data,还要能够从数据中提取特征,进而推导出观点,最终辅助洞察定位故障。能够辅助定位故障才是可观测性的核心目标,构建数据只是建设底座,离目标还差的很远,千万不要觉得有了数据,就完活了。
面向故障处理的可观测性体系建设

从监控系统到可观测平台的演进之路

可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。也就是说,在软件开发和运维领域中,可观测性是指对于一个复杂的系统,能够通过监控、日志、指标、追踪等手段,快速地发现、诊断、解决问题的能力。
从监控系统到可观测平台的演进之路

基于方法论实现的Flashcat监控有哪些设计上的理念和方法?

Flashcat的设计初衷是实现一个从数据到平台到场景真正一体化的统一监控,成为服务稳定性保障,特别是故障处理的真帮手。
基于方法论实现的Flashcat监控有哪些设计上的理念和方法?

可观测性与传统监控的区别和联系

什么是可观测性?相比传统监控,可观测性是“新瓶装旧酒”吗?他们有哪些区别和联系,从传统监控到可观测性,Gap 到底有多大?
可观测性与传统监控的区别和联系

监控都没做好,你还要可观测性...

很多公司听说可观测性好,就要上马可观测性项目,自研/采购,各种投入,结果发现效果很差,业务不认可,最终一地鸡毛
监控都没做好,你还要可观测性...

灭火图 - 故障发现和定位的入口

灭火图是发现服务健康与否的入口,也是整个故障定位信息系统的核心,从灭火图开始,可以下钻到具体的接口/基础设施/链路分析数据/问题特征/相关事件等关键维度,引导技术团队高效、精准的定位故障。
灭火图 - 故障发现和定位的入口

什么是可观测性?可观测性成功指南

可观察性是一种方法,可以帮助您预测和预防未来的问题。它有助于根据外部输出的知识确定系统的状态。本文将详细介绍可观测性的定义、重要性、好处、挑战、支柱及其如何运作。
什么是可观测性?可观测性成功指南

科普:可观测性与传统监控的区别和联系

随着技术架构的不断演进以及云原生、微服务理念的广泛推广,可观测性(Observability)概念逐渐崭露头角,成为提升系统稳定性和运维效率的关键技术。本文将探讨可观测性与传统监控之间的区别与联系,介绍快猫星云在可观测性领域所提供的先进服务。
科普:可观测性与传统监控的区别和联系

初学者指南:可观测性是什么?

可观测性,顾名思义,指的是系统状态能够被观察与度量的特性。在信息技术领域,可观测性被精确定义为根据系统生成的输出数据(涵盖日志、指标及跟踪信息)来测量和理解系统当前状态的能力。
初学者指南:可观测性是什么?

科普:阐释什么是可观测性

随着云原生技术的广泛应用,可观测性作为云原生运维的核心工具,正成为事件管理实践中的关键支撑。本文探讨可观测性的本质、来源、发展、重要性及其实施路径。
科普:阐释什么是可观测性

科普:一文理解可观测性

可观测性一词之所以在近两年迅速走红,很大程度上得益于 CNCF 在云原生定义中明确提到 Observerbility,并将其视为云原生时代的必备能力。
科普:一文理解可观测性

科普:可观测性是什么? 有哪些入门知识需要了解?

在复杂的服务器运维环境中,可观测性(Observability)是确保系统稳定运行、及时发现并解决问题的关键。这一概念核心通过系统输出的数据—如日志、指标及链路追踪—来精准衡量并理解当前系统的运行状态。
科普:可观测性是什么? 有哪些入门知识需要了解?

开源时序库的兴起以及未来发展的观点

本文是 VictoriaMetrics 公司创始人所著,探讨了开源时序库的兴起历史、值得关注的项目以及未来的发展方向。时序库是监控、可观测性领域的基础设施,如果您是基础设施方向的工程师,尤其值得关注。
开源时序库的兴起以及未来发展的观点

使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标

如果您已经实施了跟踪但缺乏强大的指标功能怎么办? SpanConnector 是一个通过将跟踪数据转换为可操作指标来弥补这一差距的工具。这篇文章详细介绍了 SpanConnector 的工作原理,提供了有关其配置和实现的指南。
使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
FlashDuty
Flashduty