可观测性

可观测性，类似软件可用性，是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态，我们就说软件具备很好的可观测性。可观测性，亦可看做软件在线 debug 的能力，助力排查线上问题。当然，也可以用可观测性数据衡量成本、建立知识沉淀机制等等，可观测性数据在很多场景都有价值。

搜索可观测性

相关话题 IT监控故障定位告警OnCall SRE 用户案例 Prometheus VictoriaMetrics Categraf

Topic Overview

可观测性这个话题主要看什么

可观测性，类似软件可用性，是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态，我们就说软件具备很好的可观测性。

软件暴露的指标、状态页面、打印的日志、事件、吐出的链路追踪数据，Profiling，都是提升软件可观测性的手段；从软件运行环境中收集到的信息，比如从 OS 层面收集到的软件占用的 CPU、内存、句柄、IO 等，也是观测软件的有效手段，提升了软件的可观测性。

可观测性，亦可看做软件在线 debug 的能力，助力排查线上问题。当然，也可以用可观测性数据衡量成本、建立知识沉淀机制等等，可观测性数据在很多场景都有价值。

107 已收录内容

7 人工精选

100 自动聚合

可观测性相关文章

围绕可观测性的实践、选型、案例和产品内容，按同一阅读路径持续整理。

107 篇

可观测性

可观测性这个话题主要看什么

可观测性相关文章

无需推翻既有的建设，这个可观测性产品思路清奇

面向故障处理的可观测性体系建设

从监控系统到可观测平台的演进之路

产品技术：基于方法论实现的Flashcat监控有哪些设计上的理念和方法？

可观测性与传统监控的区别和联系

监控都没做好，你还要可观测性...

最佳实践：灭火图 - 故障发现和定位的入口

从用户体验到根因：互联网核心旅程可观测性

B2B SaaS 团队如何用可观测性保护客户 SLA：把租户级可靠性信号转化为客户可用的事件响应

为什么监控越来越多，故障定位反而越来越慢？

门店 IT 健康度怎么建：从经验运维到量化治理

AI 根因分析为什么经常不准：缺的不是模型，而是上下文

OpenTelemetry 解决了数据标准，但没有自动解决排障路径

自研可观测平台还要不要继续维护

Flashcat vs Datadog：私有化、成本和本土化视角下怎么选

从 Prometheus、ES、SkyWalking 到 Flashcat：已有系统如何统一接入

日志里为什么一定要输出 TraceID

Google Cloud 的 AI RCA 路线：别急着猜根因，先把假设做扎实

FlashAI 如何从灭火图读取指标、日志和链路

可观测性的价值，正在从“看见数据”转向“加快决策”

可观测性

可观测性 这个话题主要看什么

可观测性 相关文章

无需推翻既有的建设，这个可观测性产品思路清奇

面向故障处理的可观测性体系建设

从监控系统到可观测平台的演进之路

产品技术：基于方法论实现的Flashcat监控有哪些设计上的理念和方法？

可观测性与传统监控的区别和联系

监控都没做好，你还要可观测性...

最佳实践：灭火图 - 故障发现和定位的入口

从用户体验到根因：互联网核心旅程可观测性

B2B SaaS 团队如何用可观测性保护客户 SLA：把租户级可靠性信号转化为客户可用的事件响应

为什么监控越来越多，故障定位反而越来越慢？

门店 IT 健康度怎么建：从经验运维到量化治理

AI 根因分析为什么经常不准：缺的不是模型，而是上下文

OpenTelemetry 解决了数据标准，但没有自动解决排障路径

自研可观测平台还要不要继续维护

Flashcat vs Datadog：私有化、成本和本土化视角下怎么选

从 Prometheus、ES、SkyWalking 到 Flashcat：已有系统如何统一接入

日志里为什么一定要输出 TraceID

Google Cloud 的 AI RCA 路线：别急着猜根因，先把假设做扎实

FlashAI 如何从灭火图读取指标、日志和链路

可观测性的价值，正在从“看见数据”转向“加快决策”

可观测性这个话题主要看什么

可观测性相关文章