可观测性

可观测性，类似软件可用性，是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态，我们就说软件具备很好的可观测性。可观测性，亦可看做软件在线 debug 的能力，助力排查线上问题。当然，也可以用可观测性数据衡量成本、建立知识沉淀机制等等，可观测性数据在很多场景都有价值。

搜索可观测性

相关话题 IT监控故障定位告警OnCall SRE 用户案例 Prometheus VictoriaMetrics Categraf

Topic Overview

可观测性这个话题主要看什么

可观测性，类似软件可用性，是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态，我们就说软件具备很好的可观测性。

软件暴露的指标、状态页面、打印的日志、事件、吐出的链路追踪数据，Profiling，都是提升软件可观测性的手段；从软件运行环境中收集到的信息，比如从 OS 层面收集到的软件占用的 CPU、内存、句柄、IO 等，也是观测软件的有效手段，提升了软件的可观测性。

可观测性，亦可看做软件在线 debug 的能力，助力排查线上问题。当然，也可以用可观测性数据衡量成本、建立知识沉淀机制等等，可观测性数据在很多场景都有价值。

107 已收录内容

7 人工精选

100 自动聚合

可观测性相关文章

围绕可观测性的实践、选型、案例和产品内容，按同一阅读路径持续整理。

107 篇

可观测性

可观测性这个话题主要看什么

可观测性相关文章

如何用日志报表生成接口层灭火图

如何用 Flashcat APM 接入 Java / Go 服务并生成服务灭火图

SRE 为什么越来越累：问题不在监控太少，而在信号没有变成行动

Chronosphere 的提醒：AI RCA 之前，先管住 telemetry 成本和质量

卡片规则最佳实践：如何批量生成可维护的灭火图卡片

灭火图建设第一步：如何规划空间、分层和观测对象

监控告警应该配在底层规则，还是配在灭火图对象上

事件墙在故障定位中的作用：为什么变更、告警和运营事件要放在一起看

业务健康指标怎么设计：北极星指标、SLO 和故障发现入口

日志系统不只是检索：如何用日志报表把 Logs 变成 Metrics + Tracing

Flashcat POC 验收清单：如何判断一体化可观测平台是否真的有价值

如何为一个电商系统建设灭火图：接口、服务、组件、基础设施四层模型

Flashcat vs Grafana + Prometheus + ELK：差异不在数据展示，而在故障处理路径

可观测性的 AI-Ready 之路：为什么 AI 需要灭火图这样的上下文

从一张飘红卡片到根因定位：Flashcat 灭火图下钻怎么工作

为什么监控大盘越做越多，故障时还是不知道先看哪里

灭火图是什么：为什么说它是 Flashcat 的灵魂

AI RCA 不是一个按钮，而是一套生产调查系统

Honeycomb 的启发：RCA 不是看平均值，而是找出异常请求到底哪里不一样

Datadog 给 AI SRE 定了个主流模板：不是看数据，而是自动查问题

可观测性

可观测性 这个话题主要看什么

可观测性 相关文章

如何用日志报表生成接口层灭火图

如何用 Flashcat APM 接入 Java / Go 服务并生成服务灭火图

SRE 为什么越来越累：问题不在监控太少，而在信号没有变成行动

Chronosphere 的提醒：AI RCA 之前，先管住 telemetry 成本和质量

卡片规则最佳实践：如何批量生成可维护的灭火图卡片

灭火图建设第一步：如何规划空间、分层和观测对象

监控告警应该配在底层规则，还是配在灭火图对象上

事件墙在故障定位中的作用：为什么变更、告警和运营事件要放在一起看

业务健康指标怎么设计：北极星指标、SLO 和故障发现入口

日志系统不只是检索：如何用日志报表把 Logs 变成 Metrics + Tracing

Flashcat POC 验收清单：如何判断一体化可观测平台是否真的有价值

如何为一个电商系统建设灭火图：接口、服务、组件、基础设施四层模型

Flashcat vs Grafana + Prometheus + ELK：差异不在数据展示，而在故障处理路径

可观测性的 AI-Ready 之路：为什么 AI 需要灭火图这样的上下文

从一张飘红卡片到根因定位：Flashcat 灭火图下钻怎么工作

为什么监控大盘越做越多，故障时还是不知道先看哪里

灭火图是什么：为什么说它是 Flashcat 的灵魂

AI RCA 不是一个按钮，而是一套生产调查系统

Honeycomb 的启发：RCA 不是看平均值，而是找出异常请求到底哪里不一样

Datadog 给 AI SRE 定了个主流模板：不是看数据，而是自动查问题

可观测性这个话题主要看什么

可观测性相关文章