可观测性 这个话题主要看什么
软件暴露的指标、状态页面、打印的日志、事件、吐出的链路追踪数据,Profiling,都是提升软件可观测性的手段;从软件运行环境中收集到的信息,比如从 OS 层面收集到的软件占用的 CPU、内存、句柄、IO 等,也是观测软件的有效手段,提升了软件的可观测性。
可观测性,亦可看做软件在线 debug 的能力,助力排查线上问题。当然,也可以用可观测性数据衡量成本、建立知识沉淀机制等等,可观测性数据在很多场景都有价值。
可观测性,类似软件可用性,是软件的一大特性。如果通过软件暴露的各类信息可以方便了解软件内部运行状态,我们就说软件具备很好的可观测性。可观测性,亦可看做软件在线 debug 的能力,助力排查线上问题。当然,也可以用可观测性数据衡量成本、建立知识沉淀机制等等,可观测性数据在很多场景都有价值。
围绕 可观测性 的实践、选型、案例和产品内容,按同一阅读路径持续整理。
市面上有很多监控数据采集器,比如 Telegraf、Categraf、Exporter、Datadog-agent、Alloy 等,各自都有哪些优缺点,本文来唠唠这个话题。
面对海量的观测数据和复杂的IT环境,如何有效的连接观测系统和大模型,产生智能化的效果,总有一种老虎吃天,无从下嘴的感觉。本文将介绍Flashcat如何解决这个难题,有效的引进大模型,以及相应的案例。
本文讲解可观测性的重要性和 10 个最佳实践。帮助您的企业在复杂的 IT 环境中更好的生存和发展。
这一波 AI 浪潮跟以往都不同,各个行业都看到了新的可能性,都想把 AI 引入自己的场景,看看能迸发什么样的助力。笔者所在的监控、可观测性领域,也有各种尝试,比如:把事件交给 AI 直接分析,让 AI 帮忙编写 Promql 等,有没有其他重磅的应用场景?
可观测性是软件的一个特性,和可用性、可靠性类似的一个特性,每个软件工程师都应该关注,尤其是你需要自证清白的时候。可观测性是软件工程的最佳实践之一,埋点,或称为插桩,是时候作为软件工程的最佳实践之一了
连锁门店企业的可观测性有什么特点和建设中的挑战和难点?本文将总结分享Flashcat为多家大型连锁门店企业建设可观测性平台的经验。
如何建设一套适合出海业务的可观测性体系,既能够保障服务的稳定运行,又能够权衡好观测系统的用户体验和落地成本?
统一观测系统建设中存量系统如何处理?本文将介绍两种处理存量观测系统数据的方案,对比方案的优劣,并介绍Flashcat的选择和思考。
OpenTelemetry 是一个开源项目,旨在标准化遥测数据的收集和处理。通过提供一组 API、库和代理,OpenTelemetry 使开发人员能够收集、处理和可视化来自应用程序、服务和系统的遥测数据。
OpenTelemetry 是一个开源可观测性框架,旨在提供统一的标准和工具,以便开发人员可以轻松地收集、生成、收集和导出遥测数据。这些数据包括日志、指标和跟踪,这些数据对于了解应用程序和基础设施的执行情况至关重要
可观察性是一种方法,可以帮助您预测和预防未来的问题。它有助于根据外部输出的知识确定系统的状态。本文将详细介绍可观测性的定义、重要性、好处、挑战、支柱及其如何运作。
随着技术架构的不断演进以及云原生、微服务理念的广泛推广,可观测性(Observability)概念逐渐崭露头角,成为提升系统稳定性和运维效率的关键技术。本文将探讨可观测性与传统监控之间的区别与联系,介绍快猫星云在可观测性领域所提供的先进服务。
可观测性,顾名思义,指的是系统状态能够被观察与度量的特性。在信息技术领域,可观测性被精确定义为根据系统生成的输出数据(涵盖日志、指标及跟踪信息)来测量和理解系统当前状态的能力。
随着云原生技术的广泛应用,可观测性作为云原生运维的核心工具,正成为事件管理实践中的关键支撑。本文探讨可观测性的本质、来源、发展、重要性及其实施路径。
系统科普可观测性的起源、定义与价值,讲清日志、指标、追踪三大支柱,以及它们如何帮助团队快速排障、提升系统稳定性与协作效率。
在复杂的服务器运维环境中,可观测性(Observability)是确保系统稳定运行、及时发现并解决问题的关键。这一概念核心通过系统输出的数据—如日志、指标及链路追踪—来精准衡量并理解当前系统的运行状态。
本文是 VictoriaMetrics 公司创始人所著,探讨了开源时序库的兴起历史、值得关注的项目以及未来的发展方向。时序库是监控、可观测性领域的基础设施,如果您是基础设施方向的工程师,尤其值得关注。
如果您已经实施了跟踪但缺乏强大的指标功能怎么办? SpanConnector 是一个通过将跟踪数据转换为可操作指标来弥补这一差距的工具。这篇文章详细介绍了 SpanConnector 的工作原理,提供了有关其配置和实现的指南。
相较于传统的单体应用,以及过去相对静态化的基础设施,现代的应用架构,是一种松耦合的、动态变化的、数量巨大的微服务构成的网络。为了看清楚网络中众多不同的服务之间的依赖关系,以及看清楚一次请求经过的路径上各个节点之间的耗时等信息,传统监控,已经无力应对了。这个网络的每个节点,都有可能是出问题的风险点,tracing 能够追踪每个请求在全生命周期过程中所经过的每个节点的信息,成为了云原生时代和微服务架构下构建可观测体系的关键一环。
Logs 是“可观测性三支柱”中历史包袱最重的监控数据类型,日志的格式更随意,缺乏标准和规范。推荐在应用研发阶段,按照 OTel Logs 规范打印日志。