IT监控

IT监控是指对信息技术(IT)系统和基础设施进行实时检测和管理的过程。它通常涉及监控硬件、软件、网络和服务的性能,以确保其正常运行并及时发现和解决潜在问题。通过有效的IT监控,组织可以提高系统的可靠性、性能,并减少停机时间,最终提升用户体验和业务效率。

二十年里12个开源监控工具大对比

过去20年里,都涌现出来了哪些典型的优秀开源监控工具,他们的优缺点如何?
二十年里12个开源监控工具大对比

Datadog 监控最佳实践 - 收集正确的数据

Datadog 作为监控、可观测性领域的头部厂商,不止是输出工具,更会输出方法论,本文算是监控方法论的第一篇,讲解数据采集,后续还会介绍针对什么数据做告警以及如何调查性能问题。
Datadog 监控最佳实践 - 收集正确的数据

Datadog 监控最佳实践 - 针对重要事项发出警报

Datadog 作为监控、可观测性领域的头部厂商,不止是输出工具,更会输出方法论,本文算是监控方法论的第二篇,讲针对什么数据做告警
Datadog 监控最佳实践 - 针对重要事项发出警报

Datadog 监控最佳实践 - 如何排查性能问题

Datadog 作为监控、可观测性领域的头部厂商,不止是输出工具,更会输出方法论,本文是监控方法论的第三篇,讲解如何排查性能问题
Datadog 监控最佳实践 - 如何排查性能问题

兼顾合规、便捷、可扩展,全球化的监控平台怎么建

中国企业出海,考虑到数据保护规则的要求以及跨大洲的网络传输条件受限,服务往往部署在全球多个 Region 或者多云上,这给系统的运行维护带来了一定的挑战,特别的聚焦在可观测性体系的建设上:1)需要在每个region独立部署一套可观测性工具,很多维护性和配置性的工作,需要重复搞多次;2)某些场景下,需要跨区域进行数据分析、制作报表的时候,力不从心;有的企业干脆选择把所有区域的可观测性数据,实时的汇聚到中心机房,集中维护和处理,也存在不小的隐患。
兼顾合规、便捷、可扩展,全球化的监控平台怎么建

理想的监控系统到底是什么样的?

笔者从 14 年开始做监控,到现在接近 10 年,认知在持续迭代,最近又有一些新想法,跟大家分享一下我眼中的理想的监控系统到底是什么样的

监控都没做好,你还要可观测性...

很多公司听说可观测性好,就要上马可观测性项目,自研/采购,各种投入,结果发现效果很差,业务不认可,最终一地鸡毛
监控都没做好,你还要可观测性...

从监控系统到可观测平台的演进之路

可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。也就是说,在软件开发和运维领域中,可观测性是指对于一个复杂的系统,能够通过监控、日志、指标、追踪等手段,快速地发现、诊断、解决问题的能力。
从监控系统到可观测平台的演进之路

Prometheus 告警恢复时,怎么获取恢复时的值?

Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
Prometheus 告警恢复时,怎么获取恢复时的值?

手把手融汇贯通网络流量分析

我们生活在一个数据大爆炸的时代,网络是互联网的载体,网络流量分析也是技术人员日常最依赖的troubleshooting手段,本文手把手讲解网络流量捕获和分析的方方面面
手把手融汇贯通网络流量分析

监控系统自监控怎么做?

监控系统用于监控其他的系统、基础设施,绝对是 P0 级的服务,那监控系统的自监控应该怎么做才能避免循环依赖呢?

开源的Datadog?可观测性平台SigNoz是否名副其实?

SigNoz号称自己是开源领域的Datadog,基于OpenTelemetry做了一套可观测性方案。夜莺从V6版本开始,也希望做全栈可观测性方案,巧了,大家目标一致,今天我们一起来对SigNoz做个初步了解,看看其产品设计如何,也帮大家未来选型做参考。
开源的Datadog?可观测性平台SigNoz是否名副其实?

机器硬件监控,最简单的方案,没有之一

之前新东方的老师分享了他们通过 Telegraf、Loki、Nightingale 等工具来监控机器硬件状态的方案,具备很强的灵活性、平台性。本文会介绍一个相对轻量的方式,只需要一个二进制+一个脚本即可搞定,给各位朋友提供一种新的选择
机器硬件监控,最简单的方案,没有之一

太卷了,史上最简单的监控系统 catpaw 简介

实际上,这是一个绝对轻量的事件监控工具。catpaw 可以帮助你监控 HTTP 探测、TCP 探测、文件探测、ulimit 探测、目录探测等,然后把异常事件推送到 FlashDuty,实现完备的事件监控。
太卷了,史上最简单的监控系统 catpaw 简介

网络监控:交换机监控新姿势

来自社区用户写的文章,在网络监控领域利用Categraf+VictoriaMetrics替换SNMP EXporter+Prometheus,使其更加友好和方便,并且性能和扩展性进一步提高
网络监控:交换机监控新姿势

科普:运维监控系统概念及用途

运维监控系统是集成多种监控工具与技术的软件平台,核心任务是监测、管理IT基础设施、应用程序及服务,确保系统的可用性、性能及安全性。
科普:运维监控系统概念及用途

科普:什么是智能化运维监控系统?如何设计及实现?

随着信息技术的飞速发展,企业对IT系统的依赖日益加深。为确保关键业务的连续性和稳定性,智能化运维监控系统(简称智能运维或AIops)成为了不可或缺的技术支撑。
科普:什么是智能化运维监控系统?如何设计及实现?

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat
FlashDuty
Flashduty