IT监控
IT监控是指对信息技术(IT)系统和基础设施进行实时检测和管理的过程。它通常涉及监控硬件、软件、网络和服务的性能,以确保其正常运行并及时发现和解决潜在问题。通过有效的IT监控,组织可以提高系统的可靠性、性能,并减少停机时间,最终提升用户体验和业务效率。
IT监控 相关文章
围绕 IT监控 的实践、选型、案例和产品内容,按同一阅读路径持续整理。
在 Ubuntu 22.04 上安装和配置 Zabbix
手把手演示在 Ubuntu 22.04 上安装 Zabbix 6 server 和 agent,完成 PostgreSQL 初始化、Nginx/PHP 配置,并添加主机监控。
Zabbix 监控系统原理介绍
Zabbix 是一个基于 Web 界面的企业级开源监控解决方案,包含 Server、Proxy、Agent、Web 等多个组件,本文讲解各个组件的核心作用,帮你理清 Zabbix 的工作原理。
IT 监控有哪些监控数据采集方式
IT 监控系统是周期性采集监控数据,进而进行分析、可视化、告警的系统,对于故障发现、定位具有极大的帮助。监控数据采集是监控系统的基础,本文介绍了 IT 监控系统中常见的监控数据采集方式。
IT 监控告警的应急响应流程的最佳实践是什么
在线 IT 类服务对可用性、稳定性的要求通常都很高,通常会配套提供 IT 监控系统来持续的对服务状态进行监控,一旦发现问题可以及时告警出来,及时处置,那 IT 监控告警的应急响应流程怎么做才是最佳实践呢
可观测性与传统监控的区别和联系
什么是可观测性?相比传统监控,可观测性是“新瓶装旧酒”吗?他们有哪些区别和联系,从传统监控到可观测性,Gap 到底有多大?
Datadog 监控最佳实践 - 如何排查性能问题
Datadog 作为监控、可观测性领域的头部厂商,不止是输出工具,更会输出方法论,本文是监控方法论的第三篇,讲解如何排查性能问题
解决方案:兼顾合规、便捷、可扩展,全球化的监控平台建设方案
中国企业出海,考虑到数据保护规则的要求以及跨大洲的网络传输条件受限,服务往往部署在全球多个 Region 或者多云上,这给系统的运行维护带来了一定的挑战,特别的聚焦在可观测性体系的建设上:1)需要在每个region独立部署一套可观测性工具,很多维护性和配置性的工作,需要重复搞多次;2)某些场景下,需要跨区域进行数据分析、制作报表的时候,力不从心;有的企业干脆选择把所有区域的可观测性数据,实时的汇聚到中心机房,集中维护和处理,也存在不小的隐患。
理想的监控系统到底是什么样的?
笔者从 14 年开始做监控,到现在接近 10 年,认知在持续迭代,最近又有一些新想法,跟大家分享一下我眼中的理想的监控系统到底是什么样的
监控都没做好,你还要可观测性...
很多公司听说可观测性好,就要上马可观测性项目,自研/采购,各种投入,结果发现效果很差,业务不认可,最终一地鸡毛
从监控系统到可观测平台的演进之路
可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。也就是说,在软件开发和运维领域中,可观测性是指对于一个复杂的系统,能够通过监控、日志、指标、追踪等手段,快速地发现、诊断、解决问题的能力。
Prometheus 告警恢复时,怎么获取恢复时的值?
Prometheus 告警事件中的 `$value` 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 `$value` 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?
监控系统自监控怎么做?
监控系统用于监控其他的系统、基础设施,绝对是 P0 级的服务,那监控系统的自监控应该怎么做才能避免循环依赖呢?
机器硬件监控,最简单的方案,没有之一
之前新东方的老师分享了他们通过 Telegraf、Loki、Nightingale 等工具来监控机器硬件状态的方案,具备很强的灵活性、平台性。本文会介绍一个相对轻量的方式,只需要一个二进制+一个脚本即可搞定,给各位朋友提供一种新的选择
太卷了,史上最简单的监控系统 catpaw 简介
实际上,这是一个绝对轻量的事件监控工具。catpaw 可以帮助你监控 HTTP 探测、TCP 探测、文件探测、ulimit 探测、目录探测等,然后把异常事件推送到 Flashduty,实现完备的事件监控。
网络监控:交换机监控新姿势
介绍网络监控的新方案,用 Categraf 的 SNMP 插件配合 VictoriaMetrics 和 Grafana 替代 SNMP Exporter 加 Prometheus,并演示采集配置。
科普:运维监控系统概念及用途
运维监控系统是集成多种监控工具与技术的软件平台,核心任务是监测、管理IT基础设施、应用程序及服务,确保系统的可用性、性能及安全性。
科普:什么是智能化运维监控系统?如何设计及实现?
随着信息技术的飞速发展,企业对IT系统的依赖日益加深。为确保关键业务的连续性和稳定性,智能化运维监控系统(简称智能运维或AIops)成为了不可或缺的技术支撑。