标签：AI

汇总 Flashcat 博客中与 AI 相关的文章，方便按主题连续阅读实践、案例、选型和产品更新。

搜索 AI

按主题浏览告警治理用户案例 Nightingale Categraf Prometheus Kubernetes Zabbix

AI 相关文章

服务出现故障时，有没有一张图能够呈现出全系统各部分的健康状态，让团队快速找准问题范围，让经理、老板心中有数？灭火图就是这样一张图。更进一步，灭火图本质上是 IT 系统的"知识图谱"，是 Flashcat 实现智能化稳定性保障的核心数据基座。

目前国内外市场上有众多可观测性产品。本文从工具、场景、生态和智能化四个角度解释 Flashcat 的差异，重点说明数据集成、稳定性场景、OpenTelemetry 生态、FlashAI 和 AI Agent 操控平台的价值。

FlashAI 是 Flashcat 内置的 AI Agent，面向可观测性和 AI SRE 场景，通过自然语言驱动故障分析、巡检报告、灭火图建设、告警配置、数据查询和知识问答，让 AI 从辅助分析走向参与执行。

AI 正在重写开源项目的技术 Support：先让 AI 读取文档、源码、配置、日志、数据库和运行环境完成第一轮排障，再把收敛后的问题沉淀到 GitHub Issue 或社区。

可观测性要进入 AI-Ready 状态，关键不是先换模型，而是让 AI 能理解系统、查询观测数据，并获得业务知识。本文说明 Flashcat 如何通过灭火图、数据集成和 FlashAI 知识库支撑智能化稳定性保障。

Flashduty 在告警 On-call 场景中引入 AI 总结能力，把同一故障下的多条告警事件整理成人可读的故障摘要，帮助值班人更快理解 incident。

介绍微软 Azure SRE Agent 的能力与工作方式，涵盖 Azure 资源上下文、事件响应、日志和指标分析、根因定位、安全检查、人工批准后的止损动作以及 GitHub 闭环。

可观测性接入大模型，关键不是把所有指标、日志、链路和事件直接交给模型，而是先让模型理解系统对象和数据查询通道。本文说明 Flashcat 如何通过灭火图和数据集成支撑 AI 根因定位。

这一波 AI 浪潮跟以往都不同，各个行业都看到了新的可能性，都想把 AI 引入自己的场景，看看能迸发什么样的助力。笔者所在的监控、可观测性领域，也有各种尝试，比如：把事件交给 AI 直接分析，让 AI 帮忙编写 Promql 等，有没有其他重磅的应用场景？