AI 摘要生成

本功能为商业版功能。

📖 功能介绍

AI Summary 事件处理器是一个智能告警分析工具，它可以：

🤖 自动调用AI模型（如ChatGPT、Claude等）分析告警事件
📝 生成通俗易懂的告警总结和建议
🔄 将AI分析结果自动添加到告警事件中
💡 帮助运维人员快速理解告警内容和影响范围

🎯 使用场景

适用情况

复杂告警分析：当告警信息复杂，需要专业分析时
新手运维：帮助新手快速理解告警含义
批量告警处理：自动生成标准化的告警说明
故障诊断：获得AI辅助的故障分析和建议

示例场景

原始告警：CPU使用率超过85%，服务器负载过高
AI总结：检测到服务器性能异常，CPU使用率持续超标可能导致：
1. 应用响应变慢
2. 用户体验下降  
3. 可能引发服务中断
建议立即检查高耗CPU进程并考虑扩容

🚀 使用步骤

第一步：获取AI服务

注册AI服务商账号（如 OpenAI、DeepSeek 等）
获取 API Key 密钥
确认 API 调用地址

第二步：配置处理器

填入 API 地址和密钥
选择合适的 AI 模型
编写提示词模板
设置自定义参数（可选）

第三步：测试验证

点击"测试"按钮验证配置
检查 AI 响应是否符合预期
调整提示词优化结果

第四步：启用使用

保存配置并启用处理器
AI 总结的内容，会加到告警事件中，在消息模板中，通过引用 {{$event.AnnotationsJSON.ai_summary}} 使用

💡 使用技巧

提示词编写建议

明确目标：清楚说明希望 AI 做什么
限制长度：指定输出字数避免过长
指定语言：明确要求中文输出
结构化：要求按格式输出（如分点说明）

参数调优建议

temperature：0.3-0.7 适合分析类任务
max_tokens：控制输出长度，建议 200-500
top_p：0.9左右保证内容相关性

常见问题

Q1：AI 摘要明明配好了，但通知里看不到 AI 内容？

A：按这个顺序检查：

消息模板有没有引用 {{$event.AnnotationsJSON.ai_summary}} — 处理器只是把结果写入注解，还要在模板里显式引用才会出现在通知里；
AI 调用是否成功 — 看工作流执行记录里该节点的 stderr / response；
超时设置太短 — AI 推理慢，建议设 30-60 秒；
API Key / URL 是否有效 — 在 LLM 管理用"测试连接"验证。

Q2：能不能直接用平台 LLM 管理里配好的模型，不在这里重新填 API Key？

A：建议用 LLM 管理统一管理，避免到处配 Key。处理器里选"使用平台默认 LLM"或指定一个具体的 LLM 配置即可。直接在处理器里填 API URL + Key 适合单点临时使用，但维护成本高。

Q3：AI 摘要会增加多少告警延迟？怎么降低？

A：典型 3-15 秒。降低延迟的方式：

选轻量模型（如 gpt-4o-mini、deepseek-chat），别用 Reasoning / Thinking 模型；
关闭 thinking 模式 — 详见 LLM 管理文档；
max_tokens 控制到 200-300（足够告警摘要）；
把 AI 摘要处理器放在关键通知节点之后（非阻塞），不要让通知发送等它。

Q4：能让 AI 直接给出"建议处理命令"吗？

A：可以 — 在提示词里写清楚 “请输出 1-3 条可立即执行的排查命令"。但要警惕：

AI 给的命令仅供参考，可能不适用具体环境；
不要把 AI 输出直接喂给自愈脚本执行 — 风险太高。

参考资料

快猫星云联系方式

快猫星云联系方式

快猫星云联系方式

快猫星云Email

申请技术交流产品试用

快猫星云

产品

可私有化部署的全栈智能观测平台

SaaS 化的智能告警响应平台

SaaS 化的真实用户监控平台

开源项目

云原生监控告警系统

All-in-one 数据采集器

合作伙伴计划

携手拓展 AI SRE 市场

用户落地实践与案例集入口

开发者中心

集成开发文档与工具

产品使用指南与 API 参考

获取最新安装包与工具

产品演示与教程

技术分享与行业话题