AI 摘要生成

本功能为商业版功能。

📖 功能介绍

AI Summary 事件处理器是一个智能告警分析工具,它可以:

  • 🤖 自动调用AI模型(如ChatGPT、Claude等)分析告警事件
  • 📝 生成通俗易懂的告警总结和建议
  • 🔄 将AI分析结果自动添加到告警事件中
  • 💡 帮助运维人员快速理解告警内容和影响范围

🎯 使用场景

适用情况

  • 复杂告警分析:当告警信息复杂,需要专业分析时
  • 新手运维:帮助新手快速理解告警含义
  • 批量告警处理:自动生成标准化的告警说明
  • 故障诊断:获得AI辅助的故障分析和建议

示例场景

原始告警:CPU使用率超过85%,服务器负载过高
AI总结:检测到服务器性能异常,CPU使用率持续超标可能导致:
1. 应用响应变慢
2. 用户体验下降  
3. 可能引发服务中断
建议立即检查高耗CPU进程并考虑扩容

🚀 使用步骤

第一步:获取AI服务

  1. 注册AI服务商账号(如 OpenAI、DeepSeek 等)
  2. 获取 API Key 密钥
  3. 确认 API 调用地址

第二步:配置处理器

  1. 填入 API 地址和密钥
  2. 选择合适的 AI 模型
  3. 编写提示词模板
  4. 设置自定义参数(可选)

第三步:测试验证

  1. 点击"测试"按钮验证配置
  2. 检查 AI 响应是否符合预期
  3. 调整提示词优化结果

第四步:启用使用

  1. 保存配置并启用处理器
  2. AI 总结的内容,会加到告警事件中,在消息模板中,通过引用 {{$event.AnnotationsJSON.ai_summary}} 使用

💡 使用技巧

提示词编写建议

  • 明确目标:清楚说明希望 AI 做什么
  • 限制长度:指定输出字数避免过长
  • 指定语言:明确要求中文输出
  • 结构化:要求按格式输出(如分点说明)

参数调优建议

  • temperature:0.3-0.7 适合分析类任务
  • max_tokens:控制输出长度,建议 200-500
  • top_p:0.9左右保证内容相关性

常见问题

Q1:AI 摘要明明配好了,但通知里看不到 AI 内容?

A:按这个顺序检查:

  1. 消息模板有没有引用 {{$event.AnnotationsJSON.ai_summary}} — 处理器只是把结果写入注解,还要在模板里显式引用才会出现在通知里;
  2. AI 调用是否成功 — 看 工作流执行记录 里该节点的 stderr / response;
  3. 超时设置太短 — AI 推理慢,建议设 30-60 秒;
  4. API Key / URL 是否有效 — 在 LLM 管理 用"测试连接"验证。

Q2:能不能直接用平台 LLM 管理里配好的模型,不在这里重新填 API Key?

A:建议用 LLM 管理统一管理,避免到处配 Key。处理器里选"使用平台默认 LLM"或指定一个具体的 LLM 配置即可。直接在处理器里填 API URL + Key 适合单点临时使用,但维护成本高。

Q3:AI 摘要会增加多少告警延迟?怎么降低?

A:典型 3-15 秒。降低延迟的方式:

  • 轻量模型(如 gpt-4o-minideepseek-chat),别用 Reasoning / Thinking 模型;
  • 关闭 thinking 模式 — 详见 LLM 管理 文档;
  • max_tokens 控制到 200-300(足够告警摘要);
  • 把 AI 摘要处理器放在关键通知节点之后(非阻塞),不要让通知发送等它。

Q4:能让 AI 直接给出"建议处理命令"吗?

A:可以 — 在提示词里写清楚 “请输出 1-3 条可立即执行的排查命令"。但要警惕:

  • AI 给的命令仅供参考,可能不适用具体环境;
  • 不要把 AI 输出直接喂给 自愈脚本 执行 — 风险太高。

参考资料

更新时间 2025-03-12

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云