AI 摘要生成
本功能为商业版功能。
📖 功能介绍
AI Summary 事件处理器是一个智能告警分析工具,它可以:
- 🤖 自动调用AI模型(如ChatGPT、Claude等)分析告警事件
- 📝 生成通俗易懂的告警总结和建议
- 🔄 将AI分析结果自动添加到告警事件中
- 💡 帮助运维人员快速理解告警内容和影响范围
🎯 使用场景
适用情况
- 复杂告警分析:当告警信息复杂,需要专业分析时
- 新手运维:帮助新手快速理解告警含义
- 批量告警处理:自动生成标准化的告警说明
- 故障诊断:获得AI辅助的故障分析和建议
示例场景
原始告警:CPU使用率超过85%,服务器负载过高
AI总结:检测到服务器性能异常,CPU使用率持续超标可能导致:
1. 应用响应变慢
2. 用户体验下降
3. 可能引发服务中断
建议立即检查高耗CPU进程并考虑扩容
🚀 使用步骤
第一步:获取AI服务
- 注册AI服务商账号(如 OpenAI、DeepSeek 等)
- 获取 API Key 密钥
- 确认 API 调用地址
第二步:配置处理器
- 填入 API 地址和密钥
- 选择合适的 AI 模型
- 编写提示词模板
- 设置自定义参数(可选)
第三步:测试验证
- 点击"测试"按钮验证配置
- 检查 AI 响应是否符合预期
- 调整提示词优化结果
第四步:启用使用
- 保存配置并启用处理器
- AI 总结的内容,会加到告警事件中,在消息模板中,通过引用
{{$event.AnnotationsJSON.ai_summary}}使用
💡 使用技巧
提示词编写建议
- 明确目标:清楚说明希望 AI 做什么
- 限制长度:指定输出字数避免过长
- 指定语言:明确要求中文输出
- 结构化:要求按格式输出(如分点说明)
参数调优建议
- temperature:0.3-0.7 适合分析类任务
- max_tokens:控制输出长度,建议 200-500
- top_p:0.9左右保证内容相关性
常见问题
Q1:AI 摘要明明配好了,但通知里看不到 AI 内容?
A:按这个顺序检查:
- 消息模板有没有引用
{{$event.AnnotationsJSON.ai_summary}}— 处理器只是把结果写入注解,还要在模板里显式引用才会出现在通知里; - AI 调用是否成功 — 看 工作流执行记录 里该节点的 stderr / response;
- 超时设置太短 — AI 推理慢,建议设 30-60 秒;
- API Key / URL 是否有效 — 在 LLM 管理 用"测试连接"验证。
Q2:能不能直接用平台 LLM 管理里配好的模型,不在这里重新填 API Key?
A:建议用 LLM 管理统一管理,避免到处配 Key。处理器里选"使用平台默认 LLM"或指定一个具体的 LLM 配置即可。直接在处理器里填 API URL + Key 适合单点临时使用,但维护成本高。
Q3:AI 摘要会增加多少告警延迟?怎么降低?
A:典型 3-15 秒。降低延迟的方式:
- 选轻量模型(如
gpt-4o-mini、deepseek-chat),别用 Reasoning / Thinking 模型; - 关闭 thinking 模式 — 详见 LLM 管理 文档;
max_tokens控制到 200-300(足够告警摘要);- 把 AI 摘要处理器放在关键通知节点之后(非阻塞),不要让通知发送等它。
Q4:能让 AI 直接给出"建议处理命令"吗?
A:可以 — 在提示词里写清楚 “请输出 1-3 条可立即执行的排查命令"。但要警惕:
- AI 给的命令仅供参考,可能不适用具体环境;
- 不要把 AI 输出直接喂给 自愈脚本 执行 — 风险太高。