AI 摘要產生處理器 — 自動呼叫 AI 模型分析告警事件,並將摘要寫回事件。
功能介紹
AI Summary 事件處理器是一個智慧告警分析工具,它可以:
- 自動呼叫 AI 模型(如 ChatGPT、Claude 等)分析告警事件
- 產生通俗易懂的告警總結與建議
- 將 AI 分析結果自動加入告警事件中
- 協助維運人員快速理解告警內容與影響範圍
使用場景
適用情況
- 複雜告警分析:當告警資訊複雜,需要專業分析時
- 新手維運:協助新手快速理解告警含意
- 批量告警處理:自動產生標準化的告警說明
- 故障診斷:取得 AI 輔助的故障分析與建議
範例場景
原始告警:CPU使用率超过85%,服务器负载过高
AI总结:检测到服务器性能异常,CPU使用率持续超标可能导致:
1. 应用响应变慢
2. 用户体验下降
3. 可能引发服务中断
建议立即检查高耗CPU进程并考虑扩容
使用步驟
第一步:取得 AI 服務
- 註冊 AI 服務商帳號(如 OpenAI、DeepSeek 等)
- 取得 API Key 金鑰
- 確認 API 呼叫位址
第二步:設定處理器
- 填入 API 位址與金鑰
- 選擇合適的 AI 模型
- 撰寫提示詞範本
- 設定自訂參數(選用)
第三步:測試驗證
- 點選「測試」按鈕驗證設定
- 檢查 AI 回應是否符合預期
- 調整提示詞優化結果
第四步:啟用使用
- 儲存設定並啟用處理器
- AI 摘要的內容會加到告警事件中,在訊息範本中透過引用
{{$event.AnnotationsJSON.ai_summary}}使用
使用技巧
提示詞撰寫建議
- 明確目標:清楚說明希望 AI 做什麼
- 限制長度:指定輸出字數避免過長
- 指定語言:明確要求中文或英文輸出
- 結構化:要求依格式輸出(如分點說明)
參數調校建議
- temperature:0.3-0.7 適合分析類任務
- max_tokens:控制輸出長度,建議 200-500
- top_p:0.9 左右保證內容相關性
常見問題
Q1:AI 摘要明明設定好了,但通知裡看不到 AI 內容?
A:依此順序檢查:
- 訊息範本有沒有引用
{{$event.AnnotationsJSON.ai_summary}}— 處理器只是把結果寫入註解,還要在範本裡顯式引用才會出現在通知裡; - AI 呼叫是否成功 — 看 執行記錄 裡該節點的 stderr / response;
- 逾時設定太短 — AI 推理慢,建議設 30-60 秒;
- API Key / URL 是否有效 — 在 LLM 管理 用「測試連線」驗證。
Q2:能不能直接用平台 LLM 管理裡設定好的模型,不在這裡重新填 API Key?
A:建議用 LLM 管理統一管理,避免到處設定 Key。處理器裡選「使用平台預設 LLM」或指定一個具體的 LLM 設定即可。直接在處理器裡填 API URL + Key 適合單點臨時使用,但維護成本高。
Q3:AI 摘要會增加多少告警延遲?怎麼降低?
A:典型 3-15 秒。降低延遲的方式:
- 選輕量模型(如
gpt-4o-mini、deepseek-chat),別用 Reasoning / Thinking 模型; - 關閉 thinking 模式 — 詳見 LLM 管理 文件;
max_tokens控制到 200-300(足夠告警摘要);- 把 AI 摘要處理器放在關鍵通知節點之後(非阻塞),不要讓通知傳送等它。
Q4:能讓 AI 直接給出「建議處理指令」嗎?
A:可以 — 在提示詞裡寫清楚「請輸出 1-3 條可立即執行的排查指令」。但要警惕:
- AI 給的指令僅供參考,可能不適用具體環境;
- 不要把 AI 輸出直接餵給 自癒指令稿 執行 — 風險太高。