AI 摘要產生處理器 — 自動呼叫 AI 模型分析告警事件,並將摘要寫回事件。

功能介紹

AI Summary 事件處理器是一個智慧告警分析工具,它可以:

  • 自動呼叫 AI 模型(如 ChatGPT、Claude 等)分析告警事件
  • 產生通俗易懂的告警總結與建議
  • 將 AI 分析結果自動加入告警事件中
  • 協助維運人員快速理解告警內容與影響範圍

使用場景

適用情況

  • 複雜告警分析:當告警資訊複雜,需要專業分析時
  • 新手維運:協助新手快速理解告警含意
  • 批量告警處理:自動產生標準化的告警說明
  • 故障診斷:取得 AI 輔助的故障分析與建議

範例場景

原始告警:CPU使用率超过85%,服务器负载过高
AI总结:检测到服务器性能异常,CPU使用率持续超标可能导致:
1. 应用响应变慢
2. 用户体验下降  
3. 可能引发服务中断
建议立即检查高耗CPU进程并考虑扩容

使用步驟

第一步:取得 AI 服務

  1. 註冊 AI 服務商帳號(如 OpenAI、DeepSeek 等)
  2. 取得 API Key 金鑰
  3. 確認 API 呼叫位址

第二步:設定處理器

  1. 填入 API 位址與金鑰
  2. 選擇合適的 AI 模型
  3. 撰寫提示詞範本
  4. 設定自訂參數(選用)

第三步:測試驗證

  1. 點選「測試」按鈕驗證設定
  2. 檢查 AI 回應是否符合預期
  3. 調整提示詞優化結果

第四步:啟用使用

  1. 儲存設定並啟用處理器
  2. AI 摘要的內容會加到告警事件中,在訊息範本中透過引用 {{$event.AnnotationsJSON.ai_summary}} 使用

使用技巧

提示詞撰寫建議

  • 明確目標:清楚說明希望 AI 做什麼
  • 限制長度:指定輸出字數避免過長
  • 指定語言:明確要求中文或英文輸出
  • 結構化:要求依格式輸出(如分點說明)

參數調校建議

  • temperature:0.3-0.7 適合分析類任務
  • max_tokens:控制輸出長度,建議 200-500
  • top_p:0.9 左右保證內容相關性

常見問題

Q1:AI 摘要明明設定好了,但通知裡看不到 AI 內容?

A:依此順序檢查:

  1. 訊息範本有沒有引用 {{$event.AnnotationsJSON.ai_summary}} — 處理器只是把結果寫入註解,還要在範本裡顯式引用才會出現在通知裡;
  2. AI 呼叫是否成功 — 看 執行記錄 裡該節點的 stderr / response;
  3. 逾時設定太短 — AI 推理慢,建議設 30-60 秒;
  4. API Key / URL 是否有效 — 在 LLM 管理 用「測試連線」驗證。

Q2:能不能直接用平台 LLM 管理裡設定好的模型,不在這裡重新填 API Key?

A:建議用 LLM 管理統一管理,避免到處設定 Key。處理器裡選「使用平台預設 LLM」或指定一個具體的 LLM 設定即可。直接在處理器裡填 API URL + Key 適合單點臨時使用,但維護成本高。

Q3:AI 摘要會增加多少告警延遲?怎麼降低?

A:典型 3-15 秒。降低延遲的方式:

  • 輕量模型(如 gpt-4o-minideepseek-chat),別用 Reasoning / Thinking 模型;
  • 關閉 thinking 模式 — 詳見 LLM 管理 文件;
  • max_tokens 控制到 200-300(足夠告警摘要);
  • 把 AI 摘要處理器放在關鍵通知節點之後(非阻塞),不要讓通知傳送等它。

Q4:能讓 AI 直接給出「建議處理指令」嗎?

A:可以 — 在提示詞裡寫清楚「請輸出 1-3 條可立即執行的排查指令」。但要警惕:

  • AI 給的指令僅供參考,可能不適用具體環境;
  • 不要把 AI 輸出直接餵給 自癒指令稿 執行 — 風險太高。

參考資料

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云