夜莺-Nightingale
采集器-Categraf
夜莺V6
项目介绍
架构介绍
快速开始
黄埔营
安装部署
升级
采集器
使用手册
API
数据库表结构
alert_aggr_view
alert_cur_event
alert_his_event
alert_mute
alert_rule
alert_subscribe
alerting_engines
board
board_payload
builtin_cate
busi_group
busi_group_member
chart_share
configs
datasource
metric_view
notify_tpl
recording_rule
role
role_operation
sso_config
target
task_record
task_tpl
task_tpl_host
user_group
user_group_member
users
FAQ
夜莺V5
夜莺专业版
企业版-Flashcat
智能告警插件
开源生态
Telegraf
Prometheus
版权声明
第1章:天降奇兵
第2章:探索PromQL
开篇
理解时间序列
Metrics类型
初识PromQL
PromQL操作符
PromQL聚合操作
PromQL内置函数
在HTTP API中使用PromQL
最佳实践:4个黄金指标和USE方法
小结
第3章:Prometheus告警处理
开篇
Prometheus告警简介
自定义Prometheus告警规则
部署Alertmanager
Alertmanager配置概述
基于标签的告警处理路由
使用Receiver接收告警信息
告警模板详解
屏蔽告警通知
使用Recoding Rules优化性能
小结
第4章:Exporter详解
第5章:数据与可视化
第6章:集群与高可用
第7章:Prometheus服务发现
第8章:监控Kubernetes
开篇
初识Kubernetes
在Kubernetes下部署Prometheus
Kubernetes下的服务发现
使用Prometheus监控Kubernetes集群
基于Prometheus的弹性伸缩
小结
第9章:Prometheus Operator
参考资料
为夜莺接入电话、短信告警
因为电话、短信的发送是需要采购通道的,而市面上的通道五花八门,规范不一,所以夜莺没法把这个能力内置到Go代码里。那如何扩展支持呢?有两个方式,一个是通过自定义脚本,一个是通过Webhook。
自定义脚本
夜莺支持在告警的时候自动调用脚本,把告警事件的内容encode成json传给脚本的stdin,剩下的事情,就由脚本搞定了,具体逻辑可以参考 这里。社区里也有小伙伴分享了自己的经验,给出了样例脚本:
不过这个方式虽然可以跑通,就是比较麻烦,更简单的是Webhook的方式。
Webhook方式
基本上所有的监控系统,都支持把自己的告警事件Webhook推走,利用第三方系统来处理,这些第三方系统不只可以支持各类通知媒介,还支持告警的聚合降噪、排班、认领、升级、协同等等的逻辑。夜莺研发团队也做了一个这样的平台,叫 FlashDuty,欢迎 👉 点此了解 欢迎夜莺的小伙伴支持试用,合作共赢 :)