夜莺-Nightingale
夜莺V7
项目介绍 功能概览
部署升级 部署升级
数据接入 数据接入
告警管理 告警管理
数据查看 数据查看
功能介绍 功能介绍
API FAQ
夜莺V6
项目介绍 架构介绍
快速开始 快速开始
黄埔营
安装部署 安装部署
升级
采集器 采集器
使用手册 使用手册
API API
数据库表结构 数据库表结构
FAQ FAQ
开源生态
Prometheus
版权声明
第1章:天降奇兵 第1章:天降奇兵
第2章:探索PromQL 第2章:探索PromQL
第3章:Prometheus告警处理 第3章:Prometheus告警处理
第4章:Exporter详解 第4章:Exporter详解
第5章:数据与可视化 第5章:数据与可视化
第6章:集群与高可用 第6章:集群与高可用
第7章:Prometheus服务发现 第7章:Prometheus服务发现
第8章:监控Kubernetes 第8章:监控Kubernetes
第9章:Prometheus Operator 第9章:Prometheus Operator
参考资料

如何监控夜莺自身的组件

夜莺 5.x 版本有 n9e-webapi 和 n9e-server 两个模块,这俩模块都暴露了 /metrics 接口,所以,夜莺自身组件的监控,就有两个做法,做法一:

  • 搞一个单独的 Prometheus,抓取 n9e-webapi 和 n9e-server 的 /metrics 的数据
  • 在这个单独的 Prometheus 里配置 up 指标的告警,这俩模块如果挂了可以及时知道

单独的 Prometheus 和夜莺拆开,不会造成循环依赖。当然,如果夜莺部署成集群了,那就可以用第二个做法,即用夜莺自己监控自己,某个模块挂了,不影响大局,使用 Categraf 的 input.prometheus 插件来采集这俩模块的 /metrics 数据就好。

conf/input.prometheus/prometheus.toml 的配置样例如下:

[[instances]]
urls = [
     "http://localhost:18000/metrics",
     "http://localhost:19000/metrics",
]

我们还做了一个监控大盘,地址在 这里,可以导入夜莺使用。

快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat