快猫监控
Prometheus
版权声明
第1章:天降奇兵
第2章:探索PromQL
第3章:Prometheus告警处理
第4章:Exporter详解
第5章:数据与可视化
第6章:集群与高可用
第7章:Prometheus服务发现
第8章:监控Kubernetes
第9章:Prometheus Operator
参考资料

如何监控夜莺自身的组件

夜莺 5.x 版本有 n9e-webapi 和 n9e-server 两个模块,这俩模块都暴露了 /metrics 接口,所以,夜莺自身组件的监控,就有两个做法,做法一:

  • 搞一个单独的 Prometheus,抓取 n9e-webapi 和 n9e-server 的 /metrics 的数据
  • 在这个单独的 Prometheus 里配置 up 指标的告警,这俩模块如果挂了可以及时知道

单独的 Prometheus 和夜莺拆开,不会造成循环依赖。当然,如果夜莺部署成集群了,那就可以用第二个做法,即用夜莺自己监控自己,某个模块挂了,不影响大局,使用 Categraf 的 input.prometheus 插件来采集这俩模块的 /metrics 数据就好。

conf/input.prometheus/prometheus.toml 的配置样例如下:

[[instances]]
urls = [
     "http://localhost:18000/metrics",
     "http://localhost:19000/metrics",
]

我们还做了一个监控大盘,地址在 这里,可以导入夜莺使用。