包含标签 夜莺监控 的文章

夜莺 v7.beta14 发版,支持灵活定义告警事件标签

告警事件中一大堆标签不胜其扰?尤其是 Kubernetes 的告警事件,夜莺 v7.beta14 发版,支持灵活定义告警事件标签,用最简单的方式干掉没用的标签

夜莺 v7.beta13 发版,继续优化细节

夜莺 v7.beta13 发版,继续优化细节,主要变更是提供日志的 KQL 查询模式、Prometheus 类型的数据源在即时查询时提供历史查询记录功能、记录规则提供 CRON 方式控制执行频率,可以借此指定固定时刻执行

夜莺 v7.beta12.1 发版,支持集成 Grafana

夜莺擅长处理多 Prometheus 集群的告警管理,在仪表盘这块,提供了一些内置仪表盘,但从完善度来讲,是没法和 Grafana 生态相比的,从 v7.beta12.1 版本开始,夜莺支持了内置 Grafana 仪表盘,省得大家在系统之间跳来跳去了,对于已经习惯使用 Grafana 的用户,可以考虑升级到此版本

夜莺 v7.beta11 发版,优化钉钉、企微、飞书通知

夜莺之前的版本也支持钉钉、企微、飞书通知,不过整体逻辑设计的比较绕,这个版本提供了一个更直观的配置方式,顺带优化了 at 人的功能

告警恢复时如何拿到恢复时的值?

Prometheus 生态的原生做法,由于阈值是放在 promql 中的,恢复时的消息中难以拿到恢复时的值,夜莺 v7.0.0.beta10 版本开始,提供了一种较为简单的内置方式,解决这个问题

夜莺监控 v7.beta8 发版,引入模板中心,修复边缘机房机器失联告警问题

这个版本建立了集成中心的框架,并且修复了边缘机房机器失联告警的Bug,建议升级

夜莺监控 v7.beta4 发版,仪表盘变量和业务组下的机器联动

仪表盘中的变量获取来源通常来自时序库,如果要查看机器相关的仪表盘数据,并做到方便的筛选,需要机器相关的指标提前打上各类标签,这个版本开始,仪表盘变量提供了一个新的筛选方式,可以和仪表盘所在业务组联动,自动获取业务组下的机器了

夜莺监控(Nightingale)上线内置指标功能

Prometheus 生态里如果要查询数据,需要编写 promql,对于普通用户来说,门槛有点高。通常有两种解法,一个是通过 AI 的手段做翻译,你用大白话跟 AI 提出你的诉求,让 AI 帮你写 promql,另一种是平台里内置现成的 promql,覆盖常用场景开箱即用。夜莺监控(Nightingale)最近上线了内置指标功能,即采用方案二,效果很棒值得尝试。

夜莺监控 V7 第二个 beta 版本发布,内置集成故障自愈能力,简化部署

夜莺监控 V5 和 V6 版本都支持故障自愈功能,但是均需要单独部署 ibex 模块,从 V7 beta2 版本开始,夜莺内置集成了 ibex 模块,无需单独部署 ibex,大大简化了部署流程。

利用夜莺开源版对H3C无线设备监控

来自夜莺社区用户写的文章,前文说明了利用夜莺开源版如何监控H3C交换机的,算是抛砖引玉;秉持着授人与鱼不如授人与渔,今天我们就来具体谈谈夜莺SNMP插件的使用,能自己自定义自身需求的监控指标才是真正学会如何利用夜莺去监控SNMP协议设备,今天将以H3C无线作为案例,具体讲解下SNMP插件配置。

夜莺中心端管理categraf采集规则并下发

市面上常见的采集器,比如 telegraf、grafana-agent、datadog-agent 等,通常内置了多种采集插件,比如可以采集操作系统的常规指标,也可以采集 mysql、redis、mongodb、kafka、elasticsearch、jmx 等指标,但是具体要采集什么数据,通常需要在客户端采集器上进行配置,修改采集器的配置文件,比较麻烦,尤其是对于一些不太容易登录的机器,这个操作就更难实现了。

可观测性平台夜莺开源项目发布V6正式版!

夜莺开源项目在2023.7月底发布了V6版本,这个版本开始,项目目标不止于做一款开源监控系统,而是要做一款开源可观测性平台,不过路漫漫其修远兮,初期只是把日志数据源引入并完成了基本的可视化,后续会着力打通指标和日志的数据串联以及数据特征提取。欢迎小伙伴一起参与共建。

纯粹的干货分享,CCF夜莺·2023可观测性论坛完满收官

各类技术大会越来越多,但是干货越来越少,有的大会基本全是乙方在推广产品,而且,只是吹嘘如何如何厉害,却不讲思路理念,对与会者裨益甚少。CCF夜莺·2023可观测性峰会,大量价值信息输出,好评如潮。

如何发现及处理 MySQL 主从延迟问题

MySQL 主从延迟,大都知道如何监控,但是怎么处理?

新东方老师教你使用 Telegraf + Loki + Nightingale 实现硬件监控

本期新东方的技术朋友分享了一个硬件监控的方案,使用 Telegraf 做数据采集,使用 Loki 做日志存储,使用 Nightingale 做告警规则配置,玩的挺花的,我们一起来学习一下吧

不止于监控,夜莺 V6 全新升级为开源观测平台

夜莺6.0版本开始,不止是可以对接Prometheus类型的时序数据源,也可以对接Jaeger、ElasticSearch作为数据源,当然,还有很多其他更新,听我细细道来。

让技术团队用上有设计感的监控工具,夜莺新版做到了

夜莺新版本发布,重新做了设计,启用紫色系,设计是如何考虑的,怎么更易用,更有设计感,持续打磨中

为夜莺监控,一键开启智能告警能力

夜莺监控(Nightingale)开源版本只支持阈值告警,如何开启智能告警能力,使用算法做预测分析

解决运维稳定性难题,夜莺监控助力方正证券研发提效

证券行业是对稳定性要求非常高的行业,方正证券日成交额过亿,对稳定性要求很高,引入夜莺监控解决了故障发现难题,是稳定性的有力工具

映客直播使用夜莺监控,支撑5亿时间线节省8成费用

映客直播使用夜莺监控,建设公司级运维监控平台,支撑了每个采集周期5亿数据点的上报,帮助公司节省八成费用

监控告警平台的国产化选择—Rancher 与夜莺的集成实践

身为Kubernetes管理平台的Rancher,通过 Nightingale Helm Chart,可以很方便的集成夜莺监控

夜莺监控成为CCF托管开源项目

夜莺监控开源项目,由滴滴捐赠给中国计算机学会开源发展委员会(CCF ODC),成为CCF接收捐赠的首个产业界开源项目
标签
aiops apiserver apm categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo devops dns docker ebpf elastalert elasticsearch etcd etl flashcat flashduty flashduty-changelog gitops golang google grok_exporter hadoop haproxy hdfs httpstat iac ilo im协同 jaeger jenkins jmx-exporter jolokia kafka kube-proxy kube-state-metrics kubelet kubernetes linkedin linux log log-monitor logging logs metrics metricsql mimirtool monitoring mtail mysql netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opentelemetry oracle监控 otel pagerduty pingmesh postgresql product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler signoz skywalking sla sli slo snmp snmp-exporter sre telegraf tidb traces troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 错误预算 错误预算机制 滴滴夜莺 钉钉 飞书 服务稳定性 告警风暴 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警协同 告警抑制 告警引擎 告警指派 告警自愈 根因定位 故障管理 计算机学会 架构师 监控 监控agent 监控设计思考 监控系统 开源 开源监控 开源夜莺 可观测性 可观测性论坛 可观测性体系建设 快猫 快猫星云 灭火图 企业微信 人工智能 日志分析 日志告警 容器 事件监控 手把手构建生产级监控系统 提问的智慧 网络可观测性 网络排障 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 信创 业务监控 夜莺 夜莺黄埔营 夜莺监控 夜莺开源项目 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维监控 运维监控系统实战笔记 智能告警 自监控
开源版
Flashcat
Flashduty