Netflix SRE 实践概述

NetFlix 的 SRE 实践是如何的?大家应该很好奇吧。NetFlix 全部采用 aws 构建他们的流媒体服务,体量巨大,他们的 SRE 文化是什么?主要干什么事情?且听本文分解。
Netflix SRE 实践概述

运维百家讲坛第6期:途游邹轶 - 中小公司的运维怎么做?

这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。
运维百家讲坛第6期:途游邹轶 - 中小公司的运维怎么做?

夜莺V6.X架构介绍

Nightingale 夜莺 6.x 版本架构上做了调整,本文从中心部署架构和下沉部署架构两个常见场景进行介绍。
夜莺V6.X架构介绍

SRE接手新业务首要工作:运维准入测试

如果接手的是一坨随时可能散架的破车,就算SRE有通天之能,也很难通过运维手段给变成布加迪威龙。接手的时候一定要做好准入测试!很多公司会有运维准入规范,但是通常缺少运维准入测试,导致了后续诸多背锅问题。
SRE接手新业务首要工作:运维准入测试

如何做好今天的运维

优秀的运维和架构师应该是怎样的?运维能给人工智能时代带来价值吗?
如何做好今天的运维

如何在 VictoriaMetrics 中删除或修改指标

在 VictoriaMetrics 中,有些指标不想要了,如何删除?或者有些数据不对,如何更新?
如何在 VictoriaMetrics 中删除或修改指标

阮一峰的网络日志:运维的未来是平台工程

转载自阮一峰的网络日志。老规矩,兼听则明,偏信则暗,听百家之言,自我决策。
阮一峰的网络日志:运维的未来是平台工程

使用AI写篇文章:SNMP Exporter 的使用样例和注意事项

chatGPT真的是太火爆了,Notion跟进,现在Office也跟进,对文字工作者是非常大的冲击,下面这个文章,《SNMP Exporter的使用样例和注意事项》完全由 NotionAI生成,有点牛逼啊
使用AI写篇文章:SNMP Exporter 的使用样例和注意事项

夜莺?Nightingale?快猫?Flashcat?开源?商业化?都是啥?

有些朋友不知道夜莺和快猫的关系,不知道开源版本和收费版本的关系,这个文章来解答一下这些常见问题。
夜莺?Nightingale?快猫?Flashcat?开源?商业化?都是啥?

告警聚合降噪、告警升级、告警认领、告警排班、告警协同,一网打尽

本文介绍如何利用FlashDuty完成告警聚合降噪、告警升级、告警认领、告警排班、告警协同等需求。每个公司大概率都同时使用多个监控系统,对告警事件做统一处理,是一个很强的需求,本文为大家讲解如何落地实践。
告警聚合降噪、告警升级、告警认领、告警排班、告警协同,一网打尽

产品技术:基于方法论实现的Flashcat监控有哪些设计上的理念和方法?

Flashcat的设计初衷是实现一个从数据到平台到场景真正一体化的统一监控,成为服务稳定性保障,特别是故障处理的真帮手。
产品技术:基于方法论实现的Flashcat监控有哪些设计上的理念和方法?

六分科技:使用 Flashcat 打造统一观测平台,构建全局稳定性视图

北京六分科技有限公司,成立于2018年3月,是 GNSS 高精度定位服务产品专业提供商。快猫星云作为六分科技的可观测性解决方案供应商,所开发的Flashcat平台很好的赋能了六分科技的业务和技术团队,得到了六分科技的高度认可。
六分科技:使用 Flashcat 打造统一观测平台,构建全局稳定性视图

终结这个话题:运维岗位真的不能干了么?

昨晚马驰和来炜在线交流,话题是运维岗位真的不能干了么?我作为主持人,既是点火的又是拉架的,听两位老兵分享了一些他们各自的观点,受益匪浅。今天抓紧记录一下,以免忘记,算是对昨天直播的一个复盘。
终结这个话题:运维岗位真的不能干了么?

不止于监控,夜莺 V6 全新升级为开源观测平台

夜莺6.0版本开始,不止是可以对接Prometheus类型的时序数据源,也可以对接Jaeger、ElasticSearch作为数据源,当然,还有很多其他更新,听我细细道来。
不止于监控,夜莺 V6 全新升级为开源观测平台

FlashDuty协作空间的设计逻辑和路由逻辑

协作空间是FlashDuty中一个重要概念,但是很多客户并不太了解,这里专门画了两页图,给大家做一个介绍。
FlashDuty协作空间的设计逻辑和路由逻辑

快猫Flashcat平台和统信UOS、海光处理器完成互认证!

Flashcat监控分析平台在统信服务器操作系统V20、海光5000、 海光7000系列处理器、飞腾FT-2000+/64、腾云S2500、鲲鹏916、鲲鹏920 等CPU上整体运行稳定,满足功能及兼容性测试要求。
快猫Flashcat平台和统信UOS、海光处理器完成互认证!

科普篇:运维稳定性体系建设

稳定性体系建设是一个巨大的话题,实际上不止是运维人员关注,整个技术体系都非常关注,这个话题慢慢聊,今天我们先着眼在运维视角,看看如何构建稳定性体系。
科普篇:运维稳定性体系建设

运维百家讲坛第5期:度小满陈存利 - 20年老“司令”聊运维、绩效、成长

这一期我们邀请到的是陈存利,度小满运维总监,20多年的职业生涯中绝大部分时间在互联网领域。在百度运维部期间由于带队风格过硬,兄弟团队称其为”陈司令”。今天我们请到“陈司令”来聊聊他的观点。
运维百家讲坛第5期:度小满陈存利 - 20年老“司令”聊运维、绩效、成长

运维百家讲坛第4期:又拍云邵海杨 - 25年Linux老兵聊DevOps八荣八耻

这一期我们邀请到的是又拍云科技的邵海杨,一个25年的Linux老炮,邵总醉心技术,一步一步往上走,是普通运维人员的典型成长路径,希望今天的采访可以对你有那么一些启发!
运维百家讲坛第4期:又拍云邵海杨 - 25年Linux老兵聊DevOps八荣八耻

运维百家讲坛第3期:快猫来炜 - 如何端好运维的饭碗

讲坛第1期《井源 - 运维几何》和前段时间马驰的《是时候让运维集体下岗了》在业界引起广泛讨论,运维岗位真的没有前途了吗?如何把饭碗端稳?这一期,我们采访了快猫星云的来炜,来炜是运维破圈创业人士,既然能创业,一定是在行业内有很深的积累的,他会怎么看待这个问题?让我们一起来听一种新的声音!
运维百家讲坛第3期:快猫来炜 - 如何端好运维的饭碗

标签
ai aiops alertmanager apache apiserver apm azure categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl featureflag flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google grok_exporter hadoop hana haproxy hdfs helm httpstat iac ibex ilo im协同 incident it监控 jaeger jenkins jmx-exporter jolokia k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki metrics metricshub metricsql mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星 不可变基础设施 出海 出海业务 创业 错误预算 错误预算机制 大厂实践 大模型 大模型智能oncall 滴滴夜莺 钉钉 钉钉通知 飞书 飞书通知 服务稳定性 告警 告警oncall 告警丰富 告警风暴 告警规则 告警降噪 告警聚合 告警排班 告警认领 告警升级 告警事件 告警收敛 告警数据孤岛 告警通知 告警响应 告警协同 告警抑制 告警引擎 告警值班 告警指派 告警自愈 根因定位 故障 故障复盘 故障管理 计算机学会 架构师 监控 监控agent 监控方法论 监控工具 监控设计思考 监控系统 监控系统合规 进程监控 开源 开源监控 开源商业化 开源夜莺 可观测平台 可观测性 可观测性论坛 可观测性体系建设 客户案例 快猫 快猫星云 连锁门店 链路追踪 埋点监控 灭火图 普罗米修斯 企微通知 企业微信 人工智能 日志 日志存储 日志分析 日志告警 日志监控 容器 熔断 时序库 时序数据库 事件监控 手把手构建生产级监控系统 他山之石 提问的智慧 通知规则 统一监控 网络可观测性 网络排障 稳定性保障 稳定性方法论 稳定性体系 稳定性体系建设 系统架构设计 信创 业务监控 夜莺 夜莺v8 夜莺短信告警 夜莺黄埔营 夜莺监控 夜莺开发者创新论坛 夜莺开源项目 夜莺业务组 夜莺用户案例 医药健康 仪表盘 用户案例 云厂商 云原生监控 云原生组织 运维 运维百家讲坛 运维告警 运维监控 运维监控系统 运维监控系统实战笔记 智能oncall 智能告警 自监控 最佳实践
快猫星云 联系方式 快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云 联系方式
快猫星云
OpenSource
开源版
Flashcat
Flashcat