负载均衡100,000个WebSocket连接:HAProxy、Nginx与自定义方案的对比
在处理100,000个WebSocket连接的挑战中,我们探索了HAProxy、Nginx和自定义解决方案的性能和可靠性。本文分享了我们的经验教训和最佳实践,帮助你在高并发场景下选择合适的负载均衡器。
围绕可观测性、AI SRE、告警治理、On-call、Nightingale、Categraf、Prometheus、Kubernetes、Zabbix、用户案例和产品更新,沉淀一线工程实践、选型参考和稳定性治理方法。
在处理100,000个WebSocket连接的挑战中,我们探索了HAProxy、Nginx和自定义解决方案的性能和可靠性。本文分享了我们的经验教训和最佳实践,帮助你在高并发场景下选择合适的负载均衡器。
与首席工程师共事一年,我从他身上学到了10条宝贵的经验教训。这些经验教训改变了我的编码方式、沟通方式以及做出贡献的方式。以下是我从他身上学到的10条经验教训。
Kafka 是一个强大的事件流平台,但很多人觉得它难用。本文分享一些经典的 Kafka 使用模式,帮助你更好地理解和应用 Kafka。
在产品初期,架构设计对用户增长至关重要。本文分享了从单体架构到微服务架构的演变过程,以及在扩展到百万用户时的关键经验教训。
精选 8 个实用 Python 库,涵盖 CLI 美化、参数解析、日期时间、数据验证、虚拟数据、进度条、网页抓取和日志记录等场景。
YAML 是 Kubernetes 资源定义的核心,本文介绍了编写 YAML 的技巧和常见坑,包括缩进、数据类型转换等问题。
总结夜莺 v8 正式版的核心升级,包括更多数据源告警支持、事件 Pipeline、通知规则抽象、机器告警优化和新版告警全景看板。
鲁棒性和弹性是软件系统设计中的两个重要概念。本文将详细解释它们的定义、区别,并通过中英文对比举例,帮助读者更好地理解这两个概念。
可观测性 3.0 是个啥?本文介绍了可观测性 3.0 的背景、目标和实现方式,强调了成本效率和智能数据收集的重要性。
Airbnb 内部的负载测试框架 Impulse,支持上下文感知负载生成、依赖项模拟、流量收集等功能,帮助开发者进行自助式负载测试。
使用夜莺监控 Pipeline 功能,轻松实现发版时告警静默,减少告警噪声,提高运维效率。
Circuit Breaker Pattern 是构建弹性、容错系统的重要工具。通过防止级联故障、提高系统稳定性和实现正常恢复,它在现代软件架构中发挥着至关重要的作用,尤其是在微服务环境中。无论您是构建大型企业应用程序还是较小的分布式系统,断路器都可以在故障条件下保持可靠运行方面改变游戏规则。
夜莺监控发布了 v8.beta14 版本,新增 Postgres 告警支持和 AI Summary 处理器,增强业务监控能力。
演示如何用 Keycloak 和 OIDC 统一夜莺与 Grafana 的登录,并把 Grafana 内嵌到夜莺中,实现一个入口看图和管告警。
从 2014 年开发 Open-Falcon 到后来开发 Nightingale 再到现在创业,算下来,在这个领域摸爬滚打 10 多年了。本文梳理了创业的原因、领域选择、痛点解决、产品区别等问题。
逐项解析 Categraf 主配置文件 config.toml,说明采集来源、上报地址、心跳、日志、HTTP 服务和 ibex 等关键参数。
本文介绍夜莺监控项目的最新版本 v8.0.0-beta13,新增了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。
介绍微软 Azure SRE Agent 的能力与工作方式,涵盖事件响应、日志和指标分析、根因定位、安全检查与自动止损等场景。
从传统的ELK转向由OpenTelemetry和OpenSearch驱动的技术栈,能为您的日志需求提供更灵活、高效且真正开源的解决方案。您可以借助OTel实现标准化的遥测数据收集,从日志开始,之后再添加追踪和指标数据。这是在内部构建全栈可观测性系统的第一步
本文介绍夜莺监控项目的最新版本 v8.0.0-beta11,新增了对 ClickHouse 的告警支持、事件 Pipeline 功能等。这个版本的更新进一步增强了夜莺的功能和灵活性,适用于更广泛的监控场景。