Kubernetes 中必备的 10 个告警处置方法
Kubernetes 必备 10 个告警配置及处置方法:涵盖 CPU 过高、Kubelet 卷管理器故障、API Server 错误、节点资源压力、Pod 状态异常、ETCD leader 变更等关键场景的监控与排查命令。
汇总 Flashcat 博客中与 Kubernetes 相关的文章,方便按主题连续阅读实践、案例、选型和产品更新。
Kubernetes 必备 10 个告警配置及处置方法:涵盖 CPU 过高、Kubelet 卷管理器故障、API Server 错误、节点资源压力、Pod 状态异常、ETCD leader 变更等关键场景的监控与排查命令。
深入解析 Kubernetes OOM 和 CPU Throttling 问题:理解 limits/requests 配置、内存过量分配、CPU shares 机制,以及如何通过 Prometheus 指标监控和预防资源耗尽导致的 Pod 被杀或限流。
通过 OpenTelemetry 在 Kubernetes 集群中实现指标、日志和追踪数据的统一流水线,提升可观测性和故障排查效率。
在科技领域,当一种工具或平台变得至关重要、不可或缺时,会出现一个有趣的现象:我们不再谈论它了。并非因为它已过时。不是因为它失败了。而是因为它确实能正常运行。这就是Kubernetes如今所处的境地。在开源领域亮相近十年后,Kubernetes 已经变得——容我直言——平淡无奇。但这是件非常好的事。
Kubernetes 已成为现代云原生应用的支柱,具备独特的灵活性和可扩展性。然而,由于其复杂性,在保持对 Kubernetes 应用的健康状况和性能的可见性方面存在重大挑战。有效的监控不仅对于维持集群运行至关重要,还能确保应用达到最佳性能并提供流畅的用户体验。本博客探讨了监控 Kubernetes 应用的最佳实践,这些实践能帮助你主动解决问题、优化资源分配并创造业务价值。
本文介绍如何在 Kubernetes 集群中安装和使用 Prometheus 进行监控,包括安装 kube-prometheus-stack、查询数据、使用 Grafana 可视化等
Kubernetes 是一个非常复杂的系统,涉及到很多概念和技术,本文提供 10 个问题测试你对 K8s 的理解
Kubernetes 集群逐渐变大,其中 ETCD 作为 Kubernetes 的存储,其稳定性尤为关键,我想确保 ETCD 集群稳定,应该从哪些方面着手落实?
Kubernetes 是当下最火爆的容器编排平台,很多软件都逐步迁移到了 Kubernetes,对于 Kubernetes 配套的监控系统,很多公司采用的是 Prometheus,Prometheus 配套的告警事件处理工具就是 Alertmanager,本文我们来看一下如何在 Kubernetes 中部署 Alertmanager
本文会通过一个 Java 应用,演示 Prometheus JMX Exporter 在 Kubernetes 里的部署和配置方式。为了更好地理解 JMX Exporter,我们将使用 Spring Boot Java 应用程序并将所有 JMX 指标导出给 Prometheus。在本指南结束时,您将学习:
在本指南中,我将使用实际例子讲解 Kubernetes Pod 的概念。
这本关于 Kubernetes 架构的综合指南旨在通过插图详细解释每个 Kubernetes 组件。
Kubernetes监控手册第11篇,在Kubernetes体系里,应用程序部署在Pod里,针对这类程序应该监控,跟传统的物理机虚拟机的部署方式有何差别?
Kubernetes监控手册第10篇,使用 kube-state-metrics 监控 Kubernetes 各类对象,比如某个 Deployment 有多少副本可用多少副本不可用,有多少 Pod 分别是什么状态之类的。
Kubernetes监控手册第9篇,讲解如何监控ETCD,ETCD现在使用已经越来越广泛了,不止是Kubernetes,很多业务方也在使用,需要有个深入了解。
Kubernetes监控手册第8篇,讲解 scheduler 的监控方法,scheduler 是负责调度对象到合适的 node 上,会有一系列的规则计算和筛选。重点关注调度相关的指标
Kubernetes监控手册第7篇,讲解 controller-manager 的监控方法,controller-manager 是负责监听对象状态,并与期望状态做对比,如果状态不一致则进行调谐,重点关注的是各个controller的运行情况,比如任务数量,队列深度
Kubernetes监控手册第6篇,讲解APIServer的监控,APIServer作为Kubernetes全局统一API入口,是控制面的核心组件,APIServer如果出问题,各类增删改查都无法操作。
Kubernetes监控手册第5篇,讲解Kubelet的监控,Kubelet部署在工作负载节点,相比Kube-Proxy的监控数据采集,需要引入认证和HTTPS,更复杂了一些,遵循渐进式学习原则,本文带着大家在Kubernetes监控的路上,再往前一步
Kubernetes监控手册第4篇,讲解Kube-Proxy的监控,这个组件的监控非常简单容易,我们从这个组件入手,降低学习难度。