Kubernetes

包含标签 Kubernetes 的文章

10 个问题测试你对 K8s 的理解程度

Kubernetes 是一个非常复杂的系统，涉及到很多概念和技术，本文提供 10 个问题测试你对 K8s 的理解

Posted by Rifewang on 2025-02-10 16:02:56

Kubernetes K8s

Kubernetes 重度依赖 ETCD，如何确保 ETCD 集群稳定？

Kubernetes 集群逐渐变大，其中 ETCD 作为 Kubernetes 的存储，其稳定性尤为关键，我想确保 ETCD 集群稳定，应该从哪些方面着手落实？

Posted by 快猫运营团队 on 2025-01-06 10:31:08

产品技术 ETCD Kubernetes

在 Kubernetes 中部署 Alertmanager

Kubernetes 是当下最火爆的容器编排平台，很多软件都逐步迁移到了 Kubernetes，对于 Kubernetes 配套的监控系统，很多公司采用的是 Prometheus，Prometheus 配套的告警事件处理工具就是 Alertmanager，本文我们来看一下如何在 Kubernetes 中部署 Alertmanager

Posted by Bibin Wilson on 2024-08-06 00:06:10

Kubernetes Alertmanager Prometheus

在 Kubernetes 里部署 JMX Exporter 监控 Java 应用

本文会通过一个 Java 应用，演示 Prometheus JMX Exporter 在 Kubernetes 里的部署和配置方式。为了更好地理解 JMX Exporter，我们将使用 Spring Boot Java 应用程序并将所有 JMX 指标导出给 Prometheus。在本指南结束时，您将学习：

Posted by Bibin Wilson on 2024-07-31 00:06:10

Kubernetes JMX Exporter

用实际例子讲透 Kubernetes Pod

在本指南中，我将使用实际例子讲解 Kubernetes Pod 的概念。

Posted by Bibin Wilson on 2024-07-22 18:06:10

产品技术 Kubernetes

10 张图，说透 Kubernetes 架构和数据流

这本关于 Kubernetes 架构的综合指南旨在通过插图详细解释每个 Kubernetes 组件。

Posted by Bibin Wilson on 2024-07-18 06:06:10

产品技术 Kubernetes

Kubernetes OOM 和 CPU Throttling 问题

介绍使用 Kubernetes 时，内存不足（OOM）错误和 CPU 限制（Throttling）是云应用程序中资源处理的主要难题。为什么呢？云应用程序中的 CPU 和内存要求变得越来越重要，因为它们与您的云成本直接相关。通过 limits 和 requests，您可以配置 pod 应如何分配内存和 CPU 资源，以防止资源匮乏并调整云成本。

Posted by JAVIER MARTÍNEZ on 2023-07-19 08:06:10

Kubernetes监控专栏 Kubernetes

Kubernetes监控手册11-针对部署到Pod里的应用做性能监控

Kubernetes监控手册第11篇，在Kubernetes体系里，应用程序部署在Pod里，针对这类程序应该监控，跟传统的物理机虚拟机的部署方式有何差别？

Posted by 秦晓辉@快猫星云 on 2022-12-07 06:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale APM

Kubernetes监控手册10-使用 kube-state-metrics 监控 Kubernetes 对象

Kubernetes监控手册第10篇，使用 kube-state-metrics 监控 Kubernetes 各类对象，比如某个 Deployment 有多少副本可用多少副本不可用，有多少 Pod 分别是什么状态之类的。

Posted by 秦晓辉&孔飞@快猫星云 on 2022-12-04 06:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale kube-state-metrics

Kubernetes监控手册09-监控ETCD

Kubernetes监控手册第9篇，讲解如何监控ETCD，ETCD现在使用已经越来越广泛了，不止是Kubernetes，很多业务方也在使用，需要有个深入了解。

Posted by 秦晓辉&孔飞@快猫星云 on 2022-12-04 05:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale ETCD

Kubernetes监控手册08-监控scheduler

Kubernetes监控手册第8篇，讲解 scheduler 的监控方法，scheduler 是负责调度对象到合适的 node 上，会有一系列的规则计算和筛选。重点关注调度相关的指标

Posted by 秦晓辉&孔飞@快猫星云 on 2022-12-02 05:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale scheduler

Kubernetes监控手册07-监控controller-manager

Kubernetes监控手册第7篇，讲解 controller-manager 的监控方法，controller-manager 是负责监听对象状态，并与期望状态做对比，如果状态不一致则进行调谐，重点关注的是各个controller的运行情况，比如任务数量，队列深度

Posted by 秦晓辉&孔飞@快猫星云 on 2022-11-29 05:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale controller-manager

Kubernetes监控手册06-监控APIServer

Kubernetes监控手册第6篇，讲解APIServer的监控，APIServer作为Kubernetes全局统一API入口，是控制面的核心组件，APIServer如果出问题，各类增删改查都无法操作。

Posted by 秦晓辉&孔飞@快猫星云 on 2022-11-28 05:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale APIServer

Kubernetes监控手册05-监控Kubelet

Kubernetes监控手册第5篇，讲解Kubelet的监控，Kubelet部署在工作负载节点，相比Kube-Proxy的监控数据采集，需要引入认证和HTTPS，更复杂了一些，遵循渐进式学习原则，本文带着大家在Kubernetes监控的路上，再往前一步

Posted by 秦晓辉/孔飞@快猫星云 on 2022-11-14 11:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale Categraf Kubelet

Kubernetes监控手册04-监控Kube-Proxy

Kubernetes监控手册第4篇，讲解Kube-Proxy的监控，这个组件的监控非常简单容易，我们从这个组件入手，降低学习难度。

Posted by 秦晓辉@快猫星云 on 2022-11-09 12:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale Categraf Kube-Proxy

Kubernetes监控手册03-宿主监控实操

Kubernetes监控手册第3篇，讲解Kubernetes所在宿主机的监控，我们通过Categraf来实现机器指标的采集，演示相关操作

Posted by 秦晓辉@快猫星云 on 2022-11-03 08:06:10

Kubernetes监控专栏产品技术 Kubernetes Nightingale Categraf

Kubernetes监控手册02-宿主监控概述

Kubernetes监控手册第2篇，讲解Kubernetes所在宿主机的监控，主要是针对OS的CPU、内存等指标的监控，和传统的物理机虚拟机时代并无太大差别。

Posted by 秦晓辉@快猫星云 on 2022-11-02 00:00:00

Kubernetes监控专栏产品技术 Kubernetes Nightingale

Kubernetes监控手册01-体系介绍

Kubernetes监控手册第1篇，从整体做一个介绍，让我们一起来看一下Kubernetes监控都是在监控哪些方面的内容

Posted by 秦晓辉@快猫星云 on 2022-11-01 00:00:00

Kubernetes监控专栏产品技术 Kubernetes Nightingale

监控告警平台的国产化选择—Rancher 与夜莺的集成实践

身为Kubernetes管理平台的Rancher，通过 Nightingale Helm Chart，可以很方便的集成夜莺监控

Posted by 张智博-Rancher on 2022-05-23 00:00:00

夜莺夜莺监控开源监控云原生监控 Nightingale Rancher Kubernetes

ai aiops alertmanager apache apiserver apm azure categraf catpaw ccf chatgpt chatops clickhouse controller-manager coredump cprobe cslo datadog devops dns docker ebpf elasitcsearch elastalert elasticsearch etcd etl featureflag flashcat flashcat产品 flashduty flashduty-changelog fluentbit fluentd gdpr gitops golang google grok_exporter hadoop hana haproxy hdfs helm httpstat iac ibex ilo im协同 incident it监控 jaeger jenkins jmx-exporter jolokia k8s kafka kibana kube-proxy kube-state-metrics kubelet kubernetes linkedin linux linux监控 llm log log-monitor logging logs loki metrics metricshub metricsql mimirtool mongodb mongodb监控 monitoring mtail mysql mysql调优 mysql监控 netflix nightingale node-exporter nsenter observability on-call oncall open-falcon open-telemetry openmetrics opensearch opentelementry opentelemetry oracle监控 otel pagerduty pingmesh postgresql procstat product-feature prometheus prometheus告警 promql promxy rancher redis salt scheduler siglens signoz skywalking sla sli slo snmp snmp-exporter spanconnector sre telegraf tidb traces tracing troubleshooting uber ulimit vector victorialogs victoriametrics zabbix 北极星不可变基础设施出海出海业务创业错误预算错误预算机制大厂实践大模型大模型智能oncall 滴滴夜莺钉钉钉钉通知飞书飞书通知服务稳定性告警告警oncall 告警丰富告警风暴告警规则告警降噪告警聚合告警排班告警认领告警升级告警事件告警收敛告警数据孤岛告警通知告警响应告警协同告警抑制告警引擎告警值班告警指派告警自愈根因定位故障故障复盘故障管理计算机学会架构师监控监控agent 监控方法论监控工具监控设计思考监控系统监控系统合规进程监控开源开源监控开源商业化开源夜莺可观测平台可观测性可观测性论坛可观测性体系建设客户案例快猫快猫星云连锁门店链路追踪埋点监控灭火图普罗米修斯企微通知企业微信人工智能日志日志存储日志分析日志告警日志监控容器熔断时序库时序数据库事件监控手把手构建生产级监控系统他山之石提问的智慧通知规则统一监控网络可观测性网络排障稳定性保障稳定性方法论稳定性体系稳定性体系建设系统架构设计信创业务监控夜莺夜莺v8 夜莺短信告警夜莺黄埔营夜莺监控夜莺开发者创新论坛夜莺开源项目夜莺业务组夜莺用户案例医药健康仪表盘用户案例云厂商云原生监控云原生组织运维运维百家讲坛运维告警运维监控运维监控系统运维监控系统实战笔记智能oncall 智能告警自监控最佳实践