当前位置: 首页 > article >正文

设置K8s管理节点异常容忍时间

说明

每个节点上的 kubelet 需要定时向 apiserver 上报当前节点状态,如果两者间网络异常导致心跳终端,kube-controller-manager 中的 NodeController 会将该节点标记为 Unknown 或 Unhealthy,持续一段时间异常状态后 kube-controller-manager 会将该节点上的所有 pod 驱逐(1.24 版本后驱逐通过 taint toleration 实现)。

为了防止发生大面积 pod 驱逐,需要修改 kube-controller-manager 的以下参数:

● --pod-eviction-timeout duration The grace period for deleting pods on failed nodes. (default 5m0s)
● --node-monitor-grace-period duration Amount of time which we allow running Node to be unresponsive before marking it unhealthy. Must be N times more than kubelet’s nodeStatusUpdateFrequency, where N means number of retries allowed for kubelet to post node status. (default 40s)

修改方式

编辑所有管理节点的 /etc/kubernetes/manifests/kube-controller-manager.yaml 文件,在 spec.containers.command 增加如下命令行参数:

- --pod-eviction-timeout=180m
- --node-monitor-grace-period=180m

在这里插入图片描述
重启进程,或者移动配置文件,如果没有变化重启kubelet
在这里插入图片描述


http://www.kler.cn/news/365345.html

相关文章:

  • Excel:vba实现生成随机数
  • MySQL 初阶——多版本控制 MVCC
  • Sei 生态迎首个 MMORPG 游戏伙伴 Final Glory,开启新篇章
  • PostgreSQL两节点用keepalived实现主备的高可用架构
  • Ribbon客户端负载均衡策略测试及其改进
  • APP专项测试-冷启动-流量-电量-内存
  • UML外卖系统报告(包含具体需求分析)
  • Qt学习笔记(二)Qt 信号与槽
  • sqli-labs靶场安装以及刷题记录-docker
  • 应用假死?
  • HTTP和HTTPS基本概念,主要区别,应用场景
  • 华为配置 之 IPv6路由配置
  • Rust求解八皇后问题
  • C# 文档打印详解与示例
  • 三维管线管网建模工具MagicPipe3D V3.5.3
  • Clickhouse 笔记(一) 单机版安装并将clickhouse-server定义成服务
  • 【华为HCIP实战课程十四】OSPF网络中LSA过滤,网络工程师
  • [网络协议篇] UDP协议
  • docker部署rustdesk
  • Linux系统中使用yum命令高效更新镜像源的步骤
  • 等保测评:安全计算环境的详细讲解
  • React第十一章(useReducer)
  • 语音识别——使用Vosk进行语音识别
  • Angular 保姆级别教程高阶应用 - RxJs
  • 在Milvus中管理标量Indexes
  • docker 下载netcore 镜像