当前位置：首页 > article >正文

记录一次 k8s 节点内存不足的排查过程

article 2025/2/24 0:05:02

背景：前端服务一直报404，查看k8s日志，没发现报错，但是发现pods多次重启。

kubectrl logs -f -n weave pod-name --tail 100

kubectl describe po -n weave senseweave-capability-gateway-6c5485f7bf-xxxx

Exit Code 为 137：通常表示该容器被 Linux OOM（Out-of-Memory）杀手终止。这通常发生在 Pod 超过了内存限制，或者运行该 Pod 的节点内存不足时。
Restart Count 为2，表示最近pod重启了2次
当前pods没有指定 limit 资源

原因分析：如果pod不指定 limit，多个pod间会存在资源争抢，并且不指定资源的pod，在oom的时候，会优先被 Terminal 掉。

 kubectl top nodes --no-headers | sort -k4 -nr
 # 解释：
 #  --no-headers 不显示表头，
 #  sort -k4 -nr 按照第四列降序排序
 #    -n 按照数值排序
 #    -r 反向排序

23-8 节点的内存已经快满了。
在这里插入图片描述
pods 是通过 deployment 部署的，多个节点都有亲和性标签，但是 pod 还是部署到了 23-8 节点上。
分析原因可能是，不指定 limit 导致的

deployment 指定 limit 资源大小，重启 pods 。

requests文件上传和表单参数

Golang 构建学习

Java爬虫：深入探索1688接口的奥秘

Vue封装组件

详解collections库常用的数据结构

hive和spark读写分区表NULL列

哈希表算法题

Oracle系列---【关闭归档日志】

【Redis】Redis介绍

word2vec

详解Ethereum交易当中的Input Data

算法思维初学者指南

XRD精修教程：CMPR软件介绍-测试狗

Spring Boot 开发环境搭建及示例应用