当前位置: 首页 > article >正文

【送书活动三期】解决docker服务假死问题

工作中使用docker-compose部署容器,有时候会出现使用docker-compose stopdocker-compose down命令想停掉容器,但是依然无法停止或者一直卡顿在停止中的阶段,这种问题很让人头疼啊!

目录

  • 问题描述
  • 问题排查
  • 问题解决
    • 终极杀招-最粗暴的解决方法
    • 手动清理假死的docker服务
  • 书籍推荐
    • 书籍名称:《Kubernetes 从入门到DevOps企业应用实战》
    • 内容介绍
    • 适合人群
    • 如何领书
    • 自主购买
  • 最后

问题描述

在使用docker部署服务时,偶尔会遇到docker服务假死的情况,使用的命令如下:

  • docker ps 显示容器状态正常,但是对外服务已经不可用不可访问
  • docker stats 没有任何反应
  • docker stop CONTAINER_ID 也没有任何反应
  • docker restart CONTAINER_ID 也没有任何反应
  • docker exec -it --user root CONTAINER_ID /bin/bash 也没有任何反应
  • docker logs CONTAINER_ID --tail 111 -f 也没有任何反应
  • docker-compose stop/down 命令也提示响应超时,不可用

问题排查

之前没有遇到过这种问题,也是第一次,于是就各种信息都看一下,各种可能性也都考虑到位

猜测这种情况,可能是由于容器内部的问题导致服务无法正常运行,或者Docker守护进程本身出现了问题。

  1. 查看容器内部日志(我的容器日志也没有问题)
  • 使用以下命令查看容器内的stdout和stderr输出,以获取有关容器内部问题的更多信息。
docker logs CONTAINER_ID
  • 使用-f选项可以实时跟踪日志
docker logs -f CONTAINER_ID
  1. 检查宿主机资源: 使用以下命令检查宿主机的资源使用情况,确保资源(CPU、内存)没有被耗尽(我的没有问题)
docker stats
  1. 查看Docker守护进程状态(我的容器依然处于运行状态)
  • 检查Docker守护进程的运行状态,确保它没有出现问题。
sudo systemctl status docker
  • 如果守护进程出现问题,可以尝试重启Docker服务
sudo systemctl restart docker
  1. 手动停止和启动容器: 尝试手动停止和启动容器,看是否能够解决问题。(我的问题么有解决啊😭)
docker stop CONTAINER_ID
docker start CONTAINER_ID
  1. 检查端口冲突: 确保容器所使用的端口没有被其他进程占用。(不可能,绝对不可能.jpg)
  2. 查看系统日志: 查看系统日志以获取更多关于系统或Docker的问题的信息。(说实话么有看出来什么问题)
dmesg | grep -i docker
  1. 查看网络配置(正常的网络状况,网络配置也没有修改)
  • 检查Docker网络配置,确保网络正常。
docker network ls
  • 查看容器的网络配置
docker inspect CONTAINER_ID | grep NetworkMode
  1. 查看防火墙设置: 如果使用防火墙,确保容器所需的端口没有被阻塞。

  2. 尝试重启Docker服务: 如果以上方法都没有解决问题,可以尝试重启整个Docker服务。(终极大招,管用!)

sudo systemctl restart docker

问题解决

终极杀招-最粗暴的解决方法

  • 重启docker(慎用):
sudo systemctl restart docker

要注意,这个操作会把所有的docker服务无差别的重启,慎用

手动清理假死的docker服务

  1. 找到假死的docker服务:执行docker ps命令找到容器ID【CONTAINER_ID】
  2. 先尝试使用docker自带的命令停止容器docker stop 【CONTAINER_ID】 发现停不掉
  3. 手动查找docker目录下的容器信息
  • docker默认目录:/var/lib/docker
  • 所有docker容器的信息都挂载在/var/lib/docker/containers目录下
  • 通过【CONTAINER_ID】找到该假死服务的目录
    • ll /var/lib/docker/containers | grep 【CONTAINER_ID】
    • cd /var/lib/docker/containers
  1. 删除该容器
    rm -rf 目录名

这里删除可能会报下面的错误,因为你的容器还挂载了其他目录,信息如下: rm:无法删除"/var/lib/docker/containers/目录名/secrets":设备或资源忙无法删除"/var/lib/docker/containers/目录名/shm": 设备或资源忙

这个时候查一下容器对应的挂载目录

cat /proc/mounts |grep "docker" |grep "【CONTAINER_ID】"

然后先取消挂载

umount /data/sys/var/docker/containers/挂载目录/secretsumount /data/sys/var/docker/containers/挂载目录/shm

如果这一步 unmout 不了,可以尝试找到使用该目录的进程

lsof |grep "挂载目录"

如果有相关进程,记录相关的进程号直接 kill -9 进程号

ll /var/lib/docker/containers | grep 【CONTAINER_ID】

这个时候再重新执行删除目录命令

cd /var/lib/docker/containers
rm -rf 目录名

这个时候就可以删掉了

  1. 再次尝试通过docker的命令停止容器
docker stop 【CONTAINER_ID】

docker rm -f 【CONTAINER_ID】或docker kill --signal=SIGINT  【CONTAINER_ID】

如果还是无法停掉改服务,可以按如下步骤:

使用linux进程管理命令来结束容器进程

  • 先找到该进程:ps -ef | grep【CONTAINER_ID】

  • 强制杀掉筛选出来的进程信息:kill -9 PID

  1. 再次检查docker服务状态 docker ps

先可以看到该服务已经被干掉了。

如果说按照这个操作依然无法解决docker假死问题,那么我还是建议大家采用上面最粗暴的方式去解决,但是要注意,这个操作会把所有的docker服务无差别的重启。


书籍推荐

  • 源自近200万学员热捧的Kubernetes实战课程
  • 作者研究和实践容器技术超过10年历时三年精心打造,涵盖大量一线大厂实战项目
  • 理论基础+命令详解+众多应用场景+企业级案例+自动化DevOps运维知识体系

书籍名称:《Kubernetes 从入门到DevOps企业应用实战》

在这里插入图片描述

内容介绍

本书作者从事容器技术方面的研究和实践已近十年,还是一位Kubernetes讲师和社区贡献者,其录制的Kubernetes视频课入选了工信部人才交流中心官方认证课程,本书是在总结多年来不断改进的视频课的基础上精心编撰而成,内容经过学员检验,值得依赖。

本书除介绍Kubernetes本身,还介绍了很多周边相关技术,比如,Jekins、CI\CD、Istio、Prommethues、Ingress、K3s等,有助于读者整合运用这些技术,真正解决生产实践中遇到的问题。
总之,这是一本理解兼备实践,注重实操的Kubernetes好书,期待读者从本书中收获多多。

适合人群

本书由浅入深,有趣有料,适合想提升代码编写水平的大学生、求职者、编程爱好者阅读,也适合有1~2年开发经验的程序员参考,还可以作为各类培训班的培训教材。

如何领书

————————————————
本次本篇文章送书 🔥2-3本 评论区抽2-3位小伙伴送书
📆 活动时间:截止到 2023-12-09 20:00:00
🎁抽奖方式:利用网络公开的在线抽奖工具进行抽奖
💡参与方式:关注、点赞、收藏,评论 “人生苦短,K8S超简单”
根据文章阅读量的多少来安排送书的本数。
————————————————

🔥 注:活动结束后,会私信中奖粉丝的,各位注意查看私信哦!

自主购买

小伙伴也可以访问链接进行自主购买哦~
直达京东购买链接🔗:《Kubernetes 从入门到DevOps企业应用实战》


最后

  • 好看的灵魂千篇一律,有趣的鲲志一百六七!
  • 如果觉得文章还不错的话,可以点赞+收藏+关注 支持一下,鲲志的主页 还有很多有趣的文章,欢迎小伙伴们前去点评
  • 如果有什么需要改进的地方还请大佬指出❌

在这里插入图片描述


http://www.kler.cn/a/154304.html

相关文章:

  • Solana 区块链的技术解析及未来展望 #dapp开发#公链搭建
  • 平台整合是网络安全成功的关键
  • AWTK-WIDGET-WEB-VIEW 实现笔记 (4) - Ubuntu
  • 大数据如何助力干部选拔的公正性
  • ChromeDriver 官方下载地址_测试自动化浏览器驱动
  • 【动手学电机驱动】 STM32-FOC(7)MCSDK Pilot 上位机控制与调试
  • 智能诊疗体验:整合AI技术的互联网医院小程序开发
  • LZW的编码和解码
  • AntDB“超融合+流式实时数仓”——打造分布式数据库新纪元
  • C语言结构体详解(一)(能看懂文字就能明白系列)
  • PyLMKit(5):基于网页知识库的检索增强生成RAG
  • 前端页面转pdf
  • Couchdb 命令执行漏洞复现 (CVE-2017-12636)
  • 常见场景题-接口重试策略如何设计?
  • Day41 使用listwidget制作简易图片播放器
  • 科研学习|论文解读——Open government research over a decade: A systematic review
  • 【android开发-06】android中textview,button和edittext控件的用法介绍
  • vue3-vite-ts:编写Rollup插件并使用 / 优化构建过程
  • 来CSDN一周年啦!!!
  • DBeaver 社区版(免费版)下载、安装、解决驱动更新出错问题
  • 初识短线交易
  • 华为OD机试真题-来自异国的客人-2023年OD统一考试(C卷)
  • 关于标准库中的vector - (涉及迭代器失效,深浅拷贝,构造函数,内置类型构造函数,匿名对象)
  • 解决因系统重装,导致QT编译器无法使用的办法
  • SickOs1.2
  • linux 下如何将/dev/nvme0n1符格式化为空盘符