【送书活动三期】解决docker服务假死问题
工作中使用docker-compose部署容器,有时候会出现使用
docker-compose stop
或docker-compose down
命令想停掉容器,但是依然无法停止或者一直卡顿在停止中的阶段,这种问题很让人头疼啊!
目录
- 问题描述
- 问题排查
- 问题解决
- 终极杀招-最粗暴的解决方法
- 手动清理假死的docker服务
- 书籍推荐
- 书籍名称:《Kubernetes 从入门到DevOps企业应用实战》
- 内容介绍
- 适合人群
- 如何领书
- 自主购买
- 最后
问题描述
在使用docker部署服务时,偶尔会遇到docker服务假死的情况,使用的命令如下:
- docker ps 显示容器状态正常,但是对外服务已经不可用不可访问
- docker stats 没有任何反应
- docker stop CONTAINER_ID 也没有任何反应
- docker restart CONTAINER_ID 也没有任何反应
- docker exec -it --user root CONTAINER_ID /bin/bash 也没有任何反应
- docker logs CONTAINER_ID --tail 111 -f 也没有任何反应
- docker-compose stop/down 命令也提示响应超时,不可用
问题排查
之前没有遇到过这种问题,也是第一次,于是就各种信息都看一下,各种可能性也都考虑到位
猜测这种情况,可能是由于容器内部的问题导致服务无法正常运行,或者Docker守护进程本身出现了问题。
- 查看容器内部日志(我的容器日志也没有问题)
- 使用以下命令查看容器内的stdout和stderr输出,以获取有关容器内部问题的更多信息。
docker logs CONTAINER_ID
- 使用-f选项可以实时跟踪日志
docker logs -f CONTAINER_ID
- 检查宿主机资源: 使用以下命令检查宿主机的资源使用情况,确保资源(CPU、内存)没有被耗尽(我的没有问题)
docker stats
- 查看Docker守护进程状态(我的容器依然处于运行状态)
- 检查Docker守护进程的运行状态,确保它没有出现问题。
sudo systemctl status docker
- 如果守护进程出现问题,可以尝试重启Docker服务
sudo systemctl restart docker
- 手动停止和启动容器: 尝试手动停止和启动容器,看是否能够解决问题。(我的问题么有解决啊😭)
docker stop CONTAINER_ID
docker start CONTAINER_ID
- 检查端口冲突: 确保容器所使用的端口没有被其他进程占用。(不可能,绝对不可能.jpg)
- 查看系统日志: 查看系统日志以获取更多关于系统或Docker的问题的信息。(说实话么有看出来什么问题)
dmesg | grep -i docker
- 查看网络配置(正常的网络状况,网络配置也没有修改)
- 检查Docker网络配置,确保网络正常。
docker network ls
- 查看容器的网络配置
docker inspect CONTAINER_ID | grep NetworkMode
-
查看防火墙设置: 如果使用防火墙,确保容器所需的端口没有被阻塞。
-
尝试重启Docker服务: 如果以上方法都没有解决问题,可以尝试重启整个Docker服务。(终极大招,管用!)
sudo systemctl restart docker
问题解决
终极杀招-最粗暴的解决方法
- 重启docker(慎用):
sudo systemctl restart docker
要注意,这个操作会把所有的docker服务无差别的重启,慎用
手动清理假死的docker服务
- 找到假死的docker服务:执行
docker ps
命令找到容器ID【CONTAINER_ID】 - 先尝试使用docker自带的命令停止容器:
docker stop 【CONTAINER_ID】
发现停不掉 - 手动查找docker目录下的容器信息
- docker默认目录:/var/lib/docker
- 所有docker容器的信息都挂载在/var/lib/docker/containers目录下
- 通过【CONTAINER_ID】找到该假死服务的目录
ll /var/lib/docker/containers | grep 【CONTAINER_ID】
cd /var/lib/docker/containers
- 删除该容器
rm -rf 目录名
这里删除可能会报下面的错误,因为你的容器还挂载了其他目录,信息如下: rm:无法删除"/var/lib/docker/containers/目录名/secrets":设备或资源忙无法删除"/var/lib/docker/containers/目录名/shm": 设备或资源忙
这个时候查一下容器对应的挂载目录
cat /proc/mounts |grep "docker" |grep "【CONTAINER_ID】"
然后先取消挂载
umount /data/sys/var/docker/containers/挂载目录/secretsumount /data/sys/var/docker/containers/挂载目录/shm
如果这一步 unmout 不了,可以尝试找到使用该目录的进程
lsof |grep "挂载目录"
如果有相关进程,记录相关的进程号直接 kill -9 进程号
ll /var/lib/docker/containers | grep 【CONTAINER_ID】
这个时候再重新执行删除目录命令
cd /var/lib/docker/containers
rm -rf 目录名
这个时候就可以删掉了
- 再次尝试通过docker的命令停止容器
docker stop 【CONTAINER_ID】
或
docker rm -f 【CONTAINER_ID】或docker kill --signal=SIGINT 【CONTAINER_ID】
如果还是无法停掉改服务,可以按如下步骤:
使用linux进程管理命令来结束容器进程
-
先找到该进程:
ps -ef | grep【CONTAINER_ID】
-
强制杀掉筛选出来的进程信息:
kill -9 PID
- 再次检查docker服务状态
docker ps
先可以看到该服务已经被干掉了。
如果说按照这个操作依然无法解决docker假死问题,那么我还是建议大家采用上面最粗暴的方式去解决,但是要注意,这个操作会把所有的docker服务无差别的重启。
书籍推荐
- 源自近200万学员热捧的Kubernetes实战课程
- 作者研究和实践容器技术超过10年历时三年精心打造,涵盖大量一线大厂实战项目
- 理论基础+命令详解+众多应用场景+企业级案例+自动化DevOps运维知识体系
书籍名称:《Kubernetes 从入门到DevOps企业应用实战》
内容介绍
本书作者从事容器技术方面的研究和实践已近十年,还是一位Kubernetes讲师和社区贡献者,其录制的Kubernetes视频课入选了工信部人才交流中心官方认证课程,本书是在总结多年来不断改进的视频课的基础上精心编撰而成,内容经过学员检验,值得依赖。
本书除介绍Kubernetes本身,还介绍了很多周边相关技术,比如,Jekins、CI\CD、Istio、Prommethues、Ingress、K3s等,有助于读者整合运用这些技术,真正解决生产实践中遇到的问题。
总之,这是一本理解兼备实践,注重实操的Kubernetes好书,期待读者从本书中收获多多。
适合人群
本书由浅入深,有趣有料,适合想提升代码编写水平的大学生、求职者、编程爱好者阅读,也适合有1~2年开发经验的程序员参考,还可以作为各类培训班的培训教材。
如何领书
————————————————
本次本篇文章送书 🔥2-3本 评论区抽2-3位小伙伴送书
📆 活动时间:截止到 2023-12-09 20:00:00
🎁抽奖方式:利用网络公开的在线抽奖工具进行抽奖
💡参与方式:关注、点赞、收藏,评论 “人生苦短,K8S超简单”
根据文章阅读量的多少来安排送书的本数。
————————————————
🔥 注:活动结束后,会私信中奖粉丝的,各位注意查看私信哦!
自主购买
小伙伴也可以访问链接进行自主购买哦~
直达京东购买链接🔗:《Kubernetes 从入门到DevOps企业应用实战》
最后
- 好看的灵魂千篇一律,有趣的鲲志一百六七!
- 如果觉得文章还不错的话,可以点赞+收藏+关注 支持一下,鲲志的主页 还有很多有趣的文章,欢迎小伙伴们前去点评
- 如果有什么需要改进的地方还请大佬指出❌