当前位置: 首页 > article >正文

远程服务器训练模型,使用tmux防止训练终止

我们在远程服务器训练模型时,如果本地机因为某些原因导致ssh连接断开,那么远程服务器上正在跑模型的进程也可能会终止。此时可以尝试使用tmux来防止因ssh连接断开而导致的进程终止。

步骤:

  1. ubuntu上安装tmux:sudo apt-get install tmux
  2. 启动一个tmux会话:tmux new-session -s [自定义会话名称,比如我的叫experiment_session],那就是tmux new-session -s experiment_session
  3. 列出所有的tmux会话:tmux ls
  4. 在tmux中运行脚本:./experiment.sh
  5. 退出当前tmux会话,但保持脚本运行:按下 Ctrl + b,然后松开后按 d,这将从当前会话中分离出来。此时,脚本仍会在后台运行。
  6. 返回tmux会话:tmux new-session -s [定义的会话名称,比如我的叫experiment_session],那就是tmux attach-session -t experiment_session

http://www.kler.cn/a/463698.html

相关文章:

  • ​​​​​​​CDP集群安全指南系列文章导读
  • 每天40分玩转Django:Django Celery
  • DepthLab: From Partial to Complete 论文解读
  • 无线AP安装注意事项
  • 第R3周:RNN-心脏病预测
  • parquet文件数据格式介绍以及python pandas对parquet常见操作
  • Go语言方法和接收器类型详解
  • vue3配置测试环境、开发环境、生产环境
  • UNI-APP_i18n国际化引入
  • 无人机技术突飞猛进,超大集群飞行技术详解
  • http报头解析
  • 爬虫与反爬虫实现全流程
  • STM32-I2C通信
  • 安装PostgreSQL后的初始化操作
  • 浏览器--解决页面没刷新的问题(清除所有缓存)
  • 【从零开始入门unity游戏开发之——C#篇35】C#自定义类实现Sort自定义排序
  • net core程序部署到 iis 出现跨域问题
  • Spring Boot JPA Oracle 最佳实践 20 条
  • 《迁移学习与联邦学习:推动人工智能发展的关键力量》
  • APP怎么抓取原生日志 - Android篇
  • springboot3.X 无法解析parameter参数问题
  • vue.js scoped样式冲突
  • 【mediapipe】实现卷腹运动识别(视频或摄像头)并计数
  • html 音频和视频组件
  • Kubernetes Gateway API-3-TLS配置
  • CES Asia 2025:助力新型城市基础设施建设,展现智慧城市科技魅力