当前位置: 首页 > article >正文

SSH 服务器,防止链接断开,训练终止操作————screen

在训练模型时,尤其是在使用远程服务器或集群时,运行 screen 是一种非常实用的方式,特别是当你希望在训练过程中保持会话稳定、不被中断。下面是关于 screen 的一些基本介绍以及如何在训练模型前使用 screen

为什么使用 screen

  • 保持会话活跃:当你通过 SSH 连接到远程服务器时,如果连接断开,通常会导致所有运行中的程序(例如训练任务)被终止。使用 screen 可以在后台保持会话,即使 SSH 连接断开,任务依旧在运行。
  • 多任务切换screen 允许在同一个会话中同时运行多个任务,方便你在同一终端中处理多项工作。
  • 恢复会话:你可以随时断开 screen 会话并在以后重新连接,从而检查任务进度或执行新命令。

screen 的基本用法

1. 启动一个新的 screen 会话

在训练模型之前,先启动一个新的 screen 会话,这样即使你关闭了 SSH 连接,训练任务也会继续在后台运行。

screen -S my_training
2. 运行你的模型训练代码

启动 screen 会话后,你可以像平时一样运行模型训练代码。例如:

python train_model.py

 

3. 分离 screen 会话

你可以在不结束任务的情况下退出 screen 会话,任务将继续运行。要分离会话,可以使用以下快捷键:

Ctrl + A, D

 这将会退出 screen 会话并返回到普通的终端界面,但你的训练任务依旧在后台运行。

4. 恢复 screen 会话

如果你想重新连接到之前的 screen 会话,可以使用以下命令:

screen -r my_training
5. 查看所有的 screen 会话

如果你忘记了会话的名称,或者有多个会话在运行,可以用以下命令查看所有的会话:

screen -ls

 这将列出所有当前活跃的 screen 会话,你可以选择恢复到任意一个。

6. 关闭 screen 会话

如果训练完成并且你想结束会话,可以直接退出:

exit


http://www.kler.cn/a/311483.html

相关文章:

  • Qt初识简单使用Qt
  • 线性表-数组描述补充 迭代器(C++)
  • Android Profiler 内存分析
  • Elasticsearch中什么是倒排索引?
  • 自动驾驶为什么需要时间同步?高精度时间同步如何实现?
  • ModuleNotFoundError: No module named ‘_ssl‘ centos7中的Python报错
  • Elasticsearch 分片迁移与移除集群节点操作
  • POI生成Excel文件增加数据验证(下拉序列)
  • 获取多媒体相册的内容
  • WEB攻防-JavaWweb项目JWT身份攻击组件安全访问控制
  • Qt 菜单栏、工具栏、状态栏、标签、铆接部件(浮动窗口) 设置窗口核心部件(文本编辑控件)的基本使用
  • 代理模式-动态代理
  • Vue3:defineProps接收父组件传递的数据
  • java八股文之Redis
  • Git 分支规范
  • 【Redis】个人笔记
  • java项目之在线考试与学习交流网页平台源码(springboot)
  • Ruby-SAML CVE-2024-45409 漏洞解决方案
  • 【快速笔记】freeRTOS
  • Loki 分布式日志中心服务
  • Hive基本原理与数据开发
  • 唯徳知识产权管理系统 UploadFileWordTemplate 任意文件读取
  • 开源项目 GAN 漫画风格化 UGATIT
  • 如何借助项目管理系统实现审批流程的自动化与标准化?
  • 无人机 PX4 飞控 | EKF 使用传感器汇总与添加传感器方法
  • Photoshop使用方法大全