当前位置: 首页 > article >正文

使用LLaMA-Factory微调时的问题与解决方案记录

文章目录

    • 如何指定微调使用的显卡
    • 如何解决显卡通信导致的报错
    • 模型微调的实际epoch和step如何计算
    • 如何实现多卡全量微调
    • 模型微调后的结果如何查看
    • 模型测试后的指标如何理解

如何指定微调使用的显卡

启动网页时使用这种执行命令

CUDA_VISIBLE_DEVICES=5,6,7 llamafactory-cli webui

如何解决显卡通信导致的报错

训练时碰到了这种错误

 NotImplementedError: Using RTX 4000 series doesn't support faster communication broadband via P2P or IB. Please set `NCCL_P2P_DISABLE="1"` and `NCCL_IB_DISABLE="1" or use `accelerate launch` which will do this automatically.

启动


http://www.kler.cn/a/410580.html

相关文章:

  • .net 8使用hangfire实现库存同步任务
  • android-studio-4.2下载 、启动
  • python(四)os模块、sys模块
  • centos安装小火车
  • React(六)——Redux
  • 【C++笔记】数据结构进阶之二叉搜索树(BSTree)
  • Altium Designer学习笔记 16-20 PCB封装调用_3D封装_网表导入常见问题
  • 详解Qt之QtMath Qt数学类
  • seacms 远程命令执行 (CNVD-2020-22721)
  • 将django+vue项目发布部署到服务器
  • SpringBoot开发——Maven多模块工程最佳实践及详细示例
  • 图像处理学习笔记-20241118
  • 11.22 深度学习-pytorch自动微分
  • Android Configuration相关
  • 戴尔 AI Factory 上的 Agentic RAG 搭载 NVIDIA 和 Elasticsearch 向量数据库
  • 基于SpringBoot实现的民宿管理系统(代码+论文)
  • 11超全局变量php
  • 10、PyTorch autograd使用教程
  • redis的List底层数据结构 分别什么时候使用双向链表(Doubly Linked List)和压缩列表(ZipList)
  • Git(一)基本使用
  • 如何使用docker启动一个gitlab
  • 僵尸毁灭工程 服务搭建 联机教程 无需公网IP、服务器
  • fiddler抓包工具与requests库构建自动化报告
  • 第三十九章:Grafana 概述、Docker安装与验证指南
  • 【Linux】认识进程以及进程的状态
  • 非交换几何与黎曼ζ函数:数学中的一场革命性对话