当前位置: 首页 > article >正文

[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

llama3-sft 提交脚本

#!/bin/bash

pip install transformers==4.41.2 -i https://mirrors.aliyun.com/pypi/simple/

pip install flash-attn==2.6.1 -i https://mirrors.aliyun.com/pypi/simple/

pip install tensorboard -i https://mirrors.aliyun.com/pypi/simple/

export NCCL_BLOCKING_WAIT=1
export NCCL_COMM_TIMEOUT=3600   # 将超时时长设置为3600秒(即1小时)
export WANDB_MODE=offline
export WANDB_SILENT=true

cd /LLaMA-Factory
python -m torch.distributed.run \
    --master_addr $MASTER_ADDR \
    --master_port $MASTER_PORT \
    --nproc_per_node $NPROC_PER_NODE \
    --nnodes $WORLD_SIZE \
    --node_rank $RANK \
    src/train.py \
    examples/full_multi_gpu/llama3p2_1B_part_sft_multi_TaskQueryTranslateEsFrPt.yaml

# llama3p2_1B_fu

http://www.kler.cn/news/355461.html

相关文章:

  • php strtr 函数的坑
  • Android二代抽取壳简易实现和踩坑记录
  • <Linux> 线程池
  • vue项目中使用websocket
  • MAC地址漂移实验
  • 【ShuQiHere】智慧城市(Smart City)全面指南:AI如何重塑城市生活 ️
  • [图形学]蒙特卡洛积分方法介绍及其方差计算
  • AcWing 3817:数组 ← 贪心算法
  • JavaWeb 23.NPM配置和使用
  • HTML5教程(四) - 结构标签
  • git+cmake将Open3D配置到visual studio
  • Android中 tools:text 和 android:text区别
  • Java JDK的面试题
  • Redis基础篇(含redis在linux环境下的安装教程,以及用docker安装redis的教程)
  • 【Linux驱动开发】嵌入式Linux驱动开发基本步骤,字符设备开发入门,点亮LED
  • Python知识梳理总结思维导图
  • SpringBoot实现的物流优化策略
  • 笔记整理—linux网络部分(2)Linux网络框架
  • 如何成为 Rust 核心贡献者?Rust 开发的核​​心是什么?Rust 重要技术专家揭秘
  • Redis登录校验