当前位置: 首页 > article >正文

华为昇腾910B1基于 LoRA 的 Qwen2.5-7B-Instruct 模型微调

目录

  • 系统环境
  • 虚拟环境
  • 微调模型
  • yaml文件
  • training_loss
  • training_eval_loss

系统环境

Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run
Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run
Ascend-cann-toolkit_8.0.RC3.alpha003_linux-aarch64.run
Ascend-cann-kernels-910b_8.0.RC3.alpha003_linux-aarch64.run

在这里插入图片描述

虚拟环境

默认已安装conda,git

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory/
conda create -y -n llamafactory python=3.10
conda activate llamafactory
pip install -e ".[torch-npu,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -e ".[deepspeed,modelscope]" -i https://pypi.tuna.tsinghua.edu.cn/simple
llamafactory-cli env

在这里插入图片描述

微调模型

export USE_MODELSCOPE_HUB=1
ASCEND_RT_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 llamafactory-cli train examples/train_lora/qwen2__5_lora_sft.yaml

yaml文件

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct
trust_remote_code: true

### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: q_proj,v_proj

### ddp
ddp_timeout: 180000000
deepspeed: examples/deepspeed/ds_z0_config.json

### dataset
dataset: alpaca_zh_demo
template: qwen
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16

### output
output_dir: saves/Qwen2.5-7B-Instruct/lora/sft
logging_steps: 10
save_steps: 1000
plot_loss: true
overwrite_output_dir: true

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 0.0001
num_train_epochs: 120
lr_scheduler_type: cosine
bf16: true

### eval
val_size: 0.1
per_device_eval_batch_size: 1
evaluation_strategy: steps
eval_steps: 500
    

training_loss

在这里插入图片描述

training_eval_loss

在这里插入图片描述


http://www.kler.cn/a/509396.html

相关文章:

  • 【人工智能】Python中的自动化机器学习(AutoML):如何使用TPOT优化模型选择
  • 【ArcGIS微课1000例】0140:总览(鹰眼)、放大镜、查看器的用法
  • 代码随想录算法训练营第三十五天-动态规划-01背包(二维)
  • 异步 HTTP 请求
  • Mybatis 进阶 / Mybatis—Puls (详细)
  • 【Linux】13.Linux进程概念(2)
  • 通过ffmpeg将FLV文件转换为MP4
  • DPIN与CESS Network达成全球战略合作,推动DePIN与AI领域创新突破
  • Redis可视化工具--RedisDesktopManager的安装
  • 考前64天 学习笔记 - 形成“习惯体系”进行最小启动
  • Docker(C/S架构软件)的介绍与使用、安装详解
  • mybatis学习(7/134)
  • x86_64编译ARM交叉编译LED汇编程序
  • 【物联网】keil仿真环境设置 keilV5可以适用ARM7
  • 深入了解Text2SQL开源项目(Chat2DB、SQL Chat 、Wren AI 、Vanna)
  • svn tag
  • 提示词的艺术----AI Prompt撰写指南(个人用)
  • 深入探索 Vue.js 组件开发中的最新技术:Teleport 和 Suspense 的使用
  • 飞牛os使用ddns-go配合华为云实现内网穿透
  • 开发神器之cursor
  • NLP DAY2: 文本数据处理(一部分)
  • 【postgres】sqlite格式如何导入postgres数据库
  • TY1801 反激变换器PWM GaN功率开关
  • uniapp --- 配置文件
  • 鸿蒙UI开发——键盘弹出避让模式设置
  • [javaWeb]初识Web