当前位置: 首页 > article >正文

LlamaFactory部署及模型微调【win10环境】

在这里插入图片描述

1.Llama-Factory简介

LLaMA-Factory,全称 Large Language Model Factory,旨在简化大模型的微调过程,帮助开发者快速适应特定任务需求,提升模型表现。它支持多种预训练模型和微调算法,适用于智能客服、语音识别、机器翻译等多种应用场景。

2.Llama-Factory部署

2.1.git克隆项目

git clone https://github.com/hiyouga/LLaMA-Factory

2.2.基础模块安装

pip install -e ".[torch,metrics]" -i  https://mirrors.aliyun.com/pypi/simple/

在这里插入图片描述

2.3.开启量化

pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl

2.4.开启FlashAttention-2

如果要在 Windows 平台上开启 FlashAttention-2,需要安装预编译的 flash-attn 库,支持 CUDA 12.1 到 12.2,请根据需求到 flash-attention 下载对应版本安装。

 pip install F:\11-X-AGI\python-whl\flash_attn-2.7.1.post1+cu124torch2.3.1cxx11abiFALSE-cp310-cp310-win_amd64.whl

2.5.torch版本不匹配问题解决

pip uninstall torch torchvision torchaudio -y
pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

2.6.验证torch是否可用

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__
print(torch.cuda.is_available())

3.下载模型

https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B/tree/main
在这里插入图片描述
模型文件放置到你可以找到的目录即可

4.启动web-ui

python webui.py

在这里插入图片描述

5.训练模型初体验

界面操作比较简单,选择模型、选择数据集、开始训练
在这里插入图片描述
在这里插入图片描述
微调模型的评估、保存、挂载等操作都是界面上显而易见的操作,不再赘述。


http://www.kler.cn/a/611267.html

相关文章:

  • 如何分析和解决服务器的僵尸进程问题
  • Spring Boot 连接 MySQL 配置参数详解
  • 使用ucharts写的小程序,然后让圆环中间的空白位置变大
  • Django之旅:第六节--mysql数据库操作增删改查(二)
  • 网络编程和计算机网络五层模型的关系
  • 日语Learn,英语再认识(4)
  • Docker 数据卷与文件挂载
  • pyqt SQL Server 数据库查询-优化
  • 根据模板将 Excel 明细数据生成 PDF 文档 | PDF实现邮件合并功能
  • MyBatis打印SQL日志的配置
  • 英伟达黄仁勋谈人工智能趋势,首提代理式AI,后续机器人将登场
  • 算法及数据结构系列 - 滑动窗口
  • SpringCloud微服务框架搭建指南
  • 图解AI对话系统架构:一次讲透核心技术
  • 使用 HBuilder 打包 ruoyi-mall-uniapp 并在微信开发者工具中模拟运行的教程
  • SQL Optimization
  • Linux系统perf命令使用介绍,如何用此命令进行程序热点诊断和性能优化
  • rocky linux 与centos系统的区别
  • 机器学习——欧式距离、闵氏距离、马氏距离、曼哈顿距离、切比雪夫距离(自用)
  • 哪个进程通信效率高