当前位置: 首页 > article >正文

基于LLaMA完成第一个微调

一、LLaMA Factory 简介

img

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调。

# LLaMA Factory 访问地址
https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md

二、LLaMA Factory 搭建

1、下载工程代码

git clone https://github.com/hiyouga/LLaMA-Factory.git

2、创建Conda 环境

# 本机需要提前安装号conda 或者miniconda的环境
# 官方是以python=3.10为基础搭建
conda create -n llama_factory python=3.10
conda activate llama_factory

3、安装LLaMA

# 安装LLaMA-Factory 所需要的第三方基础库(requirements.txt包含的库)
# 安装评估指标所需要的库,包含nltk, jieba, rouge-chinese
# 安装LLaMA-Factory本身,然后在系统中生成一个命令 llamafactory-cli
cd LLaMA-Factory
pip install -e '.[torch,metrics]'

备注,当使用清华源安装时候,默认会安装成torch的cpu版本。本文提供另外的两种方式进行搭建。

# 方案一:
# 在清华源镜像里找到对应的安装包
# https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
pytorch-2.2.2-py3.10_cuda11.8_cudnn8_0.tar.bz2
torchaudio-2.2.2-py310_cu118.tar.bz2
torchvision-0.18.0-py310_cu118.tar.bz2

# 安装
conda install --offline {your_path}.tar.bz2

# 方案二:
# 根据自己nvidia-smi的cuda版本去pytorch官网找对应的下载指令
# https://pytorch.org/get-started/previous-versions/
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia

# 安装完pytorch后,需要匹配Pillow 版本
pip uninstall Pillow
pip install Pillow==11.0.0

# 把环境搭建好以后,最后在执行
cd LLaMA-Factory
pip install -e '.[torch,metrics]'

4、环境验证
pytorch 的环境验证

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__

LLaMA 的环境验证

llamafactory-cli train -h

三、模型推理
1、下载本地模型

# 推荐使用huggingface、modelscope 下载模型
# 以modelscope 为例(不推荐git)
from modelscope import snapshot_download
model_dir = snapshot_download('LLM-Research/Meta-Llama-3-8B-Instruct')

2、使用LLaMA自带的ChatBot推理页面, 帮助做模型效果的测试

# 方法一:
# CUDA_VISIBLE_DEVICES=0 是指定程序使用第0张卡,可以不加
CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat 
--model_name_or_path ./model/Meta-Llama-3-8B-Instruct  
--template llama3

# 方法二:
# 修改examples/inference/llama3.yaml 文件model_name_or_path
llamafactory-cli webchat examples/inference/llama3.yaml

# 访问地址
http://localhost:7860/

3、使用API的方式启动模型

# api的方式启动,方便Fastgpt 等应用的接入
# 端口号在api.py中设置
python src/api.py --model_name_or_path model/Meta-Llama-3-8B-Instruct --template llama3

# 服务的方式启动
nohup bash -c "python src/api.py --model_name_or_path model/Meta-Llama-3-8B-Instruct --template llama3" > logs/output_llama3.log 2>&1 &

四、模型微调

1、修改数据集样本

# 以官方提供的identity.json 数据集为例
sed -i 's/{{name}}/PonyBot/g'  data/identity.json 
sed -i 's/{{author}}/LLaMA Factory/g'  data/identity.json

2、基于LoRA的sft指令微调

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
    --stage sft \
    --do_train \
    --model_name_or_path ./model/Meta-Llama-3-8B-Instruct \
    --dataset alpaca_zh_demo,identity \
    --dataset_dir ./data \
    --template llama3 \
    --finetuning_type lora \
    --output_dir ./saves/LLaMA3-8B/lora/sft \
    --overwrite_cache \
    --overwrite_output_dir \
    --cutoff_len 1024 \
    --preprocessing_num_workers 16 \
    --per_device_train_batch_size 2 \
    --per_device_eval_batch_size 1 \
    --gradient_accumulation_steps 8 \
    --lr_scheduler_type cosine \
    --logging_steps 50 \
    --warmup_steps 20 \
    --save_steps 100 \
    --eval_steps 50 \
    --evaluation_strategy steps \
    --load_best_model_at_end \
    --learning_rate 5e-5 \
    --num_train_epochs 5.0 \
    --max_samples 1000 \
    --val_size 0.1 \
    --plot_loss \
    --fp16

3、通过ChatBot推理页面验证效果

llamafactory-cli webchat  --model_name_or_path ./model/Meta-Llama-3-8B-Instruct  
--adapter_name_or_path ./saves/LLaMA3-8B/lora/sft  
--template llama3  
--finetuning_type lora

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。


http://www.kler.cn/a/410651.html

相关文章:

  • Python办公自动化案例:将演示文稿批量导出为图片和PDF文件
  • Leetcode207. 课程表(HOT100)
  • 使用go实现流式输出
  • Linux应用编程(C语言编译过程)
  • uni-app 发布媒介功能(自由选择媒介类型的内容) 设计
  • 【npm设置代理-解决npm网络连接error network失败问题】
  • skywalking es查询整理
  • 【Axure高保真原型】或和且条件
  • 两个docker之间的服务相互访问
  • 初学 flutter 环境变量配置
  • node报错:Error: Cannot find module ‘express‘
  • sklearn中常用数据集简介
  • 深度学习之图像分割
  • 【R语言管理】Pycharm配置R语言及使用Anaconda管理R语言虚拟环境
  • 裸金属服务器能够帮助企业解决哪些问题?
  • 【Java】二叉树:数据海洋中灯塔式结构探秘(上)
  • Hive的基础函数-日期函数
  • 【从经典到最新】28种信号分解方法,EMD类,VMD类,小波类,FMD、多元分解等(附matlab代码)
  • HDMI转VGA方案 LT8612UX(HDMI2.0) LT8612SX LT8511EX LT8522EX LT8612EX_e(HDMI1.4)
  • 企业数字化转型现状
  • 学习日志016--python实现双向循环列表与链栈
  • 软件测试丨Python语法与数据结构
  • C++【面试重要题目】 只出现一次的数字的集合.
  • git推送报错443
  • 从零开始:NetBox 4.1 Docker 部署和升级
  • 嵌入式的C/C++:深入理解 static、const 与 volatile 的用法与特点