当前位置：首页 > article >正文

llamafactory微调llama3.1

article 2025/2/21 13:55:49

LLaMA-Factory项目介绍

1.1 LLaMA-Factory的功能特点

LLaMA-Factory是一个专为微调大型语言模型（LLMs）设计的强大工具，它极大地简化了微调过程，使得即使是非专业人士也能轻松地对模型进行定制化调整。以下是LLaMA-Factory的几个核心功能特点：

用户友好的界面：LLaMA-Factory提供了一个直观的Web界面，用户可以通过简单的拖放操作和参数调整来配置微调任务，无需编写复杂的代码。
支持多种模型：该工具支持对超过100种不同的预训练模型进行微调，包括但不限于LLaMA、Mistral、Falcon等流行模型。
高效的微调算法：LLaMA-Factory集成了多种先进的微调技术，如DPO、ORPO、PPO和SFT，这些技术能够显著提升模型的性能和效率。
灵活的参数调整：用户可以根据具体需求调整各种微调参数，如学习率、批次大小、训练轮数等，以实现最佳的微调效果。
集成监控工具：LLaMA-Factory支持与TensorBoard、VanDB和MLflow等监控工具的集成，帮助用户实时跟踪微调过程中的模型表现。
快速推理支持：为了加速模型的推理过程，LLaMA-Factory还提供了对Gradio和CLI的支持，使得模型部署和使用更加便捷。

1.2 支持的微调方式

LLaMA-Factory不仅功能强大，而且支持多种微调方式，以满足不同用户的需求。以下是几种主要的微调方式：

监督式微调（SFT）：这是最常见的微调方式，通过提供标注好的数据集来调整模型的参数，使其更好地适应特定任务。
基于人类反馈的强化学习（RLHF）：这种方式结合了强化学习和人类反馈，通过迭代优化模型，使其生成更符合人类期望的输出。
低秩适应（LoRA）：LoRA是一种高效的微调技术，通过在模型的权重矩阵中引入低秩分解，可以在不显著增加计算成本的情况下实现模型的微调。
量化微调：量化微调通过减少模型权重的位数来降低模型的存储和计算需求，同时保持模型的性能。

LLaMA-Factory的这些功能特点和微调方式使其成为一个全面的工具，无论是对于初学者还是经验丰富的研究人员，都能提供极大的便利和灵活性。通过使用LLaMA-Factory，用户可以轻松地对LLaMA3等大型语言模型进行微调，以适应各种特定的应用场景。 ## 环境搭建

在开始使用LLaMA-Factory对LLaMA3模型进行微调之前，首先需要搭建一个合适的环境。这包括克隆项目、创建Python环境、安装核心工具以及启动WebUI界面。以下是详细的步骤指南。

2.1 克隆项目

首先，我们需要从GitHub上克隆LLaMA-Factory项目到本地。打开终端或命令行工具，执行以下命令：

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

这将创建一个名为LLaMA-Factory的文件夹，包含所有必要的代码和文件。

2.2 创建Python环境

为了确保环境的独立性和避免依赖冲突，建议使用conda创建一个新的Python环境。如果你还没有安装conda，可以从Anaconda官网下载并安装。

创建一个新的Python环境，并激活它：

conda create -n llama_factory python=3.10 -y
conda activate llama_factory

2.3 安装核心工具

在激活的环境中，安装LLaMA-Factory所需的核心工具，包括PyTorch、CUDA等。以下是安装命令：

conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install llmtuner

此外，还需要安装LLaMA-Factory项目特定的依赖：

cd LLaMA-Factory
pip install -e .[metrics,modelscope,qwen]
pip install -r requirements.txt --index-url https://mirrors.huaweicloud.com/repository/pypi/simple

2.4 启动WebUI界面

安装完成后，可以启动LLaMA-Factory的WebUI界面。首先，确保你已经下载了要微调的模型，并将其放置在合适的路径下。然后，运行以下命令启动WebUI：

python src/web_demo.py --model_name_or_path /path/to/your/model --template llama3 --infer_backend vllm --vllm_enforce_eager

其中，/path/to/your/model应替换为你下载的模型路径。如果一切正常，你将看到一个包含端口号的输出，例如localhost:7860。复制该地址到浏览器中打开，即可看到LLaMA-Factory的WebUI界面。

通过以上步骤，你已经成功搭建了LLaMA-Factory的环境，并可以开始进行模型的微调工作。下一节将介绍如何准备数据集，以便进行微调训练。 ## 数据准备

在LLaMA-Factory中进行模型微调之前，数据准备是一个至关重要的步骤。良好的数据集可以显著提升模型的性能和泛化能力。本节将详细介绍数据收集与预处理、数据集格式要求以及如何注册数据集。

3.1 数据收集与预处理

数据收集与预处理是确保模型训练质量的基础。以下是一些关键步骤和注意事项：

数据来源

公开数据集：可以从Kaggle、Hugging Face Datasets等平台获取公开数据集。
私有数据集：根据具体业务需求，收集和整理私有数据。

数据清洗

去重：去除重复数据，避免模型学习到重复信息。
去噪：去除噪声数据，如错误标签、不完整数据等。
标准化：统一数据格式，如统一文本编码、时间格式等。

数据增强

同义词替换：使用同义词替换部分词汇，增加数据的多样性。
随机插入：随机插入一些词汇或短语，增加数据的丰富性。
随机删除：随机删除一些词汇，模拟真实场景中的信息缺失。

数据分割

训练集：用于模型训练的主要数据集。
验证集：用于模型训练过程中的验证，调整超参数。
测试集：用于最终模型性能评估。

3.2 数据集格式要求

LLaMA-Factory对数据集格式有一定的要求，以下是一些常见的数据集格式示例：

JSON格式

[
    {
        "instruction": "将以下句子翻译成英文",
        "input": "今天天气很好",
        "output": "The weather is nice today"
    },
    {
        "instruction": "将以下句子翻译成英文",
        "input": "我喜欢吃苹果",
        "output": "I like to eat apples"
    }
]

CSV格式

instruction,input,output
将以下句子翻译成英文,今天天气很好,The weather is nice today
将以下句子翻译成英文,我喜欢吃苹果,I like to eat apples

文本格式

instruction: 将以下句子翻译成英文
input: 今天天气很好
output: The weather is nice today

instruction: 将以下句子翻译成英文
input: 我喜欢吃苹果
output: I like to eat apples

3.3 注册数据集

在LLaMA-Factory中，注册数据集是一个必要的步骤，以便在微调过程中正确加载和使用数据集。以下是注册数据集的步骤：

步骤1：准备数据集文件

确保数据集文件符合上述格式要求，并存储在合适的路径下。

步骤2：配置数据集路径

在LLaMA-Factory的配置文件中，指定数据集的路径。例如：

dataset:
  path: "/path/to/your/dataset.json"

步骤3：验证数据集

在启动微调训练之前，可以使用LLaMA-Factory提供的工具验证数据集格式是否正确。例如：

llamafactory-cli validate-dataset /path/to/your/dataset.json

步骤4：启动微调训练

在确认数据集无误后，可以启动微调训练：

llamafactory-cli train /path/to/your/config.yaml

通过以上步骤，您可以确保数据集正确加载并在微调过程中发挥作用。

总结

数据准备是LLaMA-Factory项目中模型微调的关键步骤。通过合理的数据收集与预处理、符合要求的数据集格式以及正确的数据集注册流程，可以确保模型训练的高效性和准确性。希望本节内容对您在使用LLaMA-Factory进行模型微调时有所帮助。 ## 模型微调

在LLaMA-Factory项目中，模型微调是一个关键步骤，它允许开发者根据特定需求调整预训练模型，以提高其在特定任务上的表现。本节将详细介绍如何准备模型、设置微调参数、开始微调训练以及进行模型对话测试。

4.1 准备模型

在进行模型微调之前，首先需要准备好预训练模型。以下是具体步骤：

4.1.1 下载预训练模型

LLaMA-Factory支持从Hugging Face和ModelScope下载模型。以Meta-Llama-3-8B-Instruct模型为例，可以通过以下命令下载：

# 从Hugging Face下载
git clone https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct

# 从ModelScope下载（适合中国大陆网络环境）
git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

4.1.2 模型文件校验

下载完成后，需要对模型文件进行校验，确保文件完整性。可以通过检查文件大小和数量是否与原始来源一致，并运行官方提供的推理demo来验证模型文件的正确性：

import transformers
import torch

# 切换到你下载的模型文件目录
model_id = "/path/to/downloaded/Meta-Llama-3-8B-Instruct"
pipeline = transformers.pipeline("text-generation", model=model_id, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto")

messages = [{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Who won the world series in 2020?"}]
prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
terminators = [pipeline.tokenizer.eos_token_id, pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")]
outputs = pipeline(prompt, max_new_tokens=256, eos_token_id=terminators, do_sample=True, temperature=0.6, top_p=0.9)
print(outputs[0]["generated_text"][len(prompt):])

4.2 设置微调参数

在准备好模型之后，接下来需要设置微调参数。LLaMA-Factory提供了丰富的参数配置选项，以便用户可以根据具体需求进行微调。以下是一些关键参数的设置：

4.2.1 选择微调策略

LLaMA-Factory支持多种微调策略，如LoRA（Low-Rank Adaptation）和全参数微调。根据任务需求选择合适的微调策略：

# 示例：选择LoRA微调策略
fine_tune_strategy: LoRA

4.2.2 设置训练参数

包括学习率、批量大小、训练轮数等。这些参数将直接影响模型的训练效果：

# 示例：设置训练参数
learning_rate: 0.0001
batch_size: 8
num_epochs: 3

4.2.3 选择优化器

选择合适的优化器可以提高训练效率和模型性能：

# 示例：选择Adam优化器
optimizer: Adam

4.3 开始微调训练

在完成模型准备和参数设置后，可以开始进行微调训练。以下是开始微调训练的步骤：

4.3.1 启动训练

在WebUI界面中，找到训练启动按钮并点击开始训练：

# 示例：启动训练命令
python src/train.py --config config/fine_tune_config.yaml

4.3.2 监控训练过程

训练过程中，可以在WebUI界面中实时查看训练日志和损失变化曲线，以便及时调整训练参数：

4.3.3 训练完成

训练完成后，模型会自动保存到指定的路径。

4.4 模型对话测试

微调训练完成后，需要对模型进行对话测试，以评估模型的实际效果。以下是模型对话测试的步骤：

4.4.1 加载微调后的模型

在WebUI界面中加载微调后的模型：

# 示例：加载微调后的模型
python src/load_model.py --model_path /path/to/fine_tuned_model

4.4.2 进行对话测试

在WebUI界面中输入测试问题，观察模型的回答质量：

# 示例：进行对话测试
python src/chat.py --model_path /path/to/fine_tuned_model

4.4.3 评估模型性能

根据对话测试的结果，评估模型的性能，并根据需要进行进一步的优化。

通过以上步骤，你可以在LLaMA-Factory中完成模型的微调、训练和测试，从而得到一个性能优良的微调模型。 ## 模型量化和转换

在完成模型的微调训练之后，为了进一步优化模型的性能和部署效率，通常需要进行模型的量化和转换。这一过程包括合并模型、模型量化说明以及测试训练结果。以下是详细的步骤和说明。

5.1 合并模型

合并模型是将微调后的模型与原始模型进行合并，生成一个最终的模型文件。这一步骤对于后续的模型量化和部署至关重要。

5.1.1 合并模型的步骤

准备原始模型和微调模型：
- 确保你已经下载了原始的LLaMA3模型，并且完成了微调训练，生成了微调后的模型文件。
使用LLaMA-Factory进行模型合并：
- LLaMA-Factory提供了一个简便的方法来合并模型。你可以使用以下命令来执行模型合并：
```
python src/merge_models.py --base_model path/to/base_model --tuned_model path/to/tuned_model --output_model path/to/output_model
```
- 其中，--base_model参数指定原始模型的路径，--tuned_model参数指定微调后模型的路径，--output_model参数指定输出合并后模型的路径。
检查合并后的模型：
- 合并完成后，你可以在指定的输出路径下找到合并后的模型文件。确保文件存在且完整。

5.2 模型量化说明

模型量化是通过降低模型权重的精度来减少模型的大小和推理时间。LLaMA-Factory支持多种量化方法，包括INT8、INT4等。

5.2.1 量化的好处

减少模型大小：量化后的模型文件通常比原始模型小很多，便于存储和传输。
提高推理速度：量化可以减少计算量，从而提高模型在设备上的推理速度。
降低资源占用：量化后的模型在运行时占用的内存更少，适合在资源受限的设备上部署。

5.2.2 量化方法的选择

INT8量化：适用于对精度要求不高的场景，可以显著减小模型大小并提高推理速度。
INT4量化：在保持较高精度的同时，进一步减小模型大小，适用于对精度有一定要求的场景。

5.2.3 使用LLaMA-Factory进行量化

LLaMA-Factory提供了一个简单的命令行工具来完成模型量化。以下是使用INT8量化方法的命令示例：

python src/quantize_model.py --model path/to/merged_model --output_model path/to/quantized_model --quantization int8

其中，--model参数指定合并后的模型路径，--output_model参数指定量化后模型的输出路径，--quantization参数指定量化方法。

5.3 测试训练结果

在完成模型合并和量化之后，需要对训练结果进行测试，确保模型的性能和准确性符合预期。

5.3.1 测试数据准备

准备一组测试数据，用于评估模型的性能。
测试数据应涵盖各种场景和情况，以全面评估模型的表现。

5.3.2 测试步骤

加载量化后的模型：
- 使用模型加载工具加载量化后的模型。
进行测试：
- 使用测试数据对模型进行推理，记录模型的输出结果。
- 对比模型的输出结果和预期结果，评估模型的准确性和性能。
分析测试结果：
- 分析测试结果，识别模型在不同场景下的表现。
- 根据测试结果，调整模型参数或优化模型结构，以提高模型的性能。

通过以上步骤，可以全面评估模型的性能和准确性，确保模型在实际应用中能够达到预期的效果。

总结

通过LLaMA-Factory提供的工具和方法，我们可以方便地对微调后的模型进行合并和量化，从而提高模型的推理速度和减少内存占用。在完成这些步骤之后，通过测试可以确保模型在实际应用中的性能符合预期。这些步骤不仅适用于LLaMA3模型，也适用于其他支持的模型，为大规模语言模型的优化和部署提供了强大的支持。 ## 模型部署与评估

在完成模型的微调之后，下一步是将模型部署到实际环境中，并对其性能进行评估和优化。这一部分将详细介绍如何进行模型部署、结果评估以及性能优化。

6.1 模型部署

模型部署是将训练好的模型集成到应用程序或服务中的过程。以下是使用LLaMA-Factory进行模型部署的基本步骤：

6.1.1 导出微调后的模型

在LLaMA-Factory中，微调后的模型通常会保存在指定的检查点目录中。首先，需要将这些检查点导出为一个可部署的模型格式。具体步骤如下：

选择导出格式：根据部署环境的需求，选择合适的模型导出格式。常见的格式包括PyTorch的.pth文件、ONNX格式等。
执行导出命令：使用LLaMA-Factory提供的导出工具，将检查点转换为选定的格式。例如，使用以下命令导出为ONNX格式：
```
python export_model.py --checkpoint_dir /path/to/checkpoint --output_dir /path/to/output --format onnx
```

6.1.2 部署模型

导出模型后，下一步是将其部署到目标环境中。根据部署环境的不同，具体步骤会有所差异。以下是一些常见的部署方式：

本地部署：将模型加载到本地服务器或开发环境中，通过API接口提供服务。可以使用Flask、FastAPI等框架搭建API服务。
云端部署：将模型部署到云服务提供商（如AWS、Azure、Google Cloud等），利用云平台的弹性计算资源提供模型服务。
边缘部署：在边缘设备（如嵌入式系统、移动设备）上部署模型，实现低延迟的推理服务。

6.2 结果评估

模型部署后，需要对其进行评估，以确保其在实际应用中的性能和效果。评估过程通常包括以下几个方面：

6.2.1 准确性评估

使用预留的测试数据集，评估模型的准确性。常见的评估指标包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1分数等。可以使用LLaMA-Factory提供的评估工具进行评估：

python evaluate.py --model_path /path/to/deployed_model --test_data /path/to/test_dataset

6.2.2 鲁棒性测试

除了准确性评估，还需要测试模型在不同场景和数据分布下的鲁棒性。可以通过以下方式进行鲁棒性测试：

对抗样本测试：生成对抗样本，测试模型在面对恶意攻击时的表现。
数据分布变化测试：改变测试数据集的数据分布，测试模型在不同数据分布下的表现。

6.3 性能测试与优化

在模型部署和评估过程中，性能测试和优化是至关重要的环节。以下是一些常见的性能测试和优化方法：

6.3.1 性能测试

性能测试主要关注模型的推理速度和资源消耗。可以使用以下工具和方法进行性能测试：

推理时间测试：测量模型单次推理的耗时，评估其响应速度。
吞吐量测试：测试模型在多用户并发请求下的吞吐量，评估其处理能力。
资源消耗测试：监测模型运行时的CPU、内存、GPU等资源消耗情况。

6.3.2 性能优化

根据性能测试结果，可以采取以下优化措施：

模型量化：通过减少模型权重的精度，降低模型大小和推理时间。LLaMA-Factory支持多种量化方法，如INT8量化、FP16量化等。
推理加速：使用TensorRT、ONNX Runtime等推理加速库，提高模型的推理速度。
并行处理：利用多线程或多进程技术，提高模型的并发处理能力。
硬件优化：升级硬件设备，如使用更高性能的GPU或增加GPU数量，提升模型的计算能力。

通过以上步骤，可以确保微调后的LLaMA3模型在实际应用中具有良好的性能和效果，满足不同场景的需求。 ## 实践案例与参考

在掌握了LLaMA-Factory的基本使用方法和微调流程后，通过实际案例的学习可以进一步加深理解和应用能力。本节将介绍两个具体的实战教程，以及如何利用社区资源来提升自己的微调技能。

7.1 LLaMA-Factory多卡微调的实战教程

多卡微调是提升训练效率和模型性能的重要手段。以下是使用LLaMA-Factory进行多卡微调的详细步骤：

环境准备

首先，确保你的环境中安装了支持多GPU的PyTorch版本，并且LLaMA-Factory也支持分布式训练。

# 安装支持多GPU的PyTorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

配置文件调整

在配置文件中，需要指定使用多GPU进行训练。以下是一个示例配置：

{
  "stage": "sft",
  "do_train": true,
  "model_name_or_path": "unsloth/llama-3-8b-Instruct-bnb-4bit",
  "dataset": "identity,alpaca_gpt4_en",
  "template": "llama3",
  "finetuning_type": "lora",
  "lora_target": "all",
  "output_dir": "llama3_lora",
  "per_device_train_batch_size": 2,
  "gradient_accumulation_steps": 4,
  "lr_scheduler_type": "cosine",
  "logging_steps": 10,
  "warmup_ratio": 0.1,
  "save_steps": 1000,
  "learning_rate": 5e-5,
  "num_train_epochs": 3.0,
  "max_samples": 500,
  "max_grad_norm": 1.0,
  "quantization_bit": 4,
  "use_unsloth": true,
  "fp16": true,
  "n_gpu": 2  # 指定使用2个GPU
}

启动训练

使用以下命令启动多卡训练：

!llamafactory-cli train train_llama3_multi_gpu.json --n_gpu 2

监控与调试

在训练过程中，可以使用TensorBoard等工具监控训练进度和性能。

tensorboard --logdir=llama3_lora

7.2 使用LLaMA-Factory微调ChatGLM3

ChatGLM3是另一个流行的大语言模型，LLaMA-Factory也支持对其进行微调。以下是具体步骤：

准备数据

首先，准备用于微调的数据集。数据集应包含对话历史和相应的回复。

[
  {
    "history": ["你好", "你好，有什么可以帮助你的吗？"],
    "response": "我想了解一些关于微调的知识。"
  },
  {
    "history": ["微调是什么？"],
    "response": "微调是指在预训练模型的基础上，使用特定任务的数据集进行进一步训练，以适应特定任务的需求。"
  }
]

配置文件调整

在配置文件中，需要指定使用ChatGLM3模型进行微调。以下是一个示例配置：

{
  "stage": "sft",
  "do_train": true,
  "model_name_or_path": "chatglm3",
  "dataset": "chatglm3_dataset",
  "template": "chatglm3",
  "finetuning_type": "lora",
  "lora_target": "all",
  "output_dir": "chatglm3_lora",
  "per_device_train_batch_size": 2,
  "gradient_accumulation_steps": 4,
  "lr_scheduler_type": "cosine",
  "logging_steps": 10,
  "warmup_ratio": 0.1,
  "save_steps": 1000,
  "learning_rate": 5e-5,
  "num_train_epochs": 3.0,
  "max_samples": 500,
  "max_grad_norm": 1.0,
  "quantization_bit": 4,
  "use_unsloth": true,
  "fp16": true
}

启动训练

使用以下命令启动微调训练：

!llamafactory-cli train train_chatglm3.json

监控与调试

在训练过程中，可以使用TensorBoard等工具监控训练进度和性能。

tensorboard --logdir=chatglm3_lora

查看全文

http://www.kler.cn/a/292350.html

2024 数学建模高教社杯国赛（A题）| “板凳龙”舞龙队 | 建模秘籍文章代码思路大全

本地 springboot 项目如何使用 https 进行访问

Java项目：141 springboot大学生智能消费记账系统的设计与实现

拥抱分布式云：云基础设施的下个新时代

目标检测-YOLOv1

IDEA运行Java程序提示“java: 警告: 源发行版 11 需要目标发行版 11”

java项目热部署

蚂蚁SEO｜AI养站程序是什么｜蚂蚁蜘蛛池

职场关系课：职场上的基本原则（安全原则、进步原则、收益原则、逃生舱原则）

【Godot4.3】CanvasShape资源化改造

ChatGPT付费创作系统V3.0.6独立版 WEB+H5+小程序端（新增AI全网搜索+文档解析+豆包AI通道）安装部署教程

专访｜“技术+市场”双轮驱动，积鼎科技如何打造国产CFD流体仿真软件标杆品牌？

WPS中JS宏使用说明（持续优化...）

Flutter中添加崩溃分析

【云原生•容器】Docker架构剖析，它还是从前那个Docker吗？(上)

记录Java秋招面经（网上找的）

江协科技STM32学习- P11 中断系统，EXTI外部中断

Java项目：139 springboot基于SpringBoot的论坛系统设计与实现

SpringBoot开发——整合Logbook进行HTTP API请求响应日志输出

【算法分享】双向长短期记忆（BiLSTM）及长短期记忆 (LSTM)网络详细文档

LLaMA-Factory项目介绍

1.1 LLaMA-Factory的功能特点

1.2 支持的微调方式

2.1 克隆项目

2.2 创建Python环境

2.3 安装核心工具

2.4 启动WebUI界面

3.1 数据收集与预处理

数据来源

数据清洗

数据增强

数据分割

3.2 数据集格式要求

JSON格式

CSV格式

文本格式

3.3 注册数据集

步骤1：准备数据集文件

步骤2：配置数据集路径

步骤3：验证数据集

步骤4：启动微调训练

总结

4.1 准备模型

4.1.1 下载预训练模型

4.1.2 模型文件校验

4.2 设置微调参数

4.2.1 选择微调策略

4.2.2 设置训练参数

4.2.3 选择优化器

4.3 开始微调训练

4.3.1 启动训练

4.3.2 监控训练过程

4.3.3 训练完成

4.4 模型对话测试

4.4.1 加载微调后的模型

4.4.2 进行对话测试

4.4.3 评估模型性能

5.1 合并模型

5.1.1 合并模型的步骤

5.2 模型量化说明

5.2.1 量化的好处

5.2.2 量化方法的选择

5.2.3 使用LLaMA-Factory进行量化

5.3 测试训练结果

5.3.1 测试数据准备

5.3.2 测试步骤

总结

6.1 模型部署

6.1.1 导出微调后的模型

6.1.2 部署模型

6.2 结果评估

6.2.1 准确性评估

6.2.2 鲁棒性测试

6.3 性能测试与优化

6.3.1 性能测试

6.3.2 性能优化

7.1 LLaMA-Factory多卡微调的实战教程

环境准备

配置文件调整

启动训练

监控与调试

7.2 使用LLaMA-Factory微调ChatGLM3

准备数据

配置文件调整

启动训练

监控与调试

相关文章：