当前位置：首页 > article >正文

Llama微调以及Ollama部署

article 2025/2/21 3:12:23

1 Llama微调

在基础模型的基础上，通过一些特定的数据集，将具有特定功能加在原有的模型上。

1.1 效果对比

特定数据集
未使用微调的基础模型的回答
使用微调后的回答

1.2 基础模型

基础大模型我选择Mistral-7B-v0.3-Chinese-Chat-uncensored，
模型文件可以在HuggingFace 模型

1.3 选择数据集

微调大模型要想获得比较好的效果，拥有高质量的数据集是关键。可以选择用网上开源的，或者是自己制作。以中文数据集弱智吧为例，约1500条对话数据，数据集可以从HuggingFace 数据集

1.4 训练lora模型并与基础模型进行合并

新建一个merge.py文件，将基础模型和lora模型合并为一个新的模型文件

执行merge.py，需要传入的参数（改成自己的）：
--base_model
基础模型路径
--lora_model
微调的lora模型路径
--output_dir
合并后模型的输出路径

1.5 量化模型

利用llama.cpp进行量化模型.

1.安装CMAKE下载llama.cpp源码
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
2.安装依赖
pip install -r requirements/requirements-convert-hf-to-gguf.txt
cmake -B build
cmake --build build --config Release
3.执行转换脚本，将safetensors转换为gguf文件，便于量化
convert-hf-to-gguf.py 合并后模型的位置 --outtype f16 --outfile 转换后模型的位置my_llama3.gguf
4.对转后的文件进行量化操作。
llama.cpp所在位置\llama.cpp\build\bin\Release quantize.exe 转换后模型的路径量化后模型的位置quantized_model.gguf q4_0

至此，llama微调后的模型操作完毕，可以直接使用。

2.Ollama部署

Ollama安装地址

2.1 部署现有的模型

在这里插入图片描述
打开Ollama，找到目录中现有的模型，使用ollama run llama3.2，来使用现有模型。

2.2 使用微调模型

1.在上述已量化好的模型quantized_model.gguf的目录中新建Modelfile文件

FROM 量化好的模型路径
TEMPLATE "[INST] {{ .Prompt }} [/INST]"

2.使用微调模型

# ollama create 模型名字 -f Modelfile文件路径
ollama create panda -f  test.Modelfile

查看全文

http://www.kler.cn/a/326847.html

阿里云k8s如何创建可用的api token

腾讯云SDK产品优势

4.2.1 通过DTS传递物理中断号给Linux

全面指南：探索并实施解决Windows系统中“mfc140u.dll丢失”的解决方法

NAND Flash虚拟层坏块管理机制

python爬虫案例——抓取链家租房信息（8）

Solaris11.4配置远程桌面登录

STM32 软件触发ADC采集

基于MATLAB的苹果外观特征检测

【计算机网络 - 基础问题】每日 3 题（二十六）

针对考研的C语言学习（定制化快速掌握重点4）

IDEA几大常用AI插件

Splashtop 加入 Microsoft 智能安全协会

VBA解除Excel工作表保护

浅析Android中的View事件分发机制

19.2 编写dockerfile和k8s yaml

迁移学习案例-python代码

Redis一些简单通用命令认识常用数据类型和编码方式认识Redis单线程模型

OJ题之单链表排序

智慧城市运营模式--联合公司运营