当前位置: 首页 > article >正文

通过LlaMA-Factory导出的模型部署到Ollama

LlaMA-Factory导出的模型转换格式
仓库地址:https://github.com/ggerganov/llama.cpp

git clone仓库之后,下载相关依赖:

cd /opt/gl/llama.cpp-master/llama.cpp-master
pip install -r requirements.txt

转换大模型格式
转换为gguf格式

 python convert_hf_to_gguf.py /opt/gl/model/lin_model --outfile /opt/gl/model/lin_model.gguf --outtype q8_0

创建ModelFile文件

FROM D:\ollama\models\lin_model\lin_model.gguf

添加自定义模型

ollama create lin_model -f D:\ollama\models\lin_model\ModelFile

查看本地模型
在这里插入图片描述
运行本地大模型

ollama run lin_model:latest

http://www.kler.cn/a/500681.html

相关文章:

  • DELTA并联机械手视觉方案荣获2024年度机器人应用典型案例奖
  • 2025-1-9 QT 使用 QXlsx库 读取 .xlsx 文件 —— 导入 QXlsx库以及读取 .xlsx 的源码 实践出真知,你我共勉
  • django基于Python的电影推荐系统
  • MySQL的增删改查(基础)-下篇
  • 利用 Java 爬虫获取淘宝商品详情 API 接口
  • spark汇总
  • Springboot3.4整合jsp
  • 通信与网络安全之网络连接
  • 【pycharm发现找不到python打包工具,且无法下载】
  • nginx反向代理及负载均衡
  • EdgeOne安全专项实践:上传文件漏洞攻击详解与防范措施
  • 保证Mysql数据库到ES的数据一致性的解决方案
  • SpringMVC根据url校验权限,防止垂直越权
  • Leetcode 3418. Maximum Amount of Money Robot Can Earn
  • 23_Spring Boot中Redis缓存实现
  • web服务器快速目录搜索遍历工具推荐:Dirsearch
  • 正向传播和反向传播的理解
  • 页面滚动下拉时,元素变为fixed浮动,上拉到顶部时恢复原状,js代码以视频示例
  • 2025华数杯国际赛A题完整论文讲解(含每一问python代码+数据+可视化图)
  • Scratch编程:点燃编程学习热情的火种
  • ElasticsearchJavaClient工具类分享
  • Ubuntu 磁盘修复
  • 图像处理中实现 C++ 和 Python 的高效通信——Boost.Interprocess mmap