当前位置：首页 > article >正文

Ollama 运行从 ModelScope 下载的 GGUF 格式的模型

article 2025/3/19 17:51:07

本文系统环境

Windows 10

Ollama 0.5.7

Ollama 是什么？

Ollama 可以让你快速集成和部署本地 AI 模型。它支持各种不同的 AI 模型，并允许用户通过简单的 API 进行调用

Ollama 的安装

Ollama 官网有其下载及安装方法，非常简便

但如果希望不占用系统盘大量空间，可以参考 Ollama Windows 文档这样安装

1. 把 Ollama 安装到其它磁盘

命令行定位到 Ollama 安装包 OllamaSetup.exe 的目录下，运行如下命令，指定你希望的安装目录

OllamaSetup.exe /DIR="D:\Program Files\Ollama"

2. 更改 Ollama 的模型存放位置

Ollama 后续下载安装的模型默认存放在系统盘，会非常占用位置

设置 OLLAMA_MODELS 系统变量，指定希望的模型存放目录

设置完后，如果 Ollama 服务已在运行，要重启一下 Ollama 服务方能生效

从 ModelScope 下载模型并加载

Ollama 官方安装模型的方法很简单

例如：

ollama run qwen2.5

但下载速度一般非常慢

我们可以从 ModelScope 先下载模型，再通过 Ollama 加载模型

1. 下载 GGUF 格式模型

Ollama 能轻易加载 GGUF 格式的模型，检索 GGUF 模型进行下载

推荐用官方命令行方式下载，下载过程中有进度条，可指定下载目录

modelscope download --model 'Qwen/Qwen1.5-0.5B-Chat-GGUF' --local_dir 'D:\Models\Qwen1.5-0.5B-Chat-GGUF'

下载完成后，目录类似这样：

关于 gguf 文件，简单理解就是体积越大的回答准确率就越高

2. 加载 GGUF 模型

参考 Ollama 关于加载 GGUF 的说明和 Qwen 官网关于 Ollama 加载 GGUF 模型的文档

在上述下载 gguf 模型的目录中新建一个名为 Modelfile 的文件

Modelfile 文件内容如下

FROM ./qwen1_5-0_5b-chat-q5_0.gguf

在 gguf 模型的目录下运行 Ollama 加载 gguf 的命令

ollama create qwen1.5:0.5b -f Modelfile

至此，在上面 OLLAMA_MODELS 系统变量对应的目录下会生成 Ollama 的模型数据

Ollama 运行模型

由于 Ollama 已安装，因此 ollama 命令可用

ollama run qwen1.5:0.5b

查看全文

http://www.kler.cn/a/525242.html

【最后203篇系列】005 -QTV200 Online

【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention

春节主题c语言代码

关于产品和技术架构的思索

LCR 139.训练计划 I

使用Java提取Word文档表格数据

论文阅读(十四)：贝叶斯网络在全基因组DNA甲基化研究中的应用

java 正则表达式匹配Matcher 类

C# Dynamic关键字

东方博宜25年1月-B组（才俊）- 农田作物

Kafka的内部通信协议

什么是心跳

怎么样控制API的访问速率，防止API被滥用？

动态规划DP 最长上升子序列模型最长上升子序列（题目分析+C++完整代码）

Android NDK

“AI视频智能分析系统：让每一帧视频都充满智慧

寻找旋转数组中的最小元素：C语言实现与分析

SSM开发(七) MyBatis解决实体类（model）的字段名和数据库表的列名不一致方法总结（四种方法）

Baklib引领企业内容中台建设的新思路与应用案例

更新被联想限制更新的intel集成显卡UHD 630驱动，想让老显卡也支持到4K显示器