当前位置: 首页 > article >正文

Windows环境下使用Ollama搭建本地AI大模型教程

注:Ollama仅支持Windows10及以上版本。

安装Ollama

去 ollama官网 下载对应平台及OS的安装包。

运行安装包,点击“安装”按钮即可开始安装。Ollama会自动安装到你的 C:\Users\<当前用户名>\AppData\Local\Programs\Ollama 目录上。

运行Ollama安装包
安装完成后,Ollama会自动启动。启动时任务栏中图标显示如下:

开始菜单中的Ollama快捷方式

当Ollama未启动时,可以通过点击开始菜单Ollama快捷方式或者直接定位安装目录的方式手动启动程序。

安装目录中直接点击程序启动

(可选)自定义的模型存储目录

在拉取数据模型之前,我们必须意识到,Ollama默认模型存储的目录是 C:\Users\<当前用户名>\.ollama\models 。这也意味着,如果你的C盘空间不够大的话,在拉取大维度数据模型的时候会因空间不足而失败——数据模型维度越高,占用磁盘空间越大。

为了避免这种尴尬的问题,我们的第一思路是将默认模型存储的目录移动到其它磁盘上。具体来说,我们可以通过设置环境变量来确定这一点。

还是老一套:右键“计算机”–>“属性”–>“高级系统设置”–>“环境变量”,打开环境变量界面。

打开环境变量界面

新增一个名为OLLAMA_MODELS环境变量,变量值则设置为你想要存储模型的目录路径。例如:D:\OllamaModels。

设置环境变量
设置完成后,点击“确定”保存更改。

拉取数据模型

首先我们要确定一个问题:我们要使用什么样的数据模型?

去 ollama官网 上查看所有Ollama支持的数据模型。

Ollama数据模型搜索页面

模型的种类不同,侧重方向也不一样。而同一模型当中,数据维度(参数量)越大,训练速度越快,但需要的磁盘空间和运行时内存也越多。因此,我们还需要根据自己的硬件条件来选择合适的模型。下面以deepseek-r1模型为例:

deepseek-r1

数据维度初始磁盘空间运行时最低内存
1.5b1.1GB2GB
7b(默认)4.7GB6GB
8b4.9GB6.5GB
14b9GB12GB
32b20GB24GB
70b43GB66GB
671b404GB550GB

注意:运行时最低内存为估算值。

当你选取了适当的模型之后,我们就可以拉取它了。

  1. 打开cmd命令行,运行以下命令:

cd C:\Users\<当前用户名>\AppData\Local\Programs\Ollama

此时命令行移动到了Ollama的安装目录。

  1. 此时再运行以下命令:

./ollama.exe pull <所选的数据维度模型>:<所选的数据维度>

例如,如果我们选取了deepseek-r1的1.5b版本,则运行

./ollama.exe pull deepseek-r1:1.5b

静待数据模型拉取完成,搭建工作圆满结束。

(可选)(仅Nvidia显卡可用)使用CUDA工具包,把显存用起来

在进行此项 可选的 工作之前,你应该确保:

  1. Nvidia显卡驱动正常运行。
  2. 已安装最新的Nvidia app应用程序。

打开命令行,运行命令:

nvidia-smi.exe

此时会显示如下信息:

CUDA版本号

图中红框中的即为CUDA版本号,安装CUDA工具包的版本号不得高于该版本号

去 Nvidia官网 上下载合适版本的CUDA工具包。

点击安装包,按照提示完成安装。

在确保模型被运行的情况下,打开命令行,运行“nvidia-smi.exe”命令。结果如下:

运行Ollama时,显存已被使用了一部分,CUDA工具包已经成功安装

红框显示,此时发现显存已被使用了一部分,CUDA工具包已经成功安装了。


http://www.kler.cn/a/548068.html

相关文章:

  • 平面与平面相交算法杂谈
  • flink实时集成利器 - apache seatunnel - 核心架构详解
  • 文心一言还有哪些待优化的地方
  • [leetcode] 动态规划 - 最大子数组和
  • 【拒绝算法PUA】LeetCode 1742. 盒子中小球的最大数量
  • es和kibana安装
  • 【大疆无人机地图测绘技术学习:高精度、高效率的全流程解决方案】
  • 机器学习、深度学习、强化学习是人工智能领域的理论基础和方法论
  • Python创建Excel的方式——提供4中方式可供参考
  • Rhel Centos环境开关机自动脚本
  • 计算四个锚点TOA定位中GDOP的详细步骤和MATLAB例程
  • doris:同步物化视图
  • web前端第三次作业:登录窗口拖动效果
  • 【NLP 22、语言模型 language model】
  • deepseek + embeding模型搭建本地知识库
  • STM32——HAL库开发笔记20(定时器1—时基单元)(参考来源:b站铁头山羊)
  • --- jvm中一个类的一生 ---
  • 2.10 Playground Chat提示工程实战:从交互调试到企业级应用的全链路指南
  • 如何在Spring Boot中使用Profiles实现环境隔离
  • 51单片机-数码管