当前位置：首页 > article >正文

人工智能|本地部署|ollama+chatbox快速Windows10下部署（初级篇）

article 2025/2/7 0:34:00

一、

前言：

其实早一个月我已经使用过deepseek，并且也在自己的机器上通过ollama部署过，但一直没有太多动力，现在感觉还是的记录一下，省的自己给忘掉了

本文只是简单记录一下ollama+open-webui+chatbox部署通过网盘分享的文件：DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf
链接: https://pan.baidu.com/s/1aQ0FqspQIKk0eq2IoeCCiw?pwd=4xtk 提取码: 4xtk
--来自百度网盘超级会员v6的分享这个模型

二、

环境要求

至少是Windows10，内存至少16G，本人是32G，cpu至少13代，建议硬件资源越高越好，推理速度会好很多，体验不至于太差

至于其它的东西，比如python环境，cuda环境，cudnn等等这些通通不需要

当然了，显卡如果比较好的话，那自然是好事一件，如果比较差，这个也无所谓，关键是内存和cpu，我的机器经常把内存打满，有时候就比较无语

三。

ollama安装包和chatbox安装包

通过网盘分享的文件：OllamaSetup.exe
链接: https://pan.baidu.com/s/1DluxyKi_onBsLvWCUTspbA?pwd=1v65 提取码: 1v65
通过网盘分享的文件：Chatbox.exe
链接: https://pan.baidu.com/s/1MTGTiB5rII5dBhgsY2x87g?pwd=sqq5 提取码: sqq5

大模型文件：

链接:https://pan.baidu.com/s/1aQ0FqspQIKk0eq2IoeCCiw?pwd=4xtk 提取码:4xtk

ollama在Windows下安装非常方便，就不在这过多废话了，同样的，chatbox也是一样，无脑安装就完事，如果安装不了，那么只能说以后不要碰电脑了，这些东西你把握不了

🆗，一般ollama安装完毕后，就有环境变量了，可以直接在cmd里运行

下面就开始一般步骤了：

1、

ollama导入大模型

先新建一个随意的文本文件，该文件是配置文件，名字无所谓，内容如下：

# Modelfile
FROM G:\software\DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf
PARAMETER num_ctx 4096
PARAMETER temperature 0.8
SYSTEM """你是一个擅长中文对话的AI助手，回答需简洁专业。"""

然后打开cmd，假设我的配置文件名字Modelfile.txt，那么，命令为：

ollama create test2 -f G:\software\Modelfile.txt

这里，我定义该自定义模型名称为test2，前面的DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf 将会复制到C:\Users\Administrator\.ollama\models 这个目录下

🆗，这样就轻松导入了，大概等待几分钟的样子，这个时候还需要run一下，run完后，也同时作为服务发布到了本地也就是127.0.0.1:11434 这个端口了，此时，ollama serve 命令不可执行，会报错

🆗，此时chatbox就可以派上用场了，由于两者是安装在一个机器上的，因此，很轻易的就可以配置使用了

这里看着对话很多，但都没有什么卵用，可以删除掉，点。。。编辑就可以删除掉

有很多，选择OLLAMA API就行

前面定义的是test:v1 并且run 过了，因此，可以在这里看到，如果run的有很多模型，下拉可以看到

然后保存就完事了，就已经可以体验了，如果遇到报错，重启就行了：

============================================================

推理的时候主要是用cpu和内存，gpu用的很少 ，推理速度和官网速度差不多，但质量方面来说一言难尽，毕竟gguf文件是裁剪过的大模型，可能会有很多错误。

我的显卡是4060Ti，8g内存，完全够跑这个模型

下次在说说如何使用nginx+open-webui 发布大模型服务

查看全文

http://www.kler.cn/a/534363.html

Java 面试之结束问答

2024美团春招硬件开发笔试真题及答案解析

uniapp小程序自定义中间凸起样式底部tabbar

基于SpringBoot+vue高效旅游管理系统

Java集合框架

数科OFD证照生成原理剖析与平替方案实现

深度剖析 Veo2 工具：解锁 AI 视频创作新境界

RabbitMQ 可靠性投递

理解 C 与 C++ 中的 const 常量与数组大小的关系

【C++】STL——list的使用

【数据结构】链表应用1

java中反射（Reflection）的4个作用

[Python人工智能] 四十九.PyTorch入门 (4)利用基础模块构建神经网络并实现分类预测

我的鸿蒙学习之旅：探索万物互联的新宇宙

产品经理的人工智能课 02 - 自然语言处理

穷举vs暴搜vs深搜vs回溯vs剪枝系列一＞黄金矿工

移动机器人规划控制入门与实践：基于navigation2 学习笔记（一）

【Uniapp-Vue3】从uniCloud中获取数据

Vue全流程--Vue2组件的理解第二部分

Docker深度解析：Docker Compose

巧用 DeepSeek，让 Excel 数据处理更高效

Springboot项目编写测试单元步骤

北大AGI与具身智能评估新范式！Tong测试：基于动态具身物理和社会互动的评估标准

【go语言】protobuf 和 grpc

mixin

STM32 串口收发数据包

相关文章：