当前位置：首页 > article >正文

Ollama 部署本地 Deepseek-R1 大模型及可视化聊天工具指南

article 2025/2/21 4:39:45

环境准备

操作系统：推荐 Linux/macOS/Windows 10+
硬件要求：
- RAM ≥ 32GB（FP16版本）
- 显存 ≥ 24GB（如需GPU加速）
- 硬盘空间 ≥ 40GB
网络：可访问 Hugging Face 模型仓库

安装 Ollama

macOS/Linux

curl -fsSL https://ollama.com/install.sh | sh

Windows（PowerShell）

irm https://ollama.com/install.ps1 | iex

验证安装

ollama serve

部署 Deepseek-R1 模型

方法一：直接拉取（官方支持时）

ollama pull deepseek-r1

方法二：手动部署（需自定义Modelfile）

下载模型文件（Hugging Face格式）
创建 Modelfile：

FROM ./deepseek-r1-gguf-model.Q4_K_M.gguf
PARAMETER num_ctx 4096
PARAMETER temperature 0.7
SYSTEM """
You are Deepseek-R1, a helpful AI assistant.
"""

创建模型：

ollama create deepseek-r1 -f Modelfile

安装可视化聊天工具

选项一：Open WebUI（推荐）

docker run -d -p 3000:8080 \
  -v ollama:/root/.ollama \
  -v open-webui:/app/backend/data \
  --name ollama-webui \
  ghcr.io/open-webui/open-webui:main

选项二：Lobe Chat

npm install -g @lobehub/chat
lobe-chat --api http://localhost:11434

使用指南

启动 Ollama 服务：

ollama serve

运行聊天工具：

# Open WebUI
浏览器访问 http://localhost:3000

# Lobe Chat
lobe-chat --api http://localhost:11434

选择模型：
- 模型列表选择 deepseek-r1
- 调整温度参数（0.1-1.0）

常见问题

1. 模型无法加载

检查模型文件哈希值
确保显存/RAM充足
尝试量化版本（Q4/Q5）

2. 响应速度慢

# 启用GPU加速（NVIDIA）
OLLAMA_CMAKE_ARGS="-DLLAMA_CUBLAS=on" ollama serve

3. 聊天工具连接失败

检查防火墙设置
确认Ollama API地址（默认：http://localhost:11434）

查看全文

http://www.kler.cn/a/551672.html

springboot399-中文社区交流平台(源码+数据库+纯前后端分离+部署讲解等)

mapbox基础，使用geojson加载circle圆点图层

汽车通信未来新趋势：Eclipse uProtocol

无第三方依赖 go 语言工具库

【复现DeepSeek-R1之Open R1实战】系列6：GRPO源码逐行深度解析（上）

深入解析「卡顿帧堆栈」 | UWA GPM 2.0 技术细节与常见问题

25工商管理研究生复试面试问题汇总工商管理专业知识问题很全！工商管理复试全流程攻略工商管理考研复试真题汇总

解决DeepSeek服务器繁忙的有效方法

vue3项目，商城系统

网络工程师（45）网际控制报文协议ICMP

分布式储能监测云平台

麒麟V10离线安装docker和docker-compose

1.王道_常用命令

嵌入式学习第十六天--stdio（二）

SQL进阶技巧：如何统计用户跨端消费行为？

STM32 HAL库USART串口中断编程：环形缓冲区防止数据丢失

【开源】基于SSM框架网上招聘系统（计算机毕业设计）+万字毕业论文+远程部署+ppt+代码讲解 ssm592

android studio 界面启动模拟器无反应——从命令行启动模拟器

LLaVA-Mini部署教程：模态预融合与视觉符元压缩，重新定义图像视频理解边界！

调试变量的变化 vs数据断点调试