当前位置: 首页 > article >正文

本地部署 DeepSeek-R1 大模型指南:基于 Ollama 的完整流程

Ollama是什么

Ollama 是一个开源的大语言模型本地化部署与管理工具,支持:
一键式模型下载与版本管理

本地化模型推理服务部署

REST API 接口提供

多平台客户端接入支持

整体步骤

  • 安装 Ollama
  • Ollama服务配置
  • 部署模型
  • 客户端配置(Page Assist)(chrome插件)

详细步骤

环境说明

  • Ubuntu系统 内存:16G CPU:AMD Ryzen 5 5600G 的集成显卡
  • 网络需科学上网
  • 防火墙关闭或者放行11434端口

安装Ollama

下载安装直接运行如下命令即可

# 使用官方安装脚本
curl -fsSL https://ollama.com/install.sh | sh

# 验证安装
ollama --version

ollama服务配置

  • 停止 Ollama 服务:执行命令sudo systemctl stop ollama。
  • 编辑 Ollama 服务文件:使用文本编辑器打开/etc/systemd/system/ollama.service文件。 在[Service]部分下,添加或修改一行内容为Environment=“OLLAMA_HOST=0.0.0.0”。
[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/usr/local/go/bin:/usr/local/java/jdk1.8.0_361/bin:/usr/local/maven/apache-maven-3.8.2/bin"
# 设置监听地址(关键修改)
Environment="OLLAMA_HOST=0.0.0.0"

  • 重载 daemon 文件:执行sudo systemctl daemon-reload,让系统重新加载服务配置文件。
  • 启动 Ollama 服务:执行sudo systemctl start ollama,使新的配置生效

部署模型

ollama run deepseek-r1:8b

后面的8b 意思是80亿参数,根据具体的机器配置选择不同数量的参数。

验证模型

# 发送测试请求
curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:8b",
  "prompt": "请用五句话介绍量子计算",
  "stream": false
}'

# 预期收到JSON格式响应,包含生成文本

客户端配置(Page Assist)

  • 从 Chrome 应用商店安装 Page Assist 插件
  • 打开插件设置
  • 按照下图配置

在这里插入图片描述

总结

按照上面配置后,对话框选择相应模型,即可对话: 欢迎关注公众号:庄智曰

ollama常用命令

# 查看已安装的模型
ollama list
# 查看运行中的模型实例
ollama ps
# 拉取模型
ollama pull llama2
# 删除模型
ollama rm <模型名称>
# 运行模型,运行之后就可以进行对话
ollama run llama2

# 启动 Ollama 服务
ollama serve

deepseek模型列表

ollama run deepseek-r1:1.5b
ollama run deepseek-r1:8b
# 适合中等复杂度的任务,如文本生成、代码生成、翻译等。
ollama run deepseek-r1:7b
# 适合更复杂的任务,如长文本生成、逻辑推理等
ollama run deepseek-r1:14b

参考文献

ollama官网

本地部署 DeepSeek-R1 大模型!免费开源,媲美OpenAI-o1能力


http://www.kler.cn/a/523527.html

相关文章:

  • 在Putty创建php文件
  • 计算机毕业设计Python+CNN卷积神经网络高考推荐系统 高考分数线预测 高考爬虫 协同过滤推荐算法 Vue.js Django Hadoop 大数据毕设
  • DeepSeek大模型技术解析:从架构到应用的全面探索
  • 万物皆有联系:驼鸟和布什
  • C++,STL,【目录篇】
  • Kiwi 安卓浏览器本月停止维护,扩展功能迁移至 Edge Canary
  • Cyber Security 101-Build Your Cyber Security Career-Security Principles(安全原则)
  • 软件工程-软件开发模型
  • RoboMaster- RDK X5能量机关实现案例(一)识别
  • .~C#循环结构
  • Vue学习四—— Home主体页面
  • 数据结构与算法分析:专题内容——人工智能中的寻路4之A*搜索(代码详解)
  • 智慧园区系统分类及其在提升企业管理效率中的创新应用探讨
  • 软件工程概论试题一
  • 服务器上安装Nginx详细步骤
  • Linux:一切皆文件
  • 差分约束系统 + spfa求最短路
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.19 排序革命:argsort的十大高阶用法
  • React中的JavaScript语法
  • MATLAB中fetchOutputs函数用法
  • 2007-2020年各省国内专利申请授权量数据
  • 【MySQL — 数据库增删改查操作】深入解析MySQL的 Update 和 Delete 操作
  • 【C++动态规划】2547. 拆分数组的最小代价|2019
  • 【论文投稿-第八届智能制造与自动化学术会议(IMA 2025)】HTML, CSS, JavaScript:三者的联系与区别
  • SOME/IP--协议英文原文讲解2
  • Python3 【函数】水平考试:精选试题和答案