当前位置: 首页 > article >正文

Ubuntu20.04 本地部署 DeepSeek-R1

一、下载ollama

打开 ollama链接,直接终端运行提供的命令即可。如获取的命令如下:

curl -fsSL https://ollama.com/install.sh | sh

在这里插入图片描述确保是否安装成功可在终端输入如下命令:

ollama -v

在这里插入图片描述

注意: 如遇到Failed to connect to github.com port 443: Connection timed out ,一种简便方法是:改host sudo vim /etc/hosts ,添加内容如下:

 140.82.112.3 github.com
 199.232.5.194 github.global.ssl.fastly.net
 54.231.114.219 github-cloud.s3.amazonaws.com

其中,ipaddress 可获取目前github.com实际ip
在这里插入图片描述

二、下载模型

在 ollama_search 中查询所需的模型,这里需要下载DeepSeeK-R1模型,所以在搜索框中输入“deepseek-r1”。
在这里插入图片描述

打开第一个链接,在左侧标有7b的选项为模型的版本,数字越大模型越大效果更好,但对应所需要的计算机的性能更强,具体参数可以对应下方表格。因为自己显存较低,所以使用1.5b,大家可以根据自己电脑配置选择。
在这里插入图片描述

模型版本参数量内存需求(RAM)显存需求(训练)显存需求(推理)推荐GPU配置典型应用场景注意事项
1.5B1.5B4-8GB6-8GB3-4GB单卡RTX 3090/4090移动端应用、嵌入式设备、简单对话支持低精度量化(4bit/8bit)
7B7B16-32GB24-32GB12-16GB单卡A100 40GB通用对话、文本生成需启用激活检查点节省显存
8B8B20-40GB28-36GB14-18GB单卡A100 40GB多语言处理、中等复杂度推理推荐使用FlashAttention优化
14B14B32-64GB48-64GB24-32GB2*A100 40GB(张量并行)复杂对话、知识问答需张量并行策略
32B32B64-128GB80-120GB40-60GB4*A100 80GB(流水线并行)专业领域分析、长文本生成推荐使用ZeRO-3优化
70B70B128-256GB160-240GB80-120GB8*A100 80GB(混合并行)复杂代码生成、学术研究需组合张量+流水线+数据并行
671B671B1TB+1.5-2TB800GB-1.2TB64*A100/H100(多节点分布式)超大规模预训练、战略级AI系统需定制化分布式框架支持

在左侧选好版本后,右侧即会显示一条命令,将该命令输入在命令框中即可,因为选择下载1.5b,则命令为:

ollama run deepseek-r1:1.5b

指令执行完后即可使用该模型:
在这里插入图片描述如果需要关闭模型即可使用Ctrl + d 或键盘输入/bye 即可,如需再次启动,那么在命令行中输入ollama run deepseek-r1:1.5b即可。


http://www.kler.cn/a/535313.html

相关文章:

  • arm 下 多线程访问同一变量 ,使用原子操作 性能差问题
  • 【深度学习】基于MXNet的多层感知机的实现
  • 高性能 AI 处理器亲和性调度算法实现
  • C#项目引用VB.NET 类库项目,生成一个EXE,这是什么原理
  • PostgreSQL函数自动Commit/Rollback所带来的问题
  • Python基础知识:注释、变量以及数据类型、标识符和关键字、输入函数、输出函数、运算符、程序类型转换
  • Java中JSON和对象的相互转换
  • 2.3-STL库中list的模拟实现
  • 10个Redis高阶面试题
  • 尚硅谷课程【笔记】——大数据之Shell【二】
  • SQL LEFT JOIN 详解
  • 【Elasticsearch】post_filter
  • 嵌入式经典面试题之操作系统(三)
  • 洛谷P2367 语文成绩(一维差分模板)
  • Hive自定义函数简介及实践案例
  • C# MAUI 注册服务
  • 如何在本机或服务器上部署运行DeepSeek R1模型
  • 高级java每日一道面试题-2025年01月29日-框架篇[SpringBoot篇]-SpringBoot 实现热部署有哪几种方式?
  • tcp/ip网络协议,tcp/ip网络协议栈
  • RabbitMQ 从入门到精通:从工作模式到集群部署实战(二)
  • Day52:type()函数
  • RocketMQ实战—5.消息重复+乱序+延迟的处理
  • 记录 | WPF基础学习自定义按钮
  • 【matlab代码】平方根扩展卡尔曼滤波(SR EKF)例程,三维非线性系统的滤波
  • 【Rust自学】20.2. 最后的项目:多线程Web服务器
  • 在远程 Linux 服务器上运行 Jupyter Notebook(.ipynb 文件)