当前位置: 首页 > article >正文

4070s显卡部署Deepseek R1

电脑配置:

处理器:AMD 7950X

内存:32G

硬盘:致态tiplus7100 2t

显卡:4070 super 12G

部署方法:

1. 到ollama官网下载安装ollama

https://ollama.com/https://ollama.com/https://ollama.com/https://ollama.com/https://ollama.com/

2. deepseek r1的模型:deepseek-r1https://ollama.com/library/deepseek-r1https://ollama.com/library/deepseek-r1https://ollama.com/library/deepseek-r1https://ollama.com/library/deepseek-r1https://ollama.com/library/deepseek-r1https://ollama.com/library/deepseek-r1打开CMD或者powershell,执行如下命令,我的是4070s显卡,选择了14b,可以根据自己显卡的算力选择不同的参数量,在上面的页面中有支持的可选项

ollama run deepseek-r1:14b

等待下载完成就可以问答了,如下图:

4070s使用14b可以流畅回答,显卡占用率可以接近100%。

也试了32b,有点慢,得思考个十几二十秒,之后大概每秒输出三四个字,显卡占用率一直不到30%,可以看到显存占满了,共享内存还多占了10G。

所以4070s这样12G显存的显卡还是使用14b的参数量最合适,32b是4070s这个级别的显卡能差不多能使用的极限了。


http://www.kler.cn/a/520032.html

相关文章:

  • 834 数据结构(自用)
  • android的gradle
  • cloc下载和使用
  • 汽车OEMs一般出于什么目的来自定义Autosar CP一些内容
  • 非根目录部署 nextjs 项目,资源文件 请求404 的问题
  • 可以称之为“yyds”的物联网开源框架有哪几个?
  • 如何快速开发LabVIEW项目,成为LabVIEW开发的高手
  • Java实战项目-基于 springboot 的校园选课小程序(附源码,部署,文档)
  • 网工_PPP协议
  • Pyecharts之图表组合与布局优化
  • 从音频到 PDF:AI 全流程打造完美英文绘本教案
  • 自然语言处理——从原理、经典模型到应用
  • Alibaba Spring Cloud 六 Seata 的核心组件:RM
  • 【6】YOLOv8 训练自己的分割数据集
  • HeidiSQL 12.9
  • 已解决:OSError: [E050] Can‘t find model ‘en_core_web_sm‘.
  • 使用nvm对node进行版本管理
  • 小柯剧场训练营第一期音乐剧演员与第二期报名拉开帷幕!
  • Linux中DataX使用第二期
  • 01-23 statefulSet
  • python-leetcode-删除排序链表中的重复元素 II
  • SSM项目本地Tomcat部署
  • 守护资产,防范风险 | 2025年Web3.0资产安全指南
  • Vue2官网教程查漏补缺学习笔记 - 3Vue实例4模板语法5计算属性监听器
  • Elasticsearch——Elasticsearch查询实战
  • 网易前端开发面试题200道及参考答案 (下)