当前位置：首页 > article >正文

本地部署DeepSeek-R1模型详细流程

article 2025/3/14 14:31:23

本地部署就是自己部署DeepSeek-R1模型，使用本地的算力。

主要瓶颈：内存+显存的大小。

特点：此方案不用联网。

适合：有数据隐私方面担忧的或者保密单位根本就不能上网的。

满血版：DeepSeek R1671B 全量模型的文件体积高达 720GB，对于绝大部分人而言，本地资源有限，很难达到这个配置。

蒸馏版：

如果你要在个人电脑上部署，一般选择其他架构的蒸馏模型，本质是微调后的Llama或Qwen模型，基本32B以下，并不能完全发挥出DeepSeek R1的实力。

比较流行的是使用ollama。

步骤1：下载Ollama

步骤2：安装Ollama 傻瓜式安装

步骤3：选择r1模型

步骤4：选择版本

建议：如果你想运行404GB的671B，建议你的内存+显存能达到500GB以上。

步骤5：本地运行DeepSeek模型

在命令行中，输入如下命令：

ollama run deepseek-r1:7b

首次运行会下载对应模型文件。下载支持断点续传，如果下载中速度变慢，可以鼠标点击命令行窗口，然后 ctrl+c 取消，取消后按方向键“上”，可以找到上一条命令，即”ollama run deepseek-r1:7b“，按下回车会重新链接，按照之前进度接着下载。

步骤6：查看已有模型

查询已有模型：

ollama list

后续要运行模型，仍然使用之前的命令：

ollama run deepseek-r1:7b

本地部署好模型之后，在命令行操作还是不太方便，我们继续使用一些客户端工具来使用。

Cherry Studio的下载：
Cherry Studio下载地址

以Cherry Studio为例访问7b的蒸馏模型：

模型默认会下载到：
C:\Users\你的用户名\.ollama\目录下的 models文件夹

如果想修改模型的存放位置，做如下配置：

注意：修改完之后，需要重启Ollama客户端，右键图标，选择退出，重新运行Ollama。
验证是否生效：重新运行Ollama之后，重新打开命令行，输入命令 ollama list 查看。

在企业中，想要私有化部署满血版DeepSeek-R1，即671B版本，需要有更好的硬件配置。

服务器可以是物理机，也可以是云服务器。

使用Ollama提供的经过量化压缩的671B模型的大小是404GB，建议内存+显存≥500 GB，举例几种性价比配置如下：

Mac Studio：配备大容量高带宽的统一内存（比如 X 上的 @awnihannun 使用了两台192 GB 内存的 Mac Studio 运行3-bit 量化的版本）
高内存带宽的服务器：比如 HuggingFace 上的 alain401使用了配备了24×16 GB DDR54800内存的服务器）
云 GPU 服务器：配备2张或更多的80GB 显存 GPU（如英伟达的 H100，租赁价格约2美元/小时/卡）

在这些硬件上的运行速度可达到10+ token /秒。

部署流程与个人电脑部署7B的流程没有太大区别，都是以下几个步骤：