当前位置：首页 > article >正文

DeepSeek系列模型完全使用手册｜附安装教程

article 2025/2/4 14:18:00

前言

DeepSeek系列模型在去年12月发布以来引起了不少关注，而推理模型R1的发布则进一步点燃了国内外用户的热情。鉴于仍有不少用户完全没有使用经验，而网上现有的信息可能比较零碎，反而会导致初学者更加困惑。因此本文整理了DeepSeek系列模型的基本说明和一些使用方法，此外还提供了一个第三方客户端的安装教程，用于让初学者也能用上国产最强大的推理模型。

本地环境使用

原始模型权重

原始模型权重在HF上开源，可免费下载。R1模型大小有671B参数，使用默认的半精度加载，至少需要1300GB以上的显存，如果使用4-bit进行量化，理论上也需要300GB以上的显存。与V3类似，R1也不支持使用transformers库进行加载推理，建议使用vLLM进行推理部署。

在这里插入图片描述

本地部署R1模型的一种方案，使用了7台M4 Pro Mac Mini + 1台M4 Max MacBook Pro堆叠统一内存，4-bit量化后仍需要近500GB的显存。

此外，DeepSeek团队使用Qwen2.5和Llama3.3蒸馏了6款模型，包含1.5B～70B在内共有6个尺寸。
在这里插入图片描述

Ollama

使用Ollama进行R1系列模型的本地部署是比较简单的方法，只需下载Ollama程序即可，但是模型均进行了量化。支持官方蒸馏的6款模型和原始671B的R1模型。所有模型均使用4-bit进行量化，最少仅需要1.1G的显存，推荐使用14B模型，需要9G显存，可在消费级显卡上进行部署。

在这里插入图片描述

客户端使用

官方支持网页端和手机APP使用DeepSeek系列模型，选择「深度思考(R1)」则会使用R1推理模型，不选择则使用V3对话模型。需要注意目前联网搜索功能暂不可用。
在这里插入图片描述

网页端

在这里插入图片描述

手机APP

应用商店搜索「DeepSeek」即可下载，安装包仅不到10M，比起其他动辄几十、几百M的智能助手显得太过格格不入了。

在这里插入图片描述

在这里插入图片描述

API

官方API

由于访问量太大以及恶意攻击，目前官方的API服务暂时还没有恢复。
在这里插入图片描述

国内API平台

硅基流动联合华为推出了基于910B系列芯片的推理服务，新用户注册即送2000万Tokens(相当于14元额度)。
官网注册地址： https://cloud.siliconflow.cn/i/7M9W6SG1
在这里插入图片描述

注册后点击「API密钥」菜单，接着点击「新建API密钥」即可创建API密钥，点击可复制密钥。
在这里插入图片描述

第三方客户端

对于编程目的或者软件开发者使用，有Cursor，WindSurf、v0等这些编程助手，而对于一般用户而言，推荐使用ChatBox或者Cherry Studio等这类开源的客户端软件，不需要进行环境设置或者运行程序。

Cherry Studio客户端下载地址：https://cherry-ai.com/

以下以Cherry Studio为例，展示如何接入硅基流动的API，使用R1模型。
在这里插入图片描述

选择模型服务商「硅基流动」，填入从硅基流动官网复制的API密钥。
在这里插入图片描述

经过实测，一轮简单对话约消耗3000tokens，相当于0.03元的额度。
在这里插入图片描述

http://www.kler.cn/a/531176.html

相关文章：

VMware安装win10记录

potplayer字幕

JAVA安全—反射机制攻击链类对象成员变量方法构造方法

知识库管理在提升企业决策效率与知识共享中的应用探讨

沙皮狗为什么禁养？

Java基础知识总结（三十七）--io异常的处理方式

SpringCloud系列教程：微服务的未来（二十）Seata快速入门、部署TC服务、微服务集成Seata

Vue.js 异步、延迟组件加载

数据结构:时间复杂度

list容器（详解）

diffusion 训练trick 多横纵比设置

算法总结-二分查找

取模与加减乘除原理,模拟实现代码及相关公式推导

【线程】基于阻塞队列的生产者消费者模型

【C语言篇】“三子棋”

kubernetes（二）

对比JSON和Hessian2的序列化格式

前端 | JavaScript中的reduce方法

【14】WLC3504 HA配置实例

【股票数据API接口49】如何获取股票实时交易数据之Python、Java等多种主流语言实例代码演示通过股票数据接口获取数据

自动化构建-make/Makefile 【Linux基础开发工具】

本地快速部署DeepSeek-R1模型——2025新年贺岁

relational DB与NoSQL DB有什么区别？该如何选型？

C++ Primer 迭代器

Unity特效插件GodFX

力扣经典题目之14. 最长公共前缀