当前位置：首页 > article >正文

DeepSeek-R1入门指南：架构、训练、本地部署和硬件要求

article 2025/3/11 1:04:17

DeepSeek 改进大型语言模型推理能力的新方法

　　DeepSeek 通过强化学习（RL）引入了一种创新方法，以提升大型语言模型（LLMs）的推理能力，这一方法在他们近期发布的论文《DeepSeek-R1》中有详细阐述。这项研究在通过纯强化学习而无需大量监督微调来增强 LLM 解决复杂问题的能力方面，代表了一个重要的进展。

　　DeepSeek-R1 的技术概述

　　模型架构：

　　DeepSeek-R1 不是一个单一的模型，而是一系列模型，包括：DeepSeek-R1-

图像形成与计算机视觉基础

Javascript 原型和原型链

Oracle数据恢复：闪回查询

Swagger-01.介绍和使用方式

【python爬虫】酷狗音乐爬取练习

postman接口请求中的 Raw是什么

C++算法——差分

从 GitHub 批量下载项目各版本的方法