当前位置：首页 > article >正文

【AI知识点】大模型开源的各种级别和 deepseek 的开源级别

article 2025/2/12 19:10:58

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】【AI应用】

大模型开源的各种级别

大模型的“开源”程度不同，通常可以分为以下几个主要级别：

1. 权重不开源（Closed-source）

特点：仅提供 API 访问，用户无法下载模型权重或进行本地部署。
代表：GPT-4、Claude 2、Gemini 1.5 等。

2. 受限权重开源（Restricted Open-weight）

特点：
- 允许用户下载模型权重，但存在较严格的使用限制。
- 可能要求用户申请许可证或遵守商业、研究用途的限制。
代表：
- LLaMA 2（Meta）：需要申请许可证，商用有限制。
- Mistral 7B：允许商用，但有 CC BY-SA 许可要求。

3. 研究开源（Research Only Open-weight）

特点：
- 权重开源，但仅限学术研究用途，不允许商用。
- 代码可能开源，也可能不开源。
代表：
- LLaMA 1（Meta）：仅限研究用途。
- DeepMind Gopher：仅限学术研究。

4. 权重和推理代码开源（Open-weight & Inference Code Open）

特点：
- 提供模型权重和推理代码，允许用户本地运行，但训练代码可能不开源。
- 可能有商用限制，但一般较为宽松。
代表：
- Mistral 7B（Apache 2.0）：权重 + 推理代码均开源。
- Bloom（BigScience）：训练代码未完全开放，但推理代码 + 权重开放。

5. 完全开源（Fully Open-source）

特点：
- 权重、推理代码、训练代码全部开源，甚至提供训练数据。
- 通常采用宽松的开源许可证（如 Apache 2.0、MIT）。
- 允许自由商用和二次开发。
代表：
- Falcon 180B（Apache 2.0）：完全开源。
- MPT-30B（Apache 2.0）：提供完整代码和权重。
- OpenLLaMA（Apache 2.0）：基于开源数据训练。

DeepSeek 开源级别

DeepSeek 已经开源了多个模型：

DeepSeek-V3：

开源内容：模型权重和推理代码。
许可证：MIT 许可证。
细节：模型权重和推理代码已在 MIT 许可证下开源，允许广泛使用、修改和分发。然而，训练代码和训练数据集尚未公开。
参考链接：DeepSeek-V3 GitHub 仓库

DeepSeek-R1：

开源内容：模型权重和推理代码。
许可证：MIT 许可证。
细节：与 DeepSeek-V3 类似，DeepSeek-R1 的模型权重和推理代码在 MIT 许可证下开源，但训练代码和数据集仍然是私有的。
参考链接：DeepSeek-R1 发布公告

综上，DeepSeek 已经在 MIT 许可证 下开源了 DeepSeek-V3 和 DeepSeek-R1 的模型权重及推理代码，这意味着用户可以自由使用和商用这些模型。然而，训练代码和数据集尚未开源，因此无法完全复现模型的训练过程或对其底层架构进行修改。

http://www.kler.cn/a/542449.html

相关文章：

嵌入式软件C语言面试常见问题及答案解析（四）

ffmpeg -demuxers

解决VsCode的 Vetur 插件has no default export Vetur问题

（1/100）每日小游戏平台系列

pgsql最快的数据导入BeginBinaryImport

亚博microros小车-原生ubuntu支持系列：26手势控制小车基础运动

Java 大视界 -- 5G 与 Java 大数据融合的行业应用与发展趋势（82）

ArcGIS Pro SDK （二十六）自定义配置

基于 PyTorch 的树叶分类任务：从数据准备到模型训练与测试

25考研电子信息复试面试常见核心问题真题汇总，电子信息考研复试没有项目怎么办?电子信息考研复试到底该如何准备？

进阶版MATLAB 3D柱状图

【系统架构设计师】操作系统 - 进程管理 ① ( 进程概念 | 进程组成 | 进程与程序 | 进程与线程 | 线程可共享的资源 - ☆考点 )

工具模块新增JSON格式化打印工具类

什么是容器化，它有什么好处，对后端开发有什么影响？

【2025-ICLR-未中】教授多模态大语言模型理解心电图图像

【C#零基础从入门到精通】(五)——C# {n:format} 占位符

C#调用Python的函数（编译为pyd，避免源码泄露）

朝天椒USB服务器：破解银企直连中Ukey管理难题

算法-反转链表

MATLAB电机四阶轨迹规划考虑jerk、Djerk

MarsCode AI插件在IntelliJ IDEA中使用

2025最新版Node.js下载安装~保姆级教程

Bash (Bourne-Again Shell)、Zsh (Z Shell)

【AI-28】RAG的深入浅出

OpenCV2D 特征框架 (19)目标检测类cv::CascadeClassifier的使用

基于Win XDMA的PCIE 2.0 X8速率不足原因分析与解决方案