【AI知识点】大模型开源的各种级别和 deepseek 的开源级别
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】【AI应用】
大模型开源的各种级别
大模型的“开源”程度不同,通常可以分为以下几个主要级别:
1. 权重不开源(Closed-source)
- 特点:仅提供 API 访问,用户无法下载模型权重或进行本地部署。
- 代表:GPT-4、Claude 2、Gemini 1.5 等。
2. 受限权重开源(Restricted Open-weight)
- 特点:
- 允许用户下载模型权重,但存在较严格的使用限制。
- 可能要求用户申请许可证或遵守商业、研究用途的限制。
- 代表:
- LLaMA 2(Meta):需要申请许可证,商用有限制。
- Mistral 7B:允许商用,但有 CC BY-SA 许可要求。
3. 研究开源(Research Only Open-weight)
- 特点:
- 权重开源,但仅限学术研究用途,不允许商用。
- 代码可能开源,也可能不开源。
- 代表:
- LLaMA 1(Meta):仅限研究用途。
- DeepMind Gopher:仅限学术研究。
4. 权重和推理代码开源(Open-weight & Inference Code Open)
- 特点:
- 提供模型权重和推理代码,允许用户本地运行,但训练代码可能不开源。
- 可能有商用限制,但一般较为宽松。
- 代表:
- Mistral 7B(Apache 2.0):权重 + 推理代码均开源。
- Bloom(BigScience):训练代码未完全开放,但推理代码 + 权重开放。
5. 完全开源(Fully Open-source)
- 特点:
- 权重、推理代码、训练代码全部开源,甚至提供训练数据。
- 通常采用宽松的开源许可证(如 Apache 2.0、MIT)。
- 允许自由商用和二次开发。
- 代表:
- Falcon 180B(Apache 2.0):完全开源。
- MPT-30B(Apache 2.0):提供完整代码和权重。
- OpenLLaMA(Apache 2.0):基于开源数据训练。
DeepSeek 开源级别
DeepSeek 已经开源了多个模型:
DeepSeek-V3:
- 开源内容:模型权重和推理代码。
- 许可证:MIT 许可证。
- 细节:模型权重和推理代码已在 MIT 许可证下开源,允许广泛使用、修改和分发。然而,训练代码和训练数据集尚未公开。
- 参考链接:DeepSeek-V3 GitHub 仓库
DeepSeek-R1:
- 开源内容:模型权重和推理代码。
- 许可证:MIT 许可证。
- 细节:与 DeepSeek-V3 类似,DeepSeek-R1 的模型权重和推理代码在 MIT 许可证下开源,但训练代码和数据集仍然是私有的。
- 参考链接:DeepSeek-R1 发布公告
综上,DeepSeek 已经在 MIT 许可证 下开源了 DeepSeek-V3 和 DeepSeek-R1 的模型权重及推理代码,这意味着用户可以自由使用和商用这些模型。然而,训练代码和数据集尚未开源,因此无法完全复现模型的训练过程或对其底层架构进行修改。