当前位置: 首页 > article >正文

DeepSeek算是真正意义上的大模型开源吗?

DeepSeek只属于开源AI模型(这与Github开放源代码的方式有区别),只开源了部分推理代码和模型权重,完整的训练框架、系统代码、数据处理等都没有开源,所以这不算真正意义上的软件开源。

市面上主流的大模型,都是开放技术报告和开源权重。如果你不了解真正的开源含义,可以去了解一下OSI(Open Source Initiative),这里面还针对AI开源提出了几种概念,比如开源AI模型、开源AI系统、开源AI权重等。

而真正的大模型开源是要将训练代码、训练数据集等全部开放,能够让开发者将你开源的软件进行复现;如果不能复现,就不是真正意义上的开源;再加上大模型训练是需要大投入,几乎没有那个公司愿意将核心业务数据、训练代码等全部开源。

如果真的将大模型开源,就目前的训练方法还很难做到可重现构建,无论如何都不可能做到完全复现,所以开放训练代码也就没有多大意义;毕竟大模型训练是需要资本的,就资金成本已经劝退单打独斗的开发者了。

完全开源的大模型几乎没有,比如Olmo2的模型就只是开源了训练数据、评估代码、部分训练得到的权重等;

有了开源权重,我们只需要使用代码进行调用、推理等,这对开发者来讲,使用成本低,也方便。

虽然DeepSeek在性能优化方面做出了一些改变,比如采用汇编和编写PTX模式,但该代码不具备可移植性,大部分人也无法将DeepSeek的硬件集群复现;


http://www.kler.cn/a/530281.html

相关文章:

  • 智能小区物业管理系统打造高效智能社区服务新生态
  • 自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
  • Linux-CentOS的yum源
  • 被裁与人生的意义--春节随想
  • 理解动手学深度学习的自编包d2l
  • 【算法】回溯算法专题① ——子集型回溯 python
  • 【大模型专栏—基础篇】提示词设计
  • 像接口契约文档 这种工件,在需求 分析 设计 工作流里面 属于哪一个工作流
  • Shadow DOM举例
  • MySQL5.5升级到MySQL5.7
  • Vue3.0实战:大数据平台可视化(附完整项目源码)
  • Alibaba开发规范_编程规约之集合框架:最佳实践与常见陷阱
  • MBTI之INFJ型人格解读,INFJ的职业倾向、人际关系和INFJ的心理健康
  • doris:主键模型的导入更新
  • 系统URL整合系列视频一(需求方案)
  • ifconfig/hostname/hosts文件等学习
  • springboot/ssm教学资源管理系统web在线课程教学视频Java代码编写
  • 一文了解制造业中的QC是什么
  • 微信登录模块封装
  • 第一性原理:游戏开发成本的思考
  • 索罗斯的“反身性”(Reflexivity)理论:市场如何扭曲现实?(中英双语)
  • 【PyQt】lambda函数,实现动态传递参数
  • 本地Deepseek添加个人知识库(Page Assist/AnythingLLM)
  • 不确定性采样在分类任务中的应用
  • 【Navicat】设置字段根据当前时间更新
  • C++模板初了解