当前位置: 首页 > article >正文

【AI文章解读】《No, DeepSeek Is Not A ‘Sputnik Moment’》

《No, DeepSeek Is Not A ‘Sputnik Moment’》
以下是关于这篇文章的详尽笔记:

文章标题

《No, DeepSeek Is Not A ‘Sputnik Moment’》

作者

Rashi Shrivastava,Forbes的记者,专注于人工智能和初创企业的报道。

发布日期

2025年1月30日

文章核心内容

1. DeepSeek引发的市场反应
  • 背景:中国人工智能公司DeepSeek以其低成本高效能的AI模型震惊了科技界。其模型在开发成本上远低于美国同行,引发了市场的广泛关注。
  • 市场反应:DeepSeek的出现导致市场对美国科技巨头(如Nvidia)的信心动摇,市值在短时间内蒸发了超过4500亿美元。然而,文章认为这种恐慌更多是“虚惊一场”,而非真正的“红色技术威胁”。
2. 行业专家的看法
  • George Morgan(Symbolica公司CEO)
    • 认为市场对DeepSeek的反应是“完全误导和无知的”,更多是出于政治因素而非技术因素。
    • 如果DeepSeek是一家美国公司,可能不会受到如此多的关注。
  • Richard Socher(You.com公司CEO)
    • 指出DeepSeek声称的560万美元训练成本存在误导性。该成本仅指单次训练运行的费用,而实际开发大型语言模型通常需要多次训练运行(有时多达数千次)。
    • DeepSeek通过在开源大型语言模型(如Meta的Llama)的基础上进行训练来降低成本。其技术论文也承认560万美元的成本并未包括之前研究的费用,实际训练成本远高于此。
  • May Habib(Writer公司CEO)
    • 表示DeepSeek的低成本训练并非新鲜事,她的公司从一开始就致力于开发低成本的AI模型。
  • Itamar Friedman(Qodo公司CEO)
    • 认为DeepSeek的560万美元计算成本可能只是最后一步的费用,而忽略了之前的所有投入。
3. DeepSeek的技术和影响
  • 技术手段:DeepSeek使用了广泛已知的强化学习技术来提高模型性能,并将这种先进技术免费提供给所有人使用和复制。
  • 引发的讨论:DeepSeek的出现促使人们重新审视“用更少的资源做更多的事情”的可能性。特别是在OpenAI创始人Sam Altman寻求数十亿美元资金用于建设数据中心的背景下,DeepSeek的低成本模式显得尤为突出。
  • Timnit Gebru(分布式人工智能研究所创始人)
    • 认为DeepSeek打破了“必须拥有全球所有资源和能源才能构建这些模型”的幻象,促使人们重新审视AI投资的合理性。
4. 围绕DeepSeek的争议
  • OpenAI的指控:OpenAI声称DeepSeek通过“蒸馏”技术(即从OpenAI的专有模型中提取输出数据)来训练其AI系统,违反了OpenAI的服务条款。
  • OpenAI的立场:OpenAI的首席沟通官Hannah Wong表示,中国正在积极尝试复制美国先进的AI模型,OpenAI将采取积极措施保护其技术,并与美国政府合作保护在美国开发的最先进模型。
  • Gebru的批评:Gebru认为OpenAI的立场“荒谬可笑”,因为OpenAI自己也曾通过抓取互联网数据(包括受版权保护的数据)来训练其模型,并因此被新闻公司和作家团体起诉。
  • 其他公司的类似做法:文章指出,微软也曾通过训练OpenAI的GPT-4等高级模型的输出来构建其小型语言模型Phi。因此,DeepSeek的做法并非首创。
5. 结论
  • DeepSeek并非如一些人所说的“新星时刻”(Sputnik Moment),其技术和模式并非完全创新,而是在现有技术基础上的改进。
  • DeepSeek的出现更多地引发了对AI行业成本和资源利用的重新思考,而非真正的技术突破。

文章的其他信息

  • 相关链接
    • DeepSeek的技术论文
    • OpenAI关于DeepSeek的指控
    • 微软的Phi模型
  • 作者联系方式
    • Twitter:https://www.twitter.com/RashiShrivast18
    • LinkedIn:https://www.linkedin.com/in/rashishrivastava98/
    • Forbes提示箱:https://www.forbes.com/tips/

总结

这篇文章深入探讨了DeepSeek引发的市场和技术争议,指出其低成本AI模型虽然在一定程度上引发了行业的关注和讨论,但并非真正的技术突破。同时,文章也揭示了AI行业在资源利用和成本控制方面的潜在问题,并呼吁行业重新审视这些问题。


http://www.kler.cn/a/529309.html

相关文章:

  • 手写call函数、手写apply函数、手写bind函数
  • Van-Nav:新年,将自己学习的项目地址统一整理搭建自己的私人导航站,供自己后续查阅使用,做技术的同学应该都有一个自己网站的梦想
  • 反向代理模块jmh
  • Pandas基础07(Csv/Excel/Mysql数据的存储与读取)
  • 2025年大年初一篇,C#调用GPU并行计算推荐
  • 嵌入式知识点总结 Linux驱动 (七)-Linux驱动常用函数 uboot命令 bootcmd bootargs get_part env_get
  • 信息学奥赛一本通 ybt 1608:【 例 3】任务安排 3 | 洛谷 P5785 [SDOI2012] 任务安排
  • 制造业数字化转型:从标准化设备到数据与智能算法的共生革命
  • 《基于单中心损失监督的频率感知判别特征学习用于人脸伪造检测 》学习笔记
  • PostgreSQL 数据库视图基础操作
  • tf.Keras (tf-1.15)使用记录1-基础模型创建的两种方法
  • 【股票数据API接口48】如何获取股票最新分时BOLL数据之Python、Java等多种主流语言实例代码演示通过股票数据接口获取数据
  • 【Python】理解Python中的协程和生成器:从yield到async
  • PostgreSQL 数据库备份与还原
  • 如何使用SliverList组件
  • 数据分析系列--⑨RapidMiner训练集、测试集、验证集划分
  • 拉格朗日定理
  • C++编程语言:抽象机制:模板(Bjarne Stroustrup)
  • 【网站建设:HTTPS - 如何生成免费SSL证书,并自动更新】
  • 【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具01
  • RabbitMQ持久化队列配置修改问题
  • python-leetcode-二叉搜索树迭代器
  • 基于微信小程序的酒店管理系统设计与实现(源码+数据库+文档)
  • maven构件子模块步骤及注意事项
  • w185客户关系管理系统
  • AIGC技术中常提到的 “嵌入转换到同一个向量空间中”该如何理解