当前位置: 首页 > article >正文

追逐AGI!微软AI副总裁、Phi小模型领导者Bubeck将加入OpenAI

来源 | 机器之心

微软的顶级 AI 人才也在流失,还流向了近来离职潮不断的 OpenAI。

今日,据外媒 The Information 的消息,微软人工智能副总裁和杰出科学家 Sebastien Bubeck 将从微软离职,加入 OpenAI。

图片

根据领英资料显示,Sebastien Bubeck 在 2014 年 7 月加入微软,历任研究员、高级研究员、首席研究员、合作伙伴研究经理、GenAI 研究副总裁到如今的 AI 副总裁兼杰出科学家。

图片

据了解,微软发言人在一份声明中表示,「Sebastien Bubeck 已决定离开微软, 继续致力于 AGI 的开发。我们感谢 Bubeck 对微软做出的贡献,并期待通过他在 OpenAI 的工作保持合作关系。」

在微软,Sebastien Bubeck 领导开发了 Phi-3 在内的 Phi 系列小模型(SLM),其中 Phi-3 mini 是一个拥有 38 亿参数的语言模型,经过 3.3 万亿 token 的训练,其整体性能在学术基准和内部测试上成绩优异。Phi-3 mini 可以在优化后部署在手机上,它的性能能够与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。

图片

论文地址:https://arxiv.org/abs/2404.14219

目前还不清楚 Sebastien Bubeck 会在 OpenAI 担任什么职务。

Sebastien Bubeck 介绍

2010 年,Sebastien Bubeck 在法国里尔大学取得了数学博士学位。

图片

毕业以后,Sebastien Bubeck 曾先后担任西班牙庞培法布拉大学的博士后研究员、加州大学伯克利分校的访问科学家,还在普林斯顿大学做了近 3 年的助理教授。最后在 2014 年 7 月加入微软。

在其前 15 年的职业生涯中,Sebastien Bubeck 主要从事凸优化、在线算法和机器学习中的对抗稳健性研究,并凭借这些领域的工作获得了多项最佳论文奖,包括 STOC 2023、NeurIPS 2018 和 2021 最佳论文、与 MSR 实习生合作获得 ALT 2018 和 2023 最佳学生论文、以及 COLT 2016 最佳论文和 COLT 2009 最佳学生论文。

在 Google Scholar 中,Sebastien Bubeck 的论文引用数已经超过了 23000,其中有 4 篇论文的引用数超过了 1000。

图片

目前,Sebastien Bubeck 更专注于理解智能如何在大语言模型中出现,以及如何借此来提高 LLM 的智能,并可能朝着构建 AGI 的方向发展。这种方法被称为「AGI 的物理学」, 试图从不同的尺度(参数、神经元、神经元组、层、数据课程等)来揭示系统各个部分如何组合在一起以创造出大语言模型惊人且意想不到的行为。

2023 年,Sebastien Bubeck 的一作论文《Sparks of artificial general intelligence: Early experiments with gpt-4》(《AGI 的火花》)爆火刷屏。

该论文对 GPT-4 进行了全面评测,认为「鉴于 GPT-4 能力的广度和深度,我们相信它应该被合理视作一个通用人工智能(AGI)系统的早期(但仍不完整)版本。」论文的主要目标是对 GPT-4 的能力和局限性进行探索,并相信 GPT-4 的智能标志着计算机科学及其他领域的真正范式转变。」

图片

论文地址:https://arxiv.org/pdf/2303.12712

如今,Sebastien Bubeck 选择加入 OpenAI,我们可以期待他在 AGI 方向上产出更多的成果。

参考链接:https://www.theinformation.com/briefings/microsoft-ai-researcher-sebastien-bubeck-to-join-openai


http://www.kler.cn/a/349751.html

相关文章:

  • 7.抽象工厂(Abstract Factory)
  • QPS 值是怎样进行计算和应用的
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.21 索引宗师:布尔索引的七重境界
  • 【教学类-89-01】20250127新年篇01—— 蛇年红包(WORD模版)
  • 1.26学习
  • csapp2.4节——浮点数
  • JVM的GC算法以及常见垃圾回收器
  • 多级缓存-
  • HTML5实现古典音乐网站源码模板1
  • 分布式数据库:构建高效、可靠的数据存储与管理系统
  • 观察者模式的思考
  • CSS 实战录: 双栏、四等分、不等间距、自适应...
  • STL --- list(C++)
  • 线程局部存储(TLS)
  • C++11的新特性
  • 【C++算法】10.滑动窗口_无重复字符的最长子串
  • JSON 详解
  • JavaScript 数据类型
  • uniapp做的app实现首页左滑退出应用
  • 深度学习 | Pytorch的GPU版本查看GPU是否可用、GPU版本、GPU数量
  • 13.3寸三防平板大尺寸+高速运行提升工业软件操作体验
  • 数据结构之顺序表——动态顺序表(C语言版)
  • linux和端口相关的命令总结
  • JAVA软开-面试经典题(7)-字符串常量池
  • Flutter打包错误解决指南
  • [Leetcode] 560 Subarray Sum Equals K