当前位置: 首页 > article >正文

『大模型笔记』Jason Wei: 大语言模型的扩展范式!

Jason Wei: 大语言模型的扩展范式!

文章目录

  • 一. What is scaling and why do it?
    • 1. 什么是Scaling?
    • 2. 为什么要Scaling?
  • 二. Paradigm 1: Scaling next-word prediction
    • 1. 下一个词预测
    • 2. 极限多任务学习
    • 3. Why does scaling work?
  • 三. The challenge with next-word prediction
    • 1. 链式思维提示(Chain-of-thought prompting)
    • 2. 思维链提示的局限性
  • 四. Paradigm 2: Scaling RL on chain-of-thought
  • 五. How scaling changed AI culture & what’s next?
    • 1. 数据方面
    • 2. 评估方法
    • 3. 模型类型
    • 4. 团队规模
    • 5. AI 的未来
  • 六. 参考文献

一. What is scaling and why do it?

今天和大家分享一下OpenAI研究员Jason Wei在CIS 7000上所做的演讲。演讲的主题是关于 缩放法则,也称为扩展定律的Scaling Laws
Jason Wei毕业于斯坦福大学,曾在Google Brain工作三年,是思维链CoT的作者,也为o1模型做出了重要贡献。他在社交媒体上也非常活跃,这次演讲内容深入浅出,值得我们关注。

在过去的几年间,人工智能取得了令人瞩目的突破,Scaling Laws在其中扮演了核心引擎的角色。那么,它是如何推动人工智能的发展,以及是否将继续推动其向前发展呢ÿ


http://www.kler.cn/a/550672.html

相关文章:

  • 使用Navicat for MySQL工具连接本地虚拟机上的MySQL
  • Ubantu安装Prometheus、Grafana、node_exporter、elasticsearch_exporter监控运行状态
  • linux中(base) [root@ZS ~]# 是什么情况,怎么退出
  • 【C++指南】类和对象(十):const成员函数
  • ctf网络安全大赛python
  • Mysql-死锁图文详解
  • 前端JS接口加密攻防实操
  • 进阶——第十六届蓝桥杯嵌入式熟练度练习(开发板捕获频率和占空比)
  • OpenCV中的边缘检测
  • 基于YOLO11深度学习的胃肠道息肉智能检测分割与诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割、人工智能
  • uniapp 安卓10+ 选择并上传文件
  • 数据驱动业务增长,E-MapReduce 真实案例解析
  • 数据分析简介及其常用指标与方法
  • DeepSeek 引领AI 大模型时代,服务器产业如何破局进化?
  • 案例|平顶山某大型能源化工集团配电房轨道巡检机器人解决方案
  • Spring Cloud Gateway可以做什么?
  • Python中如何进行数据库连接?
  • win10 系统 自定义Ollama安装路径 及模型下载位置
  • CViewState::InitializeColumns函数分析之_hdsaColumnStates的结构
  • Xorp架构下的XRL,Unix_TCP_ Socket与异步IO回调函数技术