当前位置：首页 > article >正文

『大模型笔记』Jason Wei: 大语言模型的扩展范式！

article 2025/2/28 18:06:10

Jason Wei: 大语言模型的扩展范式！

文章目录

一. What is scaling and why do it?
- 1. 什么是Scaling？
- 2. 为什么要Scaling？
二. Paradigm 1: Scaling next-word prediction
- 1. 下一个词预测
- 2. 极限多任务学习
- 3. Why does scaling work?
三. The challenge with next-word prediction
- 1. 链式思维提示（Chain-of-thought prompting）
- 2. 思维链提示的局限性
四. Paradigm 2: Scaling RL on chain-of-thought
五. How scaling changed AI culture & what’s next?
- 1. 数据方面
- 2. 评估方法
- 3. 模型类型
- 4. 团队规模
- 5. AI 的未来
六. 参考文献

一. What is scaling and why do it?

今天和大家分享一下OpenAI研究员Jason Wei在CIS 7000上所做的演讲。演讲的主题是关于 缩放法则，也称为扩展定律的Scaling Laws。
Jason Wei毕业于斯坦福大学，曾在Google Brain工作三年，是思维链CoT的作者，也为o1模型做出了重要贡献。他在社交媒体上也非常活跃，这次演讲内容深入浅出，值得我们关注。

在过去的几年间，人工智能取得了令人瞩目的突破，Scaling Laws在其中扮演了核心引擎的角色。那么，它是如何推动人工智能的发展，以及是否将继续推动其向前发展呢ÿ

http://www.kler.cn/a/550672.html

相关文章：

使用Navicat for MySQL工具连接本地虚拟机上的MySQL

Ubantu安装Prometheus、Grafana、node_exporter、elasticsearch_exporter监控运行状态

linux中(base) [root@ZS ~]# 是什么情况，怎么退出

【C++指南】类和对象（十）：const成员函数

ctf网络安全大赛python

Mysql-死锁图文详解

前端JS接口加密攻防实操

进阶——第十六届蓝桥杯嵌入式熟练度练习（开发板捕获频率和占空比）

OpenCV中的边缘检测

基于YOLO11深度学习的胃肠道息肉智能检测分割与诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割、人工智能

uniapp 安卓10+ 选择并上传文件

数据驱动业务增长，E-MapReduce 真实案例解析

数据分析简介及其常用指标与方法

DeepSeek 引领AI 大模型时代，服务器产业如何破局进化？

案例|平顶山某大型能源化工集团配电房轨道巡检机器人解决方案

Spring Cloud Gateway可以做什么?

Python中如何进行数据库连接？

win10 系统自定义Ollama安装路径及模型下载位置

CViewState::InitializeColumns函数分析之_hdsaColumnStates的结构

Xorp架构下的XRL，Unix_TCP_ Socket与异步IO回调函数技术