【AI文章解读】The Model is the Product
https://vintagedata.org/blog/posts/model-is-the-product
以下是关于网页内容的详尽笔记:
文章标题
The Model is the Product
文章主题
文章探讨了人工智能(AI)领域中模型作为产品的趋势,分析了当前AI发展的几个关键因素,并对未来AI的市场格局、模型训练以及投资方向提出了见解。
主要内容概述
1. 模型作为产品的趋势
- 背景:过去几年,关于AI发展的下一个周期有很多猜测,例如智能体(Agents)、推理系统(Reasoners)或真正的多模态(Multimodality)。
- 核心观点:作者认为,当前的研究和市场发展都指向了一个方向——模型本身将成为产品。
- 支持论据:
- 通用模型扩展停滞:以GPT-4.5为例,模型容量线性增长,而计算成本呈几何级增长。即使在训练和基础设施效率提升的情况下,OpenAI也无法以合理的价格部署如此庞大的模型。
- 观点化训练效果显著:强化学习和推理的结合使得模型能够学习任务,这既不是传统机器学习,也不是基础模型,而是一种“秘密的第三种东西”。即使是小型模型在数学任务上也表现出色,编码模型不再仅仅是生成代码,而是能够管理整个代码库。
- 推理成本大幅下降:DeepSeek的优化使得全球人口每天1万token的需求都能被满足,这意味着单纯出售token的商业模式已不再可行,模型提供商需要向价值链上游移动。
2. 未来模型的形态
- 案例分析:
- OpenAI的DeepResearch:并非在现有模型基础上的简单封装,而是训练了一个全新的模型,能够内部完成搜索任务,无需外部调用、提示或协调。它通过强化学习训练,能够合成大量网站信息以生成结构化报告。
- Anthropic的Claude Sonnet 3.7:专注于复杂代码用例的训练,显著提升了软件工程基准测试的表现。
- 观点:未来的主要进展将通过重新设计模型本身来实现,而非仅仅在现有模型基础上进行工作流优化。
3. 训练与被训练
- 大实验室的策略:大实验室正在公开其策略,将模型训练与应用层捆绑,并试图在应用层捕获更多价值。
- 商业后果:
- API销售的终结:Naveen Rao(Databricks的Gen AI副总裁)预测,所有封闭AI模型提供商将在未来2-3年内停止销售API,只有开放模型会通过API提供。
- 应用层的自动化:应用层将成为AI进化的下一个阶段中首先被自动化和颠覆的部分。
- 市场动态:
- 早期实验:如DeepSearch和Claude Code,DeepSearch不通过API提供,而是用于为高级订阅创造价值;Claude Code是一个极简的终端集成。
- 包装商的转型:一些知名的包装商正在努力成为混合AI训练公司,例如Cursor拥有自己的小自动补全模型,WindSurf有内部廉价代码模型Codium。
- 小包装商的未来:可能会更多地依赖中立的推理提供商,同时更加注重UI设计,因为通用模型可能会捆绑更多常见的部署任务。
4. 强化学习未被定价
- 投资假设的错误:
- 当前AI投资假设应用层独立于模型层,且能够颠覆现有市场。
- 认为模型提供商将不断降低token价格,从而使包装商更盈利。
- 认为封闭模型包装能满足所有需求,包括在对外部依赖有长期担忧的受监管领域。
- 认为建立任何训练能力都是浪费时间。
- 市场失败:这种假设越来越像一种冒险的赌注,未能准确定价最新的技术发展,尤其是强化学习。模型训练本应是风险分散的完美例子,但目前模型训练公司难以筹集资金。
- 训练生态系统的现状:除了大实验室外,训练生态系统非常小,只有少数公司和学术机构在从事相关工作。
- 未来趋势:
- 大实验室可能会选择与早期训练阶段的合作伙伴,而非仅仅是API客户。
- 小型专业团队可能更适合处理一些尚未成熟的AI用例,最终可能成为潜在的收购目标。
5. DeepSeek和中国实验室
- DeepSeek的定位:DeepSeek已经更进一步,将模型视为一种通用基础设施层,而不仅仅是产品。
- 中国实验室的策略:以DeepSeek为例,其创始人连文峰公开表示,当前阶段是技术创新的爆发,而非应用的爆发。如果形成了完整的上下游产业生态系统,那么他们无需自己开发应用,但如果有需要,他们也可以开发应用,不过研究和技术创新始终是首要任务。
结论
文章认为,模型作为产品的趋势正在改变AI的市场格局。大实验室正在向价值链上游移动,而应用层可能会被自动化和颠覆。强化学习等技术的发展尚未被市场充分定价,导致投资方向可能存在问题。未来,AI的发展将更多地依赖于模型的重新设计和训练,而非仅仅在现有模型基础上进行优化。
作者观点
- 模型训练的重要性:模型训练是未来AI发展的关键,但目前市场对训练能力的重视不足。
- 应用层的未来:应用层可能会被自动化,包装商需要转型或专注于特定领域。
- 投资方向的调整:投资者需要重新评估模型训练的价值,并关注技术创新而非仅仅应用开发。