LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略
LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略
目录
相关文章
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读
LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略
OpenAI o3-mini的简介
1、特点
2、性能表现
>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率
>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率
3、模型速度和性能
4、安全性
5、未来展望
OpenAI o3-mini的安装和使用方法
1、安装
2、使用方法
ChatGPT
API
OpenAI o3-mini的案例应用
相关文章
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读-CSDN博客
LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略
LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略-CSDN博客
OpenAI o3-mini的简介
OpenAI o3-mini是OpenAI发布的最新推理模型,也是该系列中最经济高效的模型。它于2024年12月预览,现已在ChatGPT和API中可用。o3-mini是一个强大且快速的模型,它突破了小型模型的性能限制,在科学、数学和编码等STEM领域展现出卓越的能力,同时保持了与OpenAI o1-mini相同的低成本和低延迟。
o3-mini是第一个支持函数调用、结构化输出和开发者消息的小型推理模型,使其具备生产就绪能力。它支持流式输出,并提供低、中、高三种推理强度选项,以适应不同的使用场景。 o3-mini作为一款经济高效、功能强大的推理模型,已在多种平台和API中推出,并对不同用户群体开放,极大提升了AI技术的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上线,企业版将于2月上线。API方面,o3-mini已开始向API使用等级3-5的开发者推出。免费用户也可以在ChatGPT中使用o3-mini。
总而言之,OpenAI o3-mini 是一款在保持低成本和低延迟的同时,拥有强大STEM能力,尤其在科学、数学和编码方面表现出色的推理模型。它支持多种开发者功能,并提供了多种推理强度选项,以适应不同的使用场景。在多个基准测试中,o3-mini 的性能超越了其前代模型,并且在安全性方面也进行了充分的考量。o3-mini 的发布标志着 OpenAI 在经济高效人工智能领域取得了重要进展,也为更广泛的 AI 应用铺平了道路。
官网文章:https://openai.com/index/openai-o3-mini/
1、特点
>> 高性价比:o3-mini在保持低成本和低延迟的同时,提供了强大的推理能力。
>> 强大的STEM能力:在科学、数学和编码方面表现出色,尤其在解决复杂问题方面能力突出。
>> 丰富的开发者功能:支持函数调用、结构化输出和开发者消息,方便开发者集成到各种应用中。
>> 可调节的推理强度:提供低、中、高三种推理强度选项,允许开发者根据具体应用场景调整模型的推理深度和速度。
>> 快速响应:平均响应时间比o1-mini快24%,首次token生成时间快2500毫秒。
>> 更高的准确性:专家测试显示,o3-mini的答案更准确、更清晰,推理能力更强,错误率降低了39%。
>> 支持搜索:可以结合搜索引擎查找最新的信息,并提供相关链接(目前为早期原型)。
>> 安全性:采用审慎对齐技术进行训练,在安全性和防越狱评估中表现优异。
2、性能表现
o3-mini在STEM领域表现出色,尤其在数学、编码和科学方面,其性能与OpenAI o1相当甚至超越,同时响应速度更快,错误率更低。o3-mini在各种STEM相关的基准测试和人类偏好测试中均表现优异,证明了其在准确性、速度和推理能力方面的优势。
在多个基准测试中,o3-mini均取得了优异的成绩,包括:
>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率
>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率
>> FrontierMath:o3-mini (高推理强度)在首次尝试时解决了超过32%的问题。
>> 竞赛编码 (Codeforces):o3-mini在不同推理强度下均优于o1-mini。
>> 软件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表现最佳的模型。
>> LiveBench 编码:o3-mini在中、高推理强度下均优于o1-high。
>> 一般知识:o3-mini在一般知识评估中优于o1-mini。
在人类偏好评估中,测试者更倾向于o3-mini的回答 (56%),并且错误率降低了39%。o3-mini的响应速度比o1-mini快24%。
3、模型速度和性能
o3-mini在保持与OpenAI o1相当的智能水平的同时,实现了更快的性能和更高的效率。o3-mini在速度和效率方面显著优于其前代模型,这使其更适合需要快速响应的应用场景。
o3-mini的平均响应时间为7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的时间上也比o1-mini快2500毫秒。
4、安全性
OpenAI 采取了严格的安全措施来确保 o3-mini 的安全性和可靠性。OpenAI 使用审慎对齐技术训练 o3-mini,使其能够安全地响应用户提示。o3-mini在安全性和防越狱评估中显著优于GPT-4o。
在部署之前,OpenAI 对 o3-mini 进行了全面的安全评估,包括外部红队测试和安全评估。详细的评估结果可在 o3-mini 系统卡片中查看。
5、未来展望
OpenAI 将继续努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 将继续致力于开发平衡智能、效率和安全性的模型。OpenAI o3-mini 的发布是 OpenAI 持续推进经济高效人工智能发展的重要一步,它使得高质量的 AI 更加易于获取。
OpenAI o3-mini的安装和使用方法
1、安装
OpenAI o3-mini 目前并未开源,不支持本地部署。用户只能通过在线方式(例如在ChatGPT中使用)或调用OpenAI提供的API来使用该模型。
2、使用方法
ChatGPT
ChatGPT Plus、Team和Pro用户可以直接在模型选择器中选择o3-mini使用。免费用户可以通过选择“Reason”或重新生成回复来使用o3-mini。
付费用户 (Plus, Team, Pro):直接在ChatGPT的模型选择器中选择 o3-mini 即可使用。
免费用户:可以通过两种方式使用:在消息输入框中选择 "Reason"。重新生成已有的回复。
API
o3-mini已开始在Chat Completions API、Assistants API和Batch API中向特定等级的开发者推出。 具体使用方法取决于你选择的 API,请参考 OpenAI 的 API 文档。开发者可以根据需求选择三种推理强度:低、中、高。 高强度推理会更准确,但响应速度较慢;低强度推理速度更快,但准确性可能略低。 中等强度则在速度和准确性之间取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases
from openai import OpenAI
client = OpenAI()
completion = client.chat.completions.create(
model="o3-mini",
messages=[
{"role": "developer", "content": "You are a helpful assistant."},
{
"role": "user",
"content": "Write a haiku about recursion in programming."
}
]
)
print(completion.choices[0].message)
OpenAI o3-mini的案例应用
持续更新中……