当前位置: 首页 > article >正文

豆包大模型 1.5 正式发布,全面上线火山方舟

今天,豆包大模型 1.5 正式发布!

全新 Doubao-1.5-pro 模型综合能力显著增强,在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。

目前,豆包大模型 1.5 已全面上线火山方舟,邀你来测!

点击链接即刻体验:https://console.volcengine.com/auth/login?redirectURI=%2Fark%2Fregion%3Aark%2Bcn-beijing%2Fmodel%3FprojectName%3Dundefined%26vendor%3DBytedance%26view%3DLIST_VIEW

效果领先,豆包大模型 1.5 超越 GPT-4o、Claude 3.5

豆包通用模型 pro(Doubao-1.5-pro)

本次更新,我们在多个公开评测基准上,对 Doubao-1.5-pro 的性能进行评估。Doubao-1.5-pro 在知识(MMLU_PRO、GPQA)、代码(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型。

备注:

  • 其他模型的评测指标来自官方评测结果,官方评测结果中不含的部分来自内部评测平台结果

  • GPT-4o-0806 在语言模型公开评测指标中显著优于 GPT-4o 其他版本 GitHub - openai/simple-evals

豆包通用模型 lite(Doubao-1.5-lite)

Doubao-1.5-lite 在轻量版语言模型中也处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)权威测评指标持平或超越 GPT-4omini,Cluade 3.5 Haiku。其模型效果甚至可以比肩 9 月份的 Doubao-pro-32k-0828,意味着客户在众多场景中,可以直接用 lite 模型成本,获得过去 pro 模型的效果。

豆包·视觉理解模型(Doubao-1.5-vison-pro)

相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。

Doubao-1.5-vision-pro 在多个权威测评基准上取得全球领先表现:

备注:在评测中 GPT-4o-1120 在多模态能力上要优于 GPT-4o-0806

支持任意分辨率和极端长宽比图像识别

分辨率一直是影响视觉理解能力的重要因素,为了处理各种场景下的复杂图像输入,Doubao-1.5-vision-pro 采用了原生动态分辨率的架构设计,支持任意分辨率的图像输入。无论是高清大图还是低分辨率的小图,亦或是极端长宽比例的图像,模型都能实现精准的特征提取和高效的计算性能。

领先的复杂指令遵循能力

Doubao-1.5-vison-pro 通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入了多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。

豆包·实时语音模型 (Doubao-1.5-realtime-voice-pro)

本次推出了豆包·实时语音模型,并在豆包 APP 全量开放( 体验前,请将豆包 APP 请升级至 7.2.0 版本 )。

作为一款语音理解和生成一体化的模型,豆包实时语音大模型真正实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务,敬请期待。

高效模型结构,超低成本

豆包大模型 1.5 从预训练阶段就坚持训练-推理一体设计,在最强模型效果、卓越模型性能和最优推理成本之间取得平衡。

模型结构上,豆包大模型 1.5 采用大规模稀疏 MoE 架构,以较小的激活参数进行预训练,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。

同时,字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

豆包大模型 1.5 在训练过程中,未使用任何其他模型生成的数据,扎实不走“捷径”。豆包大模型构建完全自主的数据生产体系,以标注团队与模型 self play 技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。

详细了解,请参考: https://team.doubao.com/doubao\_1\_5\_pro

加量不加价,助力大模型应用加速爆发

效果、性能和最优推理成本之间的极致平衡,让豆包大模型在各行各业中被广泛使用,tokens 调用量不断日创新高。

豆包大模型 1.5 全产品,包括 doubao-1.5-pro,doubao-1.5-lite,doubao-1.5-vision-pro 等, 将继续保持原有模型价格不变,加量不加价。 火山引擎将一直坚持 AI 普惠,助力 AI 创新,让更多企业和开发者获得豆包大模型带来的帮助!

资料来源:火山引擎-开发者社区


http://www.kler.cn/a/583271.html

相关文章:

  • 中国软件供应链安全技术指南|DevSecOps敏捷安全技术金字塔V3.0正式发布
  • MySQL启动报错解决
  • Linux》》Ubuntu22.04下Docker的安装 Docker
  • 【Java代码审计 | 第十一篇】SSRF漏洞成因及防范
  • C# Channel
  • springboot集成neo4j搭建知识图谱后端项目(一)
  • 深度学习基础:线性代数本质5——行列式
  • 【网络安全 | 漏洞挖掘】$15,000——通过持久token获取个人身份信息(PII)
  • 图像识别技术与应用-YOLO
  • 2025年渗透测试面试题总结-奇安信安全工程师(题目+回答)
  • 数字人分身开发指南:从概念到实战
  • 使用Nodejs基于DeepSeek加chromadb实现RAG检索增强生成 本地知识库
  • 树莓集团落子海南,如何重构数字产业生态体系​
  • 成为超人 21:超人怎么学?技能的学习,如编程
  • 每天一篇《目标检测》文献(一)
  • 【最长递增子序列】【LeetCode算法】【c++】【动态规划】
  • mac安装mysql之后报错zsh: command not found: mysql !
  • MybatisPlus中的customSqlSegment动态拼接where条件
  • 30天学习Java学前准备2——JAVA中的三种注释
  • 【DuodooTEKr】物联DTU设备与Odoo18 Maintenance设备模块IOT模块集成技术方案