当前位置：首页 > article >正文

零一万物新模型Yi-Lightning：超越GPT-4o

article 2024/10/27 9:36:58

10月16日，零一万物发布了最新的旗舰模型Yi-Lightning（闪电），在中国大模型中首度超越 GPT-4o。它在国际权威盲测榜单 LMSYS 上取得了显著成绩，超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet，排名世界第六，中国第一。这一成就标志着中国在人工智能领域的实力和进步。

在多个子榜单中，Yi-Lightning 的表现同样十分出色。在中文子榜单上，Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13 和智谱发布的 GLM-4-Plus 等国内外优秀模型，与 o1-mini 等模型并列全球第二。

在数学和代码能力方面，Yi-Lightning 也位居全球第一梯队。在数学和代码子榜单上，Yi-Lightning 分别获得了第三名和第四名的成绩。

在以专业性和高难度著称的艰难提问与长提问榜单上，Yi-Lightning 表现依然出色，均获得全球第四的优异成绩。

1. Yi-Lightning的主要特点

推理速度与成本：据官方数据显示，基于8xH100算力的环境下，Yi-Lightning的首包时间仅为其前一代模型Yi-Large的一半。与上一代旗舰模型 Yi-Large 相比，Yi-Lightning 的最高生成速度提升了近 40%，首包时间缩短了一半。每百万个 token 的推理成本仅为 0.99 元，接近行业最低水平。
AI 2.0 数字人解决方案：专注于零售和电商等应用场景，提供角色大模型、直播语音大模型和电商话术大模型等，具备动作训练、表情生成、多国语言支持、情感表达和智能对话等功能。
全行业解决方案：广泛应用于零售、医疗、教育和物流等领域，涵盖 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。
模型架构创新：与之前的稠密模型架构相比，这款新模型采用了混合专家模型架构（Mixture of Experts, MoE）。这一架构通过激活不同的专家子模型，能够在处理大量数据时显著提升效率和准确性。结合深度学习与机器学习的优势，Yi-Lightning展现了前所未有的灵活性，极大地拓宽了应用场景。
极速推理：基于动态 Top-P 路由机制，根据任务难度自动选择最适合的专家网络组合，平衡推理成本与模型性能。
多阶段训练：训练过程采用多阶段模式，前期注重数据多样性，后期则侧重于更丰富和知识性更强的数据。

2. Yi-Lightning的技术原理

MoE 混合专家模型架构：结合多个专家网络处理不同任务，动态选择激活哪些专家网络。在训练过程中，所有专家网络都被激活，在推理阶段，模型会选择性地激活更匹配的专家网络。
混合注意力机制：Yi-Lightning 优化了混合注意力机制，只在模型的部分层次中将传统的全注意力（Full Attention）替换为滑动窗口注意力（Sliding Window Attention），降低计算成本，同时保持对长序列数据的高效处理能力。
跨层注意力（CLA）：Yi-Lightning 引入了跨层注意力机制，支持模型在不同的层次之间共享键（Key）和值（Value）头，减少对存储资源的需求，提高模型的推理效率。
动态 Top-P 路由：根据任务难度动态选择最合适的专家网络组合，实现极速推理。

3. Yi-Lightning的主要应用场景

翻译领域
- 提供高质量的翻译服务，处理语言理解和生成、跨语言能力、上下文感知能力等。
- 在多个模型的对比中，Yi-Lightning展现了其精准且具有文学色彩的翻译能力。
零售和电商直播
- 零一万物推出的AI 2.0数字人方案，基于Yi-Lightning模型，聚焦于零售和电商场景。
- 实现弹幕互动、商品信息提取、实时话术生成等功能，提升数字人的实时互动效果，使话术更流畅，回复更准确。
企业级解决方案
- 应用于零一万物的To B战略下的企业级解决方案，为企业提供定制化的AI服务。
- 帮助企业提升效率和营收，通过接入Yi-Lightning，某酒旅企业的GMV较此前上升了170%。
多语言处理
- 在中文分榜上，Yi-Lightning展现了强大的中文处理能力，与国际顶尖模型相比也毫不逊色。
数学和代码生成
- 在数学和代码分榜上，Yi-Lightning分别取得了第三、第四名的成绩，显示了其在这些领域的强大能力。
处理长提问和复杂问题
- Yi-Lightning在处理长提问和艰难提问方面也表现出众，均取得世界第四的优异成绩，证明了其解决复杂问题的能力。

4. 结语

零一万物于10月16日发布的 Yi-Lightning 模型，标志着中国在人工智能领域取得了重要突破。作为首款在国际权威盲测榜单 LMSYS 上超越 GPT-4o 的中国模型，Yi-Lightning 的技术和性能备受关注。该模型采用混合专家模型架构，推理速度提高近 40%，成本接近行业最低，展现出卓越的效率和灵活性。

Yi-Lightning 在多个领域展现出巨大应用潜力，包括零售、电商直播、企业级解决方案、多语言处理以及数学和代码生成等。其独特的动态 Top-P 路由机制和优化的混合注意力机制，使其在处理复杂任务时表现尤为出色，尤其在长提问和难题处理方面位居世界前列。Yi-Lightning 不仅在技术上取得了重大突破，还为各行业带来了创新解决方案，预示着中国人工智能的未来将更加光明。

查看全文

http://www.kler.cn/news/367089.html