DeepSeek-V3 模型更新,加量不加价
DeepSeek V3-0324 是 DeepSeek V3 系列的重要升级版本,虽然被官方称为「小版本迭代」,但其在技术能力、开源策略和用户体验上均有显著提升。以下是主要新特性功能和核心变化:
推理能力
- 基准测试性能显著提升:
- MMLU-Pro:75.9→81.2(+5.3)
- GPQA:59.1 → 68.4 (+9.3)
- 平均每场得分:39.6 → 59.4 (+19.8)
- LiveCodeBench:39.2 → 49.2 (+10.0)
前端 Web 开发
- 提高了代码的可执行性
- 更加美观的网页和游戏前端
汉语写作能力
-
增强的风格和内容质量:
- 与 R1 写作风格保持一致
- 中长篇写作质量更高
-
功能增强
- 改进的多轮交互式重写
- 优化翻译质量和信函写作
中文搜索功能
- 增强报告分析请求,提供更详细的输出
函数调用改进
- 提高了函数调用的准确性,修复了之前 V3 版本中的问题
大白话总结
- 参数更大:模型体积微涨,但跑得更快更省电,甚至能在家用电脑上运行。
- 代码更强:现在能自动生成酷炫网页,效果媲美行业顶尖模型,小白也能当程序员。
- 数学更牛:连小学生题都难不倒它,解题速度和正确率大幅提升。
- 免费商用:企业可以随便改、随便用,还能享受夜间低价。
- 对话更溜:聊天更像真人,废话变少,反应更快。
这次升级看似低调,实则「加量不加价」,尤其对开发者和企业来说,性价比直接拉满。
Model Scope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
Huggingface:
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324