当前位置: 首页 > article >正文

数学大模型MAmmoTH:通过混合说明调整建立数学通才模型

在这里插入图片描述

向悦和陈文虎是该项目的主要作者。他们这个项目推出 MAmmoTH,这是一系列专为解决一般数学问题而定制的开源大型语言模型 (LLM)。 MAmmoTH 模型在 MathInstruct 上进行训练,MathInstruct 是我们精心策划的指令调整数据集。 MathInstruct 已编译 来自 13 个具有中间原理的数学数据集,其中 6 个具有我们新整理的原理。它拥有思想链(CoT)和思想计划(PoT)基本原理的混合,并且还确保广泛的 涵盖数学的不同领域。 CoT 和 PoT 的混合不仅可以释放工具使用的潜力,还可以针对不同的数学问题提供不同的思维过程。因此,MAmmoTH 系列实质上 在所有规模的 9 个数学推理数据集上,其性能优于现有开源模型,平均准确度增益在 12% 到 29% 之间。值得注意的是,我们的 MAmmoTH-7B 模型在 MATH(竞赛级别)上达到了 35% 数据集),超过最好的开源7B模型(WizardMath)25%,MAmmoTH-34B模型在MATH上达到46%的准确率,甚至超过了GPT-4的CoT结果。我们的工作强调了多样化问题的重要性 覆盖范围以及在开发高级数学通才模型时使用混合原理。

项目地址:https://tiger-ai-lab.github.io/MAmmoTH/
在这里插入图片描述
在这里插入图片描述

参考资料

https://www.aibase.com/zh/tool/34999


http://www.kler.cn/a/518455.html

相关文章:

  • 浏览器默认语言与页面访问统计问题二三则
  • 网络知识小科普--5
  • 题海拾贝:力扣 622.设计循环队列
  • 后端面试题分享第一弹(状态码、进程线程、TCPUDP)
  • Midscene.js:重新定义UI自动化的新时代工具
  • 新版IDEA创建数据库表
  • PCIE模式配置
  • Elasticsearch 性能测试工具 Loadgen 之 002——命令行及参数详解
  • web端ActiveMq测试工具
  • AI Agent的规划系统:让Agent更智能地完成任务
  • Spring--SpringMVC使用(接收和响应数据、RESTFul风格设计、其他扩展)
  • 2、ceph的安装——方式二ceph-deploy
  • 亚博microros小车-原生ubuntu支持系列:8-脸部检测与人脸特效
  • python iter函数介绍
  • Frida使用指南(三)- Frida-Native-Hook
  • 原生HTML集合
  • Spring Security(maven项目) 3.0.2.7版本
  • ray.rllib 入门实践-3: 配置参数列表
  • 深圳云盟智慧科技公司智慧停车管理系统GetVideo存在SQL注入漏洞
  • Java 中如何使用 SSL 连接 IoTDB