当前位置: 首页 > article >正文

从同样一个简单的计算问题,看星火4.0 Turbo模型推理逻辑能力

引言

上一篇文章(从一个简单的计算问题,看国内几个大语言模型推理逻辑能力)的编写时间是10月23日,当时看,星火4.0大模型的逻辑推理能力不行。10月24号,讯飞推出了星火4.0 Turbo,就想用上一篇文章同样的题目来看看星火4.0 Turbo模型推理逻辑能力。

同样的问题

123456*987654等于多少,给出你计算的过程。

 这次的回答怎么说呢,第一次回答和上次第一次回答一样,要具体问计算过程才给出详细的计算过程。看来语言理解上还是有些问题,不过这次给出了正确的计算结果。但接下来的提问,哎,只能还是让人大失所望,这基本的减法就能出错,给出的计算公式和结果都不带验证的。

结果

出于好奇,就想起了之前百度文心一言用乘法分配律计算进行计算的骚操作,就提示让用这个方法给出详细计算过程。给出的计算过程如下,如果单从逻辑推理的角度来看,方法步骤还是合理的,奈何这第一步,将987654分解成两个数的和,这个分解结果的数就错了,说明模型在基本计算的理解和基本计算校验上还是不行。看来大模型对这些基本的计算还是不理解的。


http://www.kler.cn/a/375387.html

相关文章:

  • SQL server学习09-数据库编程(上)
  • Leetcode 3393. Count Paths With the Given XOR Value
  • ctfshow web入门文件上传总结
  • 20241230 机器学习ML -(1)线性回归(scikitlearn)
  • vscode 快速切换cangjie版本
  • Python读取Excel批量写入到PPT生成词卡
  • 小张求职记二:完善简历
  • 【CSS】——基础入门常见操作
  • 如何在 Ubuntu 16.04 上使用 UFW 设置防火墙
  • VsCode显示空格
  • 移远通信推出八款天线新品,覆盖5G、4G、Wi-Fi和LoRa领域
  • const对象仅在文件内有效的问题
  • 探讨Facebook的AI研究:未来社交平台的技术前瞻
  • 机器视觉中光源镜头和相机的关系
  • Django数据模型on_delete属性值
  • 大厂面试真题-很多系统会使用netty进行长连接,连接太多会有问题吗
  • Linux中部署PostgreSQL保姆级教程
  • 实习冲刺Day10
  • 【CSS】CSS 样式重置 (normalize.css 和 reset.css) 和通用样式配置
  • 虚拟现实与增强现实:重塑娱乐和教育的边界!
  • Pytest-Bdd-Playwright 系列教程(6):在测试步骤函数中设置别名数据共享
  • 校园社团信息管理:Spring Boot技术的优势与实现
  • 提升用户体验优化全攻略
  • !!!Docker 实践与应用实例
  • vue系列==vue3新语法
  • 奥数与C++小学四年级(第十六题 魔法学院)