当前位置: 首页 > article >正文

测试Bard和ChatGPT关于双休的法规和推理

Bard是试验品,chatgpt是3.5版的。

首先带着问题,借助网络搜索,从政府官方网站等权威网站进行确认,已知正确答案的情况下,再来印证两个大语言模型的优劣。

想要了解的问题是,在中国,跟法定工作时间有关的两个法律法规,一个是1995年开始实施、最新2018年修订的《劳动法》,一个是1995年修订国务院第146号令的国务院第174号令,是否冲突,以及哪个优先。

下面是Bard的回答,简直毫无逻辑和底线,不但弄错国务院令的内容、还杜撰出已经废止的答案,如果是真人的话,绝对是无赖级别的、道德有问题:
在这里插入图片描述在这里插入图片描述ChatGPT3.5虽然在逻辑上也存在类似问题,但可接受程度要高很多,也不至于把人误导到坑里还死不认账。
在这里插入图片描述
但是,他们在特定概念(比如法令、法律)的唯一确定性(或同一身份)认知上,存在天然的缺陷,这个问题我以前查特定论文、并要求给出论文的doi代码也发现过:chatgpt 3.5给出的doi跟论文完全没有关系,而且它会根据谈话背景杜撰出标题是你想要找的可能根本不存在的所谓论文来误导;在进行简单的逻辑推理方面,可以说是毫无逻辑可言(完全无法依赖其逻辑推理能力)。


http://www.kler.cn/news/135472.html

相关文章:

  • 【Java 进阶篇】Ajax 实现——JQuery 实现方式 `ajax()`
  • java学习part06数组
  • UDP网络套接字编程
  • 【开源】基于Vue.js的高校宿舍调配管理系统
  • MATLAB读取每行文本并提取字符串后的数字
  • Vim 从何而来?
  • Go并发编程学习-class1
  • 使用 VPN ,一定要知道的几个真相!
  • 5分钟带你了解什么是敏捷测试?难点显而易见!
  • qt使用AES加密、解密字符串
  • vue过渡,vue3组合式API详细介绍
  • Ajax之引入
  • 配置 `PostgreSQL` 与 `Keepalived` 以实现高可用性
  • 开发者生态:共享知识,携手共进,共创技术辉煌
  • PHP项目学习笔记-萤火商城-增加一个模块(表涉及到的操作和文件)
  • vue3项目安装eslint和prettier
  • mysql面试题——存储引擎相关
  • Typora下载安装 (Mac和Windows)图文详解
  • Python利器:os与chardet读取多编码文件
  • 德语B级SampleAcademy
  • Golang环境搭建Win10(简洁版)
  • Redux-状态管理组件
  • 053-第三代软件开发-元对象系统
  • Java中异常的概念、体系结构和分类
  • docker安装elasticsearch,elasticsearch-head
  • 【数字图像处理】Gamma 变换
  • 【Electron】electron-builder打包失败问题记录
  • svn问题集
  • 解决requests 2.28.x版本SSL错误:证书验证失败
  • 【Linux】Linux下的基础IO