当前位置: 首页 > article >正文

【杂记】裂脑人实验和语言模型幻觉

【杂记】裂脑人实验和语言模型幻觉

模型的自主意识在哪里,人的自我认知在哪里?自然而然的,“裂脑人” 这个词突然出现在我脑海里。然后随意翻了翻相关的文章,觉得这个问题和目前大模型面临的幻觉问题也高度相关,遂随笔记录。

裂脑人

什么是裂脑人?人的大脑左右半脑本来是一个整体,因为先天或者后天的原因让左右半脑分开不产生连接,就是“裂脑”。过去这个方法被作为控制恶性癫痫的治疗手段。

一些铺垫知识

  • 我们也知道左脑和右脑负责的功能是不一样的。比如语言组织,思考推理主要由左脑负责,右脑负责一些空间推理,直觉等
  • 左脑控制人身体的右半边:比如你的右眼,你的右胳膊
  • 相应的,右脑控制你身体的左半边:比如你的左眼,右胳膊

两个实验

下面加扎尼加是对于受试者(后天裂脑人)的两个实验

挥手实验->语言编造

实验者给受试者的“左眼”展示“挥手”一词(让右脑知道“挥手”信息),并让受试者按照信息行事。这时受试者便挥了挥手。

此时,实验者准备刁难一下受试者的左脑(左脑没见过“挥手”,但是知道自己挥手了),实验者问受试者你为什么刚才挥手?受试者此时犹豫了片刻之后回复到:以为刚才看见了一个朋友,所以挥了挥手。

联想实验->语言编造

实验者让受试者左眼看到一幅雪景,右眼看到一只鸡脚,然后让他在桌子上的卡片中,左右手各挑选一张有关联的卡片。

受试者由右脑控制的左手挑的是一个铲雪的铲子,而由左脑控制的右手则是挑了一只鸡。

而这一次受试者的解释是:因为看到了鸡爪所以挑选鸡,而挑铲子是因为要用它打扫鸡厩!
(这时因为受试者用语言解释的时候只能依赖左脑,而左脑知道右眼见过鸡,却不知道左眼见过雪景)
请添加图片描述

裂脑人的幻觉

上面两个例子中,受试者都产生了幻觉!产生幻觉的原因,都是由于负责推理和表达的左脑不知道仅仅传递给右脑的信息,然后做出了臆想。

模型的幻觉

铺垫了这么久,可以谈谈大模型了。我们都知道大语言模型也经常产生幻觉!当然大语言模型的幻觉的定义不是那么统一,姑且这么称呼吧。

在过去的实验中,我发现无论给模型过多的信息或者过少的信息,模型都容易产生严重的幻觉!

比如下面有一段文字(省略了很多内容)

Spam msubi是夏威夷一种流行的小吃和午餐食物,它是由... ...在日语中又被称作 ...

我问大模型,请提取上面这段内容中和 (Spam,流行小吃,午餐食物, 夏威夷) 相关的内容,大模型可以正确的回答 Spam是夏威夷一种流行小吃和午餐食物

但是!如果我问大模型请提取上面这段内容中和 (Spam,罐装,流行小吃,午餐食物, 夏威夷)相关的内容,大模型则会错误的回答 Spam是夏威夷一种流行小吃和罐装午餐食物

当然上面的例子只是在我之前某次实验提供过多信息发现模型容易产生幻觉,相应的那些由于缺少信息产生的幻觉更是数不胜数。

解决幻觉

从这里开始都是我的瞎说~

  1. 首先就是信息不能过多也不能过少,在之前的实践中我就是这么进行的,并且发现这样做确实能够一定程度的缓解幻觉。作为一个头疼医头,脚疼医脚的策略。
  2. 我猜想人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力。比如说 (a)裂脑人只依赖左脑回答问题比正常人左右脑协同工作更多产生幻觉 (b)当人似醒未醒,或者被酒精麻痹了状态下(此时大脑的前额叶并没有苏醒进入工作状态或者是酒精中毒了),人总是会胡言乱语产生大量幻觉。胡说八道的大模型类比成大脑各部分还没配合起来的人类。 人的大脑各个部分不仅可以独立工作,还可以互相监督。而目前的语言模型,并没有类似的能力(多agent的操作可能有点类似)。

http://www.kler.cn/news/293832.html

相关文章:

  • 深度解析:基于离线开发的数据仓库转型落地案例
  • DIAS:用于DSA序列中颅内动脉分割的数据集和基准|文献速递--基于深度学习的医学影像病灶分割
  • ICM20948 DMP代码详解(6)
  • vim常用快捷键问答之二
  • CentOS 7 上安装 NVIDIA Docker
  • ​​NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南002
  • 设计模式-行为型模式-状态模式
  • 如何在 Ubuntu 24.04 上安装 MariaDB ?
  • 怎么使用matplotlib绘制一个从-2π到2π的sin(x)的折线图-学习篇
  • 深度学习基础--卷积的变种
  • 江协科技stm32————11-5 硬件SPI读写W25Q64
  • zookeeper初识
  • Optuna发布 4.0 重大更新:多目标TPESampler自动化超参数优化速度提升显著
  • Docker | Win10 安装
  • vscode spring boot项目编辑yaml不自动提示补全如何解决
  • Ubuntu 基于sox音频处理工具shell脚本批量处理音频文件
  • C++ | Leetcode C++题解之第387题字符串中的第一个唯一字符
  • 问:你知道IO和NIO有哪些区别不?
  • 基于golang实现简单的文件监控
  • 【Python百日进阶-Web开发-音频】Day705 - 音频加载 librosa.load / librosa.stream
  • 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-02-广域网网络架构
  • HTML和HTML5有什么区别
  • 畅捷通如何远程访问
  • 主流的3D模型格式有什么区别?
  • 数据分析有哪些流程?
  • 【iOS】Runtime
  • 以低代码技术加速推动企业数字创新
  • 一款可以替代Notepad++的免费高级文本编辑器
  • 数字人模型像素流送实时渲染网页手机平板用语音交互
  • 363_C++_配合360_负责读取和处理录像数据RecordReader类