当前位置: 首页 > article >正文

论文略读:Can We Edit Factual Knowledge by In-Context Learning?

EMNLP 2023

  • 第一个探索in-context learning在语言模型知识编辑方便的效果
    • 传统的知识编辑方法通过在包含特定知识的文本上进行微调来改进 LLMs
      • 随着模型规模的增加,这些基于梯度的方法会带来巨大的计算成本
    • ->论文提出了上下文知识编辑(IKE),无需任何梯度和参数更新

1 背景

  • 知识编辑:修改语言模型在与训练阶段学到的知识(比如虚假内容、过时内容、偏见内容等)
    • 目标是双重的
      • 泛化性
        • 对描述相同知识的各种输入进行泛化
      • 特定性
        • 不干扰其他不相关的知识

2 论文方法

3 效果


http://www.kler.cn/a/371097.html

相关文章:

  • uniapp 小程序 textarea 层级穿透,聚焦光标位置错误怎么办?
  • 【数字化】华为-用变革的方法确保规划落地
  • 小游戏前端地区获取
  • 【计算机网络】深入浅出计算机网络
  • 【2025 Rust学习 --- 17 文本和格式化 】
  • Vue2+OpenLayers使用Overlay实现点击获取当前经纬度信息(提供Gitee源码)
  • 154. 寻找旋转排序数组中的最小值 II
  • MATLAB车道检测与跟踪
  • ctfshow(179->182)--SQL注入--更多过滤与like运算符
  • 基于fpga技术的脉冲信号源设计(论文+源码)
  • VantUI
  • 理解生成式模型中的Temperature、Top-k 以及 Top-p 参数
  • AI驱动的低代码未来:加速应用开发的智能解决方案
  • R语言实现GWAS meta分析(1)
  • 基于 vue 快速上手 React
  • 嵌入式软件 Bug 排查与调试技巧
  • 嵌入式学习-网络-Day03
  • 从头学PHP之流程控制
  • 基于Mysql、JavaScript、PHP、ajax开发的MBTI性格测试网站(前端+后端)
  • 【React】React18核心源码解读
  • Spring Boot植物健康系统:绿色科技的突破
  • 基于SSM+小程序的购物管理系统1
  • 整合Mybatis-plus及最佳实践
  • Android中SurfaceView与GLSurfaceView 的关系
  • 3GPP协议解读_NTN系列(一)_38.811_非地面网络(NTN)的背景、应用场景和信道建模
  • 京东双十一高并发场景下的分布式锁性能优化