当前位置: 首页 > article >正文

visual prompt tuning和visual instruction tuning

visual prompt tuning:作为一种微调手段,其目的是节省参数量,训练时需要优化的参数量小。

输入:视觉信息image token+可学习的prompt token

处理任务:比如常见的分类任务

visual prompt tuning

visual instruction tuning:目的是提高模型的听从指令的能力

一般会使用到指令数据集,指令数据大概是“问题-答案”这样的形式,问模型问题相当于给模型下指令。

输入:视觉信息(图像嵌入)+语言指令(文本嵌入)

处理任务:问模型问题,模型给回答

visual instruction tuning

其他:比如写prompt提示词给GPT,这里的prompt貌似也是指问GPT的问题。 


http://www.kler.cn/a/308853.html

相关文章:

  • 探索MoviePy:Python视频编辑的瑞士军刀
  • 【Visual Studio】使用VS调试(Debug)
  • JavaWeb后端开发知识储备1
  • 844.比较含退格的字符串
  • 基于Python的网上银行综合管理系统
  • C++编程技巧与规范-类和对象
  • 白话:大型语言模型中的幻觉(Hallucinations)
  • react hooks--useState
  • Spring Boot基础
  • 【C#生态园】虚拟现实与增强现实:C#开发库全面评估
  • 【C++】—— list 的了解与使用
  • 一天认识一个硬件之显示器
  • squid代理及常见的代理上网(Squid Proxy and Common Proxy Internet Access)
  • 组件编译脚本(Component Compilation Script)
  • vue3 动态 svg 图标使用
  • 网络安全实训八(y0usef靶机渗透实例)
  • 深度学习之图像数据集增强(Data Augmentation)
  • Java代码审计篇 | ofcms系统审计思路讲解 - 篇4 | XXE漏洞审计
  • Vue.nextTick 的工作机制
  • 【乐企-业务篇】开票前置校验服务-规则链服务接口实现(纳税人基本信息)
  • 基于SpringBoot+Vue+MySQL的网上甜品蛋糕售卖店管理系统
  • android 老项目中用到的jar包不存在,通过离线的方法加载
  • 项目实战应用Redis分布式锁
  • wordpress不同网站 调用同一数据表
  • Mac虚拟机Parallels Desktop 20 for Mac破解版发布 完整支持 Windows 11
  • leetcode-560. 和为 K 的子数组