当前位置：首页 > article >正文

visual prompt tuning和visual instruction tuning

article 2025/2/21 3:51:03

visual prompt tuning：作为一种微调手段，其目的是节省参数量，训练时需要优化的参数量小。

输入：视觉信息image token+可学习的prompt token

处理任务：比如常见的分类任务

visual instruction tuning：目的是提高模型的听从指令的能力

一般会使用到指令数据集，指令数据大概是“问题-答案”这样的形式，问模型问题相当于给模型下指令。

输入：视觉信息（图像嵌入）+语言指令（文本嵌入）

处理任务：问模型问题，模型给回答

其他：比如写prompt提示词给GPT，这里的prompt貌似也是指问GPT的问题。

react hooks--useState

Spring Boot基础

【C++】—— list 的了解与使用

一天认识一个硬件之显示器

vue3 动态 svg 图标使用

网络安全实训八(y0usef靶机渗透实例)

Vue.nextTick 的工作机制

项目实战应用Redis分布式锁

wordpress不同网站调用同一数据表

leetcode-560. 和为 K 的子数组