当前位置: 首页 > article >正文

Textual Dataset Distillation via Language Model Embedding

Method

在这里插入图片描述
将数据集丢入embedding模型,丢入embedding前可以加入prompt加强效果,然后获取k-means聚类的中心向量来作为需要的蒸馏embeddings,然后使用vec2text模型还原成原始文本。

Result

在这里插入图片描述

Q:

这里有一点不清楚:

  1. 聚类中心的embedding是怎么转换成原来的文本的,如果是不同的embedding模型,那各自的representation space不同,怎么通过一个vec2text model还原。

http://www.kler.cn/a/449831.html

相关文章:

  • 微机接口课设——基于Proteus和8086的打地鼠设计(8255、8253、8259)
  • java 对ElasticSearch数据库操作封装工具类(对你是否适用嘞)
  • 如何使用vscode解决git冲突
  • css让按钮放在最右侧
  • 电脑使用CDR时弹出错误“计算机丢失mfc140u.dll”是什么原因?“计算机丢失mfc140u.dll”要怎么解决?
  • TCP与UDP的端口连通性
  • 计算机视觉技术未来发展趋势:创新与变革共舞
  • MHA binlog server
  • 代码随想录day22 | 回溯算法理论基础 leetcode 77.组合 77.组合 加剪枝操作 216.组合总和III 17.电话号码的字母组合
  • 【蓝碳】基于GEE云计算、多源遥感、高光谱遥感技术、InVEST模型、PLUS模型的蓝碳储量估算;红树林植被指数计算及提取
  • vue中的css深度选择器v-deep 配合!important
  • 【MySQL】MySQL 官方安装包形式
  • 日志以及MVCC
  • Linux(Ubuntu)命令大全——已分类整理,学习、查看更加方便直观!(2024年最新编制)
  • Linux Shell 脚本编程基础知识篇—shell 运算命令详解
  • Vue2四、 scoped样式冲突,data是一个函数,组件通信-父传子-子传父-非父子
  • 每天学习一个思维模型 - 直觉
  • 什么是根服务器?有什么作用?
  • 搜索引擎蜘蛛池的原理是什么,蜘蛛池搭建教程(蜘蛛池.中国)
  • 运维工程师面试系统监控与优化自动化与脚本云计算的理解虚拟化技术的优点和缺点
  • docker 安装openresty
  • CentOS7系统下部署tomcat,浏览器访问localhost:8080/
  • 网络安全检测
  • 无需公网IP!如何在威联通NAS上实现SFTP远程访问管理传输文件
  • c++--------------------------------接口实现
  • 新能源汽车锂离子电池各参数的时间序列关系