当前位置: 首页 > article >正文

Talk | UCSB博士生欧阳思琦: 利用词级别对比学习实现低资源下的语音翻译

本期为TechBeat人工智能社区553线上Talk。

北京时间12月6日(周三)20:00,加州大学圣塔芭芭拉分校·博士生欧阳思琦的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 利用词级别对比学习实现低资源下的语音翻译,介绍了他们团队在利用词级别对比学习实现低资源下的语音翻译的一系列研究。

Talk·信息

主题:利用词级别对比学习实现低资源下的语音翻译

嘉宾:加州大学圣塔芭芭拉分校·博士生 欧阳思琦

时间:北京时间 12月6日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=833

      Talk·介绍

端到端语音翻译目标是将源语言语音直接翻译到目标语言的文本。现有的模型在数据不足的情况下表现很差,并且我们观察到模型的表现和语音-转录的特征相似度非常相关。在这篇文章里,我们提出了WACO,即词级别的对比学习方法来实现低资源下的语音翻译。我们的关键想法是将语音和转录的词级别表示通过对比学习来对齐。我们在MuST-C数据集和IWSLT 2023 Maltese-English数据集下验证了我们模型的有效性。在仅用1小时语音翻译数据的情况下,我们的模型能够超越基线模型超过9点BLEU分数。

Talk大纲

1、介绍语音翻译问题

2、描述数据的稀缺以及后果

3、阐述低资源下观察到的现象

4、提出WACO方法;实验结果

Talk·预习资料

Image

论文链接:https://arxiv.org/abs/2212.09359

项目链接:https://github.com/owaski/WACO/

Image

论文链接: https://aclanthology.org/2022.naacl-main.376/

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Image

欧阳思琦

加州大学圣塔芭芭拉分校·博士生

欧阳思琦目前在UCSB跟随导师李磊攻读计算机博士学位。在来UCSB之前,本科就读于清华姚班,导师是吴翼老师。现在的研究方向主要在语音翻译,即将源语言的音频翻译到目标语言的文本,包括离线和实时翻译。在低资源离线翻译方面,我们开发了WACO,即利用词级别的对比学习来精细对齐语音和文本的表示,在一个真实的低资源场景中(Maltese to English),WACO利用1小时的语音翻译数据达到了13.3 BLEU,大幅超越了基线模型(4 BLEU)表现,这篇文章也被ACL 2023接收。

个人主页: 

https://www.techbeat.net/grzytrkj?id=36051


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区


http://www.kler.cn/a/160731.html

相关文章:

  • POI实现根据PPTX模板渲染PPT
  • ML 系列: 第 23 节 — 离散概率分布 (多项式分布)
  • matlab建模入门指导
  • 阿里巴巴通义灵码推出Lingma SWE-GPT:开源模型的性能新标杆
  • 使用pytest+openpyxl做接口自动化遇到的问题
  • Gsensor加速度传感器数据异常及概率性卡死
  • [Geek Challenge 2023] web题解
  • [React]基于Antd的FormModal的组件封装以及useFormModal的hooks封装
  • 动态规划学习——最长回文子序列,让字符串变成回文串的最小插入次数
  • swiper和video实现抖音刷视频功能
  • P1005 [NOIP2007 提高组] 矩阵取数游戏
  • 内衣洗衣机哪个牌子好用?家用小型洗衣机推荐
  • 296_C++_一个dialog对话框在执行exec向系统发送一个延后销毁事件时,另一个对话框立刻接管了上一个对话框的销毁事件,导致死UI
  • 定时器的使用及实现
  • MySQL - 并发控制与事务的隔离级别
  • 微服务实战系列之Redis
  • 安卓发布小技巧
  • 一键AI智能改写,一键AI智能生成原创文章
  • 网络安全(一)--网络环境构成,系统的安全
  • 外包干了3个月,技术倒退2年。。。
  • 修改错误的代码和改正错误的人生一样重要
  • 智能成绩表 - 华为OD统一考试(C卷)
  • 台灯应该买什么样的才能护眼?学生护眼必备护眼台灯推荐
  • 【毕业设计】基于雷达与深度学习的摔倒检测——微多普勒效应
  • Linux虚假唤醒
  • Unity传送门特效: The Beautiful Portal/Level up/Teleport/Warp VFX