当前位置：首页 > article >正文

李宏毅NLP-1-课程介绍

article 2025/3/18 6:32:56

NLP任务包含文本和语音

在这里插入图片描述
NLP的任务：

听懂人说的话
看懂人写的文句
写出人懂得句子
说出人听得懂的话

在这里插入图片描述
课程包含文本处理和语音处理。

在这里插入图片描述
很多语音没有存在文字，只有56%的语音才有文字，大约一半是没有文字的。

人类的语音和文本是复杂的

在这里插入图片描述
一秒包含16k的样本点，每个点又有256个可能取值。

同一个人说相同的字也会有不同的频谱。

在这里插入图片描述

一个句子最长的句子有13955个词汇。
在这里插入图片描述
在最长的句子前面或者后面加一点词汇又会破记录。

本课程学习的模型类型6种

在这里插入图片描述

输入是语音，输出是文本
输入是文本，输出是语音
输入是语音，输出是语音
输入是文本，输出是文本
输入是语音，输出是类别
输入是文本，输出是类别

自动语音识别ASR（automatic speech recognition）

在这里插入图片描述

在这里插入图片描述
传统的模型有很多个模块（2GB）；
现在的模型也有是end-to-end（80MB）；

end2end能够将模型大小下降到很多，能够在移动端运行。

文本语音合成TTS（text-to-speech synthesis）

在这里插入图片描述

Speech Separation

在这里插入图片描述

声音克隆

输入音频，输出类别

在这里插入图片描述

在这里插入图片描述
比如唤醒词唤醒

文本处理的任务

在这里插入图片描述

模型现在越来越大
在这里插入图片描述

文本生成 text-generation

在这里插入图片描述

其他应用

在这里插入图片描述

翻译
总结
聊天机器人
问答系统
句法分析树
meta learning 学会学习

在这里插入图片描述

恶意攻击

在这里插入图片描述

解释性AI

http://www.kler.cn/a/589401.html

相关文章：

新能源汽车IGBT电压平台与SiC器件应用

类和对象的创建

Python（1.1）Python实战：一键批量重命名图片文件，告别手动整理！（附完整源码）

python调用百度人脸识别接口

【前端面试题】宏任务与微任务的区别

C语言之循环语句：程序运行的核心动力（上）

vuex持久化存储，手动保存到localStorage

奥林巴斯道Olympus DAO、奥拉丁模式、诺瓦银行、RWA模型合约解析开发

大数据学习（70）-大数据调度工具对比

Navigation页面导航的使用

基于javaweb的SpringBoot校园运动会管理系统设计与实现(源码+文档+部署讲解）

6k ± 1 规则

自然语言处理编程文档

数组题型-二分查找-JS

实战：自适应均衡的设计与实现

【Docker】容器中安装cron命令

使用 Docker 部署 MySQL 8

TensorFlow 基本原理与使用场景

移除元素(快慢指针)

Linux第六讲----git与gdb