当前位置: 首页 > article >正文

sheng的学习笔记-【中】【吴恩达课后测验】Course 5 - 序列模型 - 第三周测验 - 序列模型与注意力机制

课程5_第3周_测验题

目录:目录

第一题

1.想一想使用如下的编码-解码模型来进行机器翻译,这个模型是“条件语言模型”,编码器部分(绿色显示)的意义是建模中输入句子x的概率。

在这里插入图片描述

A. 【  】正确

B. 【  】错误

答案:

B.【 √ 】错误

第二题

2.在集束搜索中,如果增加集束宽度 b b b,以下哪一项是正确的?

A. 【  】集束搜索将运行的更慢

B. 【  】集束搜索将使用更多的内存

C. 【  】集束搜索通常将找到更好地解决方案(比如:在最大化概率 P ( y ∣ x ) P(y|x) P(yx)上做的更好)

D. 【  】集束搜索将在更少的步骤后收敛

答案:

A.【 √ 】集束搜索将运行的更慢

B.【 √ 】集束搜索将使用更多的内存

C.【 √ 】集束搜索通常将找到更好地解决方案(比如:在最大化概率 P ( y ∣ x ) P(y|x) P(yx)上做的更好)

第三题

3.在机器翻译中,如果我们在不使用句子归一化的情况下使用集束搜索,那么算法会输出过短的译文。

A. 【  】正确

B. 【  】错误

答案:

A.【 √ 】正确

第四题

4.假设你正在构建一个能够让语音片段 x x x转为译文 y y y的基于RNN模型的语音识别系统,你的程序使用了集束搜索来试着找寻最大的 P ( y ∣ x ) P(y|x) P(yx)的值y。在开发集样本中,给定一个输入音频,你的程序会输出译文 y ^ \hat{y} y^= “I’m building an A Eye system in Silly con Valley.”,人工翻译为 y ∗ y^* y = “I’m building an AI system in Silicon Valley.”

在你的模型中,

P ( y ^ ∣ x ) = 1.09 ∗ 1 0 − 7 P(\hat{y} \mid x) = 1.09*10^{-7} P(y^x)=1.09107

P ( y ∗ ∣ x ) = 7.21 ∗ 1 0 − 8 P(y^* \mid x) = 7.21*10^{-8} P(yx)=7.21108

那么,你会增加集束宽度 B B B 来帮助修正这个样本吗?

A. 【  】不会,因为 P ( y ∗ ∣ x ) ≤ P ( y ^ ∣ x ) P(y^* \mid x) \leq P(\hat{y} \mid x) P(yx)P(y^x)说明了问题在RNN,而不是搜索算法

B. 【  】不会,因为 P ( y ∗ ∣ x ) ≤ P ( y ^ ∣ x ) P(y^* \mid x) \leq P(\hat{y} \mid x) P(yx)P(y^x)说明了问题在搜索算法,而不是RNN

C. 【  】会的,因为 P ( y ∗ ∣ x ) ≤ P ( y ^ ∣ x ) P(y^* \mid x) \leq P(\hat{y} \mid x) P(yx)P(y^x)说明了问题在RNN,而不是搜索算法

D. 【  】会的,因为 P ( y ∗ ∣ x ) ≤ P ( y ^ ∣ x ) P(y^* \mid x) \leq P(\hat{y} \mid x) P(yx)P(y^x)说明了问题在搜索算法,而不是RNN

答案:

A.【 √ 】不会,因为 P ( y ∗ ∣ x ) ≤ P ( y ^ ∣ x ) P(y^* \mid x) \leq P(\hat{y} \mid x) P(yx)P(y^x)说明了问题在RNN,而不是搜索算法

第五题

5.接着使用第4题的样本,假设你花了几周的时间来研究你的算法,现在你发现,对于绝大多数让算法出错的例子而言, P ( y ∗ ∣ x ) > P ( y ^ ∣ x ) P(y^* \mid x) > P(\hat{y} \mid x) P(yx)>P(y^x),这表明你应该将注意力集中在改进搜索算法上,对吗?

A. 【  】正确

B. 【  】错误

答案:

A.【 √ 】正确

第六题

6.回想一下机器翻译的模型:

在这里插入图片描述

除此之外,还有个公式 α < t , t ′ > = exp ( e < t , t ′ > ) ∑ t ′ = 1 T x exp ( e < t , t ′ > ) \alpha^{< t,t'>} = \frac{\text{exp}(e^{< t,t'>})}{\sum^{T_x}_{t'=1}\text{exp}(e^{< t,t'>})} α<t,t>=t=1Txexp(e<t,t>)exp(e<t,t>),下面关于 α < t , t ′ > \alpha^{< t,t'>} α<t,t>的选项那个(些)是正确的?

A. 【  】对于网络中与输出 y < t > y^{<t>} y<t>高度相关的 α < t ′ > \alpha^{< t'>} α<t>而言,我们通常希望 α < t , t ′ > \alpha^{< t,t'>} α<t,t>的值更大(请注意上标)

B. 【  】对于网络中与输出 y < t > y^{<t>} y<t>高度相关的 α < t > \alpha^{< t>} α<t>而言,我们通常希望 α < t , t ’ > \alpha^{< t,t’>} α<t,t>的值更大(请注意上标)

C. 【  】 ∑ t α < t , t ′ > = 1 \sum_t\alpha^{< t,t'>} = 1 tα<t,t>=1(注意是和除以t)

D. 【  】 ∑ t ′ α < t , t ′ > = 1 \sum_{t'}\alpha^{< t,t'>} = 1 tα<t,t>=1(注意是和除以t’)

答案:

A.【 √ 】对于网络中与输出 y < t > y^{<t>} y<t>高度相关的 α < t ′ > \alpha^{< t'>} α<t>而言,我们通常希望 α < t , t ′ > \alpha^{< t,t'>} α<t,t>的值更大(请注意上标)

D.【 √ 】 ∑ t ′ α < t , t ′ > = 1 \sum_{t'}\alpha^{< t,t'>} = 1 tα<t,t>=1(注意是和除以t’)

第七题

7.网络通过学习的值 e < t , t ′ > e^{< t,t'>} e<t,t>来学习在哪里关注“关注点”,这个值是用一个小的神经网络的计算出来的:

这个神经网络的输入中,我们不能用 s < t > s^{<t>} s<t> 替换 s < t − 1 > s^{<t-1>} s<t1>。这是因为 s < t > s^{< t>} s<t>依赖于 α < t , t ′ > \alpha^{< t,t'>} α<t,t>,而 α < t , t ′ > \alpha^{< t,t'>} α<t,t>又依赖于 e < t , t ′ > e^{< t,t'>} e<t,t>;所以在我们需要评估这个网络时,我们还没有计算出 s t s^{t} st

A. 【  】正确

B. 【  】错误

答案:

A.【 √ 】正确

第八题

8.与题1中的编码-解码模型(没有使用注意力机制)相比,我们希望有注意力机制的模型在下面的情况下有着最大的优势:

A. 【  】输入序列的长度 T x T_x Tx比较大

B. 【  】输入序列的长度 T x T_x Tx比较小

答案:

A.【 √ 】输入序列的长度 T x T_x Tx比较大

第九题

9.在CTC模型下,不使用"空白"字符(_)分割的相同字符串将会被折叠。那么在CTC模型下,以下字符串将会被折叠成什么样子?__c_oo_o_kk___b_ooooo__oo__kkk

A. 【  】cokbok

B. 【  】cookbook

C. 【  】cook book

D. 【  】coookkboooooookkk

答案:

B.【 √ 】cookbook

第十题

10.在触发词检测中, x < t > x^{< t>} x<t>是:

A. 【  】时间 t t t时的音频特征(就像是频谱特征一样)

B. 【  】第 t t t个输入字,其被表示为一个独热向量或者一个字嵌入

C. 【  】是否在第 t t t时刻说出了触发词

D. 【  】是否有人在第 t t t时刻说完了触发词

答案:

A.【 √ 】时间 t t t时的音频特征(就像是频谱特征一样)


http://www.kler.cn/a/422176.html

相关文章:

  • 计算机的错误计算(一百七十四)
  • 【C++】—— set 与 multiset
  • Keil5配色方案修改为类似VSCode配色
  • Wwise 使用MIDI文件、采样音频
  • 高通---Camera调试流程及常见问题分析
  • postman测试
  • 用于LiDAR测量的1.58um单芯片MOPA(一)
  • Y20030018基于Java+Springboot+mysql+jsp+layui的家政服务系统的设计与实现 源代码 文档
  • [Redis#9] stream | geospatial | HyperLogLog | bitmaps | bitfields
  • Create Stunning Word Clouds with Ease!
  • 【短视频矩阵系统==saas技术开发】
  • 移动机器人课程建图实验-ROSbug汇总
  • C. Raspberries
  • esp8266 编译、烧录环境搭建
  • 5G学习笔记之PRACH
  • 【AI系统】推理系统介绍
  • Vue3 使用inject 获取provide 发布的响应式数据动态更新失败问题解决
  • 爬虫抓取的数据能用于商业分析吗?
  • 第四话:JS中的eval函数
  • Influxdb 部署详解
  • 2-2-18-9 QNX系统架构之文件系统(三)
  • Qt5中使用EPICS通道访问读写EPICS PV
  • Qt几何数据类型:QLine类型详解(基础向)
  • 时序图学习
  • 1203论文速读
  • llvm源码编译