当前位置: 首页 > article >正文

CTC loss 博客转载

论文地址:

https://www.cs.toronto.edu/~graves/icml_2006.pdf

为了对应这个图,我们假设一种符合的模型情况:

英文OCR,37个类别(26个小写字母+10个汉字+空格),最大输出长度8个字符

模型预测结果是8*37的大小,换句话说就是,预测出来了8个字符,每个字符的37个类别的概率。

这时候我们就可以填表了,表中每个圆圈都是概率值,第一行第一列的数值就是,字符1是类别空格的概率,第二行第一列的数值就是,字符1是类别a的概率。

合法路径不唯一;优化目标是最大化“所有合法路径概率的和”。

(一个合法路径就是一种预测结果为正确的情况,每一个合法路径上的概率相乘就是这个路径的概率。)

采用递归的方式计算这个概率和,递归表格中每个元素该怎么求,后续补充

优秀博客:

CTC Loss 数学原理讲解:Connectionist Temporal Classification-CSDN博客


http://www.kler.cn/news/314279.html

相关文章:

  • C++(2)进阶语法
  • 职业技能大赛-自动化测试笔记分享-2
  • 长亭WAF绕过测试
  • Spring AI Alibaba,阿里的AI Java 开发框架
  • 【Python篇】PyQt5 超详细教程——由入门到精通(终篇)
  • C语言CRC16_CCITT_FALSE函数法和查表法实现
  • ArcGIS10.2/10.6安装包下载与安装(附详细安装步骤)
  • Unity坐标系求向量的模长
  • 【深度学习|可视化】如何以图形化的方式展示神经网络的结构、训练过程、模型的中间状态或模型决策的结果??
  • 常用卫星学习
  • sql语句在mysql中的执行过程
  • 大数据-143 - ClickHouse 集群 SQL 超详细实践记录!
  • 运维工程师面试整理-团队协作
  • 大数据最新面试题(持续更新)
  • 入门sentinel
  • 焦化行业的变革力量:智能巡检机器人
  • 浙大数据结构:05-树8 File Transfer
  • 记录一次显卡驱动安装
  • 如何在kotlin中给空字符串(””)和null值设置默认值问题?
  • WPF 控件数据源绑定
  • 大语言模型应用的业务架构点
  • Transformer模型-7- Decoder
  • MATLAB绘图基础8:双变量图形绘制
  • Day25笔记-普通文件读写with上下文二进制文件csv文件
  • hadoop大数据平台操作笔记
  • 消息队列选型参考:Top5消息队列组件
  • Qt:智能指针QScopedPointer 的使用(以及如何写一个QScopedPointer )
  • [SDX35+WCN6856]SDX35 开启class/gpio子系统配置操作说明
  • 在Python中,类是用于定义对象的蓝图或模板,而对象则是根据类创建的具体实例
  • 【RPA私教课:UIPath】RPA 赋能科技企业,登录时验证码自动截取