当前位置: 首页 > article >正文

CTC loss 博客转载

论文地址:

https://www.cs.toronto.edu/~graves/icml_2006.pdf

为了对应这个图,我们假设一种符合的模型情况:

英文OCR,37个类别(26个小写字母+10个汉字+空格),最大输出长度8个字符

模型预测结果是8*37的大小,换句话说就是,预测出来了8个字符,每个字符的37个类别的概率。

这时候我们就可以填表了,表中每个圆圈都是概率值,第一行第一列的数值就是,字符1是类别空格的概率,第二行第一列的数值就是,字符1是类别a的概率。

合法路径不唯一;优化目标是最大化“所有合法路径概率的和”。

(一个合法路径就是一种预测结果为正确的情况,每一个合法路径上的概率相乘就是这个路径的概率。)

采用递归的方式计算这个概率和,递归表格中每个元素该怎么求,后续补充

优秀博客:

CTC Loss 数学原理讲解:Connectionist Temporal Classification-CSDN博客


http://www.kler.cn/a/314279.html

相关文章:

  • 第 13 章 -Go 语言 接口
  • 基于node一键发布到服务器的js脚本
  • Bugku CTF_Web——点login咋没反应
  • Go语言 实现将中文转化为拼音
  • 【C语言】值传递和地址传递
  • 测试工程师简历「精选篇」
  • C++(2)进阶语法
  • 职业技能大赛-自动化测试笔记分享-2
  • 长亭WAF绕过测试
  • Spring AI Alibaba,阿里的AI Java 开发框架
  • 【Python篇】PyQt5 超详细教程——由入门到精通(终篇)
  • C语言CRC16_CCITT_FALSE函数法和查表法实现
  • ArcGIS10.2/10.6安装包下载与安装(附详细安装步骤)
  • Unity坐标系求向量的模长
  • 【深度学习|可视化】如何以图形化的方式展示神经网络的结构、训练过程、模型的中间状态或模型决策的结果??
  • 常用卫星学习
  • sql语句在mysql中的执行过程
  • 大数据-143 - ClickHouse 集群 SQL 超详细实践记录!
  • 运维工程师面试整理-团队协作
  • 大数据最新面试题(持续更新)
  • 入门sentinel
  • 焦化行业的变革力量:智能巡检机器人
  • 浙大数据结构:05-树8 File Transfer
  • 记录一次显卡驱动安装
  • 如何在kotlin中给空字符串(””)和null值设置默认值问题?
  • WPF 控件数据源绑定