当前位置: 首页 > article >正文

【AI学习】Mamba学习(九):HiPPO LegS版本

在上一篇《Mamba学习(八):HiPPO通用框架定义和方法》中关于时间度量的案例中,论文提出了LegT、LagT、LegS三种时间度量方式。
在这里插入图片描述
三种时间度量方式,左边是LegT,就是滑窗的方式,在窗内平均分配权重;中间是LagT,采用了指数衰减的权重;右边是LegS,对整个历史平均分配权重。
HiPPO LegS版本就是基于LegS的时间度量方式得出的闭式解。

HiPPO-LegS: Scaled Measures for Timescale Robustness

HiPPO-LegS具有良好的理论性质:对输入时间尺度不变,计算速度快,并且具有有界梯度和近似误差。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
就如苏神所说:“LegS 是我们的重点关注对象。重点关注 LegS 的原因并不难猜,因为从推导的假设来看,它是目前求解出来的唯一一个能够记忆整个历史的 ODE 系统,这对于很多场景如多轮对话来说至关重要。此外,它还有其他的一些比较良好且实用的性质。”

关于这些良好的理论性质,苏神在《重温被Mamba带火的SSM:HiPPO的一些遗留问题》一文中有详尽的阐述。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://www.kler.cn/news/356250.html

相关文章:

  • 05.栈介绍+实现
  • NGINX 的 Event Loop
  • 3.3关节组件
  • setuptools封装自己python包
  • Linux与Windows文件共享:Samba的详细配置(Ubuntu)
  • Spring 和 javaEE的关系
  • 基于 UDP 协议的 socket 编程:实现 UDP 服务器
  • 概率 多维随机变量与分布
  • 枸杞常见病虫害识别数据集(猫脸码客 第220期)
  • 【Linux系列】set -euo pipefail 命令详解
  • Proxy SwitchyOmega 网页代理的安装与使用(巨简单!)
  • 自动驾驶中的图像识别技术:安全与效率的双赢
  • STM32_实验5_中断实验
  • 记录 ruoyi-vue-plus在linux 部署遇到的问题
  • 实现对redis过期键监听案例
  • TikTok广告账号被封?常见原因及解决方法分享
  • 快速创建一个vue项目并运行
  • 【Spring】Cookie和Session是什么
  • 企业级调度器 LVS
  • vue $nextTick 实现原理