当前位置: 首页 > article >正文

Vector Optimization – Multiple Lanes

文章目录

  • Vector优化 – 多通道

Vector优化 – 多通道

A particular instruction is carried out by an execution pipeline. For example an ADD instruction will be carried out by an ADD function unit pipeline.
一条特定的指令由执行流水线执行。例如, ADD指令将由ADD功能单元流水线执行。

If only one such execution pipeline is available, it operates on the elements of a vector register sequentially. This is shown in the figure on the left. It has a single ADD pipeline and can complete one addition per cycle.
如果只有一个这样的执行管道可用,它将按顺序对vector寄存器的元素进行操作。如左图所示。它有一个ADD管道,每个周期可以完成一次加法。

If however, multiple pipelines are available, each pipeline can consume an element of the vector register. This is shown in the figure on the right. It has four ADD pipelines can can complete four additions per cycle.
然而,如果多个流水线可用,则每个流水线可以消耗vector寄存器的一个元素。如右图所示。它有4条ADD流水线,每个周期可以完成四次加法。

The elements within the vector register are interleaved across the four p


http://www.kler.cn/a/398361.html

相关文章:

  • 丹摩征文活动|丹摩助力selenium实现大麦网抢票
  • 函数指针示例
  • 使用视频提升应用在 App Store 中的推广效果
  • Git 中的 patch 功能
  • 利用Blackbox AI让编程更轻松
  • 【ict基础软件赛道】真题-50%openGauss
  • LeetCode题练习与总结:移掉 K 位数字--402
  • 【论文笔记】LLaMA-VID: An Image is Worth 2 Tokens in Large Language Models
  • spring 和 grpc 的整合
  • PHP代码审计 --MVC模型开发框架rce示例
  • [Kotlin标准函数] run、with、apply、also、let、use等
  • 控制器ThinkPHP6
  • 编写一个生成凯撒密码的程序
  • Vue练习案例(上)
  • Gin 中自定义控制器
  • 多线程2:线程的常用方法、线程安全
  • 向量元素的修改和删除
  • 数据结构:图(二)---- 最小生成树算法
  • 小程序23-页面的跳转:navigation 组件详解
  • 嵌入式硬件杂谈(二)-芯片输入接入0.1uf电容的本质(退耦电容)
  • 【iOS】iOS的轻量级数据库——FMDB
  • C++11的std::for_each和lambda调用的使用实例
  • 解决Docker环境变量的配置的通用方法
  • 零基础Java第二十期:认识String(二)
  • 论文阅读:Uni-ISP Unifying the Learning of ISPs from Multiple Cameras
  • 自然语言处理技术之细粒度实体识别