当前位置: 首页 > article >正文

NVIDIA Ada Lovelace 架构

目录

3D 图形领域的突破性时刻。

第四代 Tensor Core

第三代 RT Core

着色器执行重排序

DLSS 3

AV1 编码器


致力于打造出色的游戏与创作、专业图形、AI 和计算性能。

3D 图形领域的突破性时刻。

Ada GPU 架构能够为光线追踪和基于 AI 的神经图形提供革命性的性能。该架构显著提高了 GPU 性能基准,更代表着光线追踪和神经图形的转折点。

第四代 Tensor Core

NVIDIA Tensor Core 推动并加快了 AI 技术的变革,包括 NVIDIA DLSS 以及可让帧率更大幅提升的全新 NVIDIA DLSS 3。

凭借英伟达在 Hopper H100 数据中心 GPU 上首次推出的全新 FP8 Transformer 引擎,Ada 的全新第四代 Tensor Core 拥有不可思议的飞快速度,可将吞吐量提升 4 倍,达到1.4 Tensor-petaFLOPS。

NVIDIA Tensor Core

NVIDIA 第三代 RT Core

第三代 RT Core

NVIDIA 发明的 RT Core 在视频游戏中实现了实时光线追踪。这种搭载在 GPU 上的特殊核心专为处理性能需求密集的光线追踪工作负载而设计。 

Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。

新款 RT Core 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒和围栏。DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。

着色器执行重排序

高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)

着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。

着色器执行重排序技术

NVIDIA 光流加速器

DLSS 3

NVIDIA DLSS 3 是 AI 驱动图形领域的革命性突破,可大幅提升性能。DLSS 3 由 GeForce RTX 40 系列 GPU 所搭载的全新第四代 Tensor Core 和光流加速器提供支持,可利用 AI 创造更多高质量帧。

AV1 编码器

基于 Ada 架构的全新显卡配备了支持 AV1 编码的全新第八代 NVIDIA 编码器 (NVENC),可为主播、广播爱好者和视频通话用户带来更多新的尝试和体验。

该技术的效率比 H.264 高 40%,这有助于主播在保持直播推流比特率不变的情况下,将画面分辨率从 1080p 提高到 1440p,且画质依然稳定。

采用 AV1 编码的 NVIDIA 编码器


http://www.kler.cn/a/286484.html

相关文章:

  • 如何将DeepSeek部署到本地电脑
  • 【Unity3D】实现横版2D游戏角色二段跳、蹬墙跳、扶墙下滑
  • 【Linux】线程互斥与同步
  • 【Leetcode刷题记录】166. 分数到小数
  • 【MQ】RabbitMq的可靠性保证
  • 关联传播和 Python 和 Scikit-learn 实现
  • [论文阅读]JTORO in NOMA-based VEC:A game-theoretic DRL approach
  • Java面试宝典-java基础01
  • 【原型模式】
  • 无人机遥控器工作原理!!!
  • PyCharm中python语法要求——消去提示波浪线
  • 分布式主键
  • 51单片机——LED点阵屏
  • Java响应式编程
  • 最高院关于背靠背条款最新批复
  • 《机器学习》—— OpenCV 对图片的各种操作
  • Flink CDC读取Mysql时,Decimal类型数据异常,变成了字符串(源码解析及解决方案)
  • 【Linux 从基础到进阶】Apache服务器搭建与优化
  • IDEA2023的激活与安装
  • Leetcode 257-二叉树的所有路径
  • 【Vue】router和route的区别
  • 不同材质的O型圈优缺点及其应用范围
  • 计算机网络端口
  • 《机器学习》 DBSCAN算法 原理、参数解析、案例实现
  • Flink窗口API使用教程
  • 2024年6月 青少年等级考试机器人实操真题二级