当前位置: 首页 > article >正文

pytorch张量的new_zeros方法介绍

在 PyTorch 中,Tensor.new_zeros 是一种用于创建与现有张量形状或设备匹配的新张量的方法。该方法生成一个全为零的张量,且其数据类型、设备等属性与调用它的张量一致,除非另行指定。


new_zeros 方法的语法

Tensor.new_zeros(size, *, dtype=None, device=None, requires_grad=False)

参数说明

  • size (tuple)
    指定新张量的形状。例如 (2, 3) 表示创建一个形状为 2x3 的张量。

  • dtype (torch.dtype, 可选)
    指定新张量的数据类型。如果未指定,将与原张量的数据类型一致。

  • device (torch.device, 可选)
    指定新张量所在的设备(如 CPU 或 GPU)。如果未指定,将与原张量所在的设备一致。

  • requires_grad (bool, 可选)
    指定新张量是否需要计算梯度(默认为 False)。


new_zeros 的特性

  • 新张量与原张量具有相同的设备默认数据类型(除非显式更改)。
  • 新张量的内容为全零。

使用示例

1. 创建与现有张量形状匹配的零张量

import torch

x = torch.ones(2, 3, device='cuda')  # 创建一个形状为 (2, 3) 的张量
zeros = x.new_zeros((2, 3))          # 创建一个全零张量,与 x 具有相同形状和设备
print(zeros)
# 输出(在 GPU 上):
# tensor([[0., 0., 0.],
#         [0., 0., 0.]], device='cuda:0')

2. 创建具有不同形状的零张量

x = torch.ones(4, 5)
zeros = x.new_zeros((2, 3))  # 创建一个形状为 (2, 3) 的零张量
print(zeros)
# 输出:
# tensor([[0., 0., 0.],
#         [0., 0., 0.]])

3. 指定数据类型

x = torch.ones(3, 3, dtype=torch.float32)
zeros = x.new_zeros((2, 2), dtype=torch.int32)  # 显式指定数据类型
print(zeros)
# 输出:
# tensor([[0, 0],
#         [0, 0]], dtype=torch.int32)

4. 指定设备

x = torch.ones(2, 2, device='cuda')
zeros = x.new_zeros((3, 3), device='cpu')  # 在 CPU 上创建新张量
print(zeros)
# 输出:
# tensor([[0., 0., 0.],
#         [0., 0., 0.],
#         [0., 0., 0.]])

与其他创建零张量的方法的对比

  1. torch.zeros

zeros = torch.zeros((2, 3))
    • 独立于已有张量。
    • 需要显式指定数据类型和设备。
  • Tensor.new_zeros

zeros = x.new_zeros((2, 3))

  • 与现有张量 x 共享设备和默认数据类型。

常见应用场景

  1. 快速创建与输入张量匹配的零张量 在深度学习中,可能需要创建与现有张量形状和设备匹配的零张量。例如,用于初始化中间结果或辅助计算。

  2. 动态操作 当输入张量的形状、设备不固定时,可以使用 new_zeros 动态生成匹配的零张量,无需手动指定设备或数据类型。


总结

Tensor.new_zeros 是一个高效、方便的方法,适合在动态模型或设备敏感的代码中使用。它避免了显式管理设备和数据类型的麻烦,有助于提高代码的简洁性和可维护性。


http://www.kler.cn/a/501676.html

相关文章:

  • 基于springboot的疫情网课管理系统
  • CF 371A.K-Periodic Array(Java实现)
  • MDX语言的函数实现
  • frp内网穿透
  • 超燃预告!Origin百图绘制系列即将登场
  • 【centos8 ES】Elasticsearch linux 龙晰8操作系统安装
  • python-leetcode-有效的数独
  • Java 将RTF文档转换为Word、PDF、HTML、图片
  • uniapp使用scss mixin抽离css常用的公共样式
  • PyTorch reshape函数介绍
  • 使用Cilium/eBPF实现大规模云原生网络和安全
  • MongoDB 删除集合
  • nginx增加新模块
  • Python orjson ujson有什么区别?
  • 【DevOps】Jenkins使用Pipeline构建java代码
  • AIGC是什么?怎么用?简单三步ToDesk云电脑快速用
  • 前端学习-焦点事件以及键盘事件与典型案例(二十五)
  • Node.js——http 模块(二)
  • (Arxiv-2023)LORA-FA:针对大型语言模型微调的内存高效低秩自适应
  • 软件系统安全逆向分析-混淆对抗
  • HTML + CSS:如何强制div内容保持一行?
  • 26个开源Agent开发框架调研总结(2)
  • 如何使用高性能内存数据库Redis
  • 基于异步IO的io_uring
  • 【论文阅读+复现】High-fidelity Person-centric Subject-to-Image Synthesis
  • HAMi + prometheus-k8s + grafana实现vgpu虚拟化监控