当前位置：首页 > article >正文

Python | Pytorch | 什么是 Inplace Operation（就地操作）？

article 2025/3/5 6:05:27

如是我闻： 在 PyTorch 中，Inplace Operation（就地操作）是指直接修改 Tensor 本身，而不是创建新的 Tensor 的操作。PyTorch 中的 Inplace 操作通常会在函数名后加上 _ 作为后缀，例如：

tensor.add_()
tensor.mul_()
tensor.zero_()

1. 普通操作 vs. Inplace 操作

import torch

# 普通操作（返回一个新 Tensor）
x = torch.tensor([1.0, 2.0, 3.0])
y = x + 2  # 生成新的 Tensor
print(y)  # tensor([3., 4., 5.])
print(x)  # tensor([1., 2., 3.])  # x 没有改变

# Inplace 操作（直接修改原 Tensor）
x.add_(2)  # 直接修改 x
print(x)  # tensor([3., 4., 5.])  # x 被修改

2. 常见的 Inplace 操作

操作	Inplace 版本	说明
加法	`x.add_(y)`	`x += y`
乘法	`x.mul_(y)`	`x *= y`
除法	`x.div_(y)`	`x /= y`
指数	`x.exp_()`	`x = e^x`
归一化	`x.normal_()`	服从正态分布
置零	`x.zero_()`	将所有元素变为 0

Inplace 操作的优缺点

✅ 优点

减少内存占用：直接修改 Tensor，不会创建新的 Tensor，减少不必要的内存开销。
适用于特定优化场景：对于大规模 Tensor 计算时，可以节省额外的内存分配，提高计算效率。

❌ 缺点

可能影响计算图，导致梯度计算错误：

PyTorch 需要保留计算图来进行反向传播，而 Inplace 操作会破坏计算图，使得某些 Tensor 的梯度无法正确计算。

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = x * 2
y.add_(3)  # 这里修改了 y
y.backward()  # 可能会报错：RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation

影响 Debug 和 Reproducibility（可复现性）：
- 由于 Tensor 在原地修改，可能会导致某些中间变量丢失，调试时不容易找到问题。
不适用于 PyTorch 的 JIT 编译：
- 在 torch.jit.script() 中，Inplace 操作可能会导致问题，因为 JIT 需要稳定的计算图。