一、理解tensor的维度 TensorFlow对张量的阶、维度、形状有着明确的定义,而在pytorh中对其的定义却模糊不清,仅仅有一个torch.size()的函数来查看张量的大小(我理解的这个大小指的就是TensorFlow对张量的形状描述,也和numpy的.shape类似)。所以,首先要搞清楚如何看一个张量的形状。
import torchz = torch.ones(2,3,4)
print(z)
print(z.size())
print(z.size(0))
print(z.size(1))
print(z.size(2))
以上代码的控制台输出为:
tensor([[[1., 1., 1., 1.],可见,我们成功创建了一个(2,3,4)大小的张量,那么我们人工应该怎么辨别一个张量的大小呢?为了直观,我把这个张量的中括号调整一个位置:
[1., 1., 1., 1.],
[1., 1., 1., 1.]],
[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]]])
torch.Size([2, 3, 4])
2
3
4
[
[
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]
],[
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]
]
]
我们可以看到:
第一层(最外层)中括号里面包含了两个中括号(以逗号进行分割),这就是(2,3,4)中的2
第二层中括号里面包含了三个中括号(以逗号进行分割),这就是(2,3,4)中的3
【pytorch|pytorch中对维度及其squeeze()、unsqueeze()函数的理解】第三层中括号里面包含了四个数(以逗号进行分割),这就是(2,3,4)中的4
结论:pytorch中的tensor维度可以通过第一个数前面的中括号数量来判断,有几个中括号维度就是多少。拿到一个维度很高的向量,将最外层的中括号去掉,数最外层逗号的个数,逗号个数加一就是最高维度的维数,如此循环,直到全部解析完毕。
我们还看到:
z.size(0) = 2,z.size(1) = 3,z.size(2) = 4
第0维度为2,第1维度为3,第2维度为4,即维度的标号是以0开始的,这点在squeeze()和unsqueeze()的形参说明中可以得到印证。
二、squeeze()和unsqueeze() 1. torch.squeeze(input, dim=None, out=None)
当不给定dim时,将输入张量形状中的
1
去除并返回。 如果输入是形如(A×1×B×1×C×1×D)(A×1×B×1×C×1×D),那么输出形状就为: (A×B×C×D)(A×B×C×D)当给定
dim
时,那么挤压操作只在给定维度上。即若tensor.size(dim) = 1,则去掉该维度例如,输入形状为: (A×1×B)(A×1×B),
squeeze(input, 0)
将会保持张量不变,只有用 squeeze(input, 1)
,形状会变成 (A×B)(A×B)。注意: 返回张量与输入张量共享内存,所以改变其中一个的内容会改变另一个。
参数:
- input (Tensor) – 输入张量
- dim (int, optional) – 如果给定,则
input
只会在给定维度挤压,维度的索引(从0开始) - out (Tensor, optional) – 输出张量
返回一个新的张量,对输入的指定位置插入维度 1
注意: 返回张量与输入张量共享内存,所以改变其中一个的内容会改变另一个。
如果
dim
为负,则将会被转化dim+input.dim()+1dim+input.dim()+1参数:
- tensor (Tensor) – 输入张量
- dim (int) – 插入维度的索引(从0开始)
- out (Tensor, optional) – 结果张量
import torchx = torch.ones(4)
print(x)
print(x.size())y = torch.unsqueeze(x, 0)
print(y)
print(y.size())z = torch.unsqueeze(x, 1)
print(z)
print(z.size())
插入维度之前:
[ 1, 1, 1, 1 ]
在第0维插入一个维度,使其变成(1,4),即在最外层插入一个中括号即可:
[ [ 1, 1, 1, 1 ] ]
在第1维插入一个维度,使其变成(4,1)
[ [1], [1], [1], [1] ]
程序输出如下:
tensor([1., 1., 1., 1.])
torch.Size([4])
tensor([[1., 1., 1., 1.]])
torch.Size([1, 4])
tensor([[1.],
[1.],
[1.],
[1.]])
torch.Size([4, 1])
https://blog.csdn.net/ZT0518/article/details/86440101
https://www.pytorchtutorial.com/docs/package_references/torch/
推荐阅读
- pytorch深度学习|pytorch中张量的维度变换,torch.squeeze()、torch.unsqueeze()函数
- 脉冲神经网络|脉冲神经网络-基于IAF神经元的手写数字识别
- 前沿技术|一文轻松掌握深度学习框架中的einsum
- 深度学习(基于pytorch)|深度学习笔记(七)——pytorch数据处理工具箱(一)
- python|3-张量API-下
- 深度学习|yolov5安全帽检测、反光衣检测、抽烟检测
- 深度学习|关于添加注意力模块的yolov5-5.0与yolov5-6.0的检测效果对比
- python|python批量修改txt文件里的类别数,批量修改文件名
- 深度学习|yolov5-v6.1发布