关于torch.cat()与torch.stack()整理

代码中一直使用torch.cat()和torch.stack()进行tensor维度拼接,花点时间整理下。方便使用‍♂️:

1.用法

torch.cat(): 用于连接两个相同大小的张量

torch.stack(): 用于连接两个相同大小的张量,并扩展维度

见代码示例更清晰:

import torcha = torch.tensor(torch.arange(10)).reshape(3, 3)b = torch.tensor(torch.arange(10, 100, 10)).reshape(3, 3) print(a)Out[7]: tensor([[1, 2, 3],        [4, 5, 6],        [7, 8, 9]]) print(b)Out[10]: tensor([[10, 20, 30],        [40, 50, 60],        [70, 80, 90]])

对上面两个tensor进行操作
torch.cat()
拼接函数,将多个张量拼接成一个张量,保持维度不变。torch.cat()有两个参数,第一个是要拼接的张量的列表或是元组;第二个参数是拼接的维度。

使用不同的参数,输出的结果不同,首先填入一个会返回错误的参数:从返回报错原因可以看到,参数的返回必须是在[-2, 1]之间。

d3 = torch.cat((a, b), dim=2) # 返回输出如下Traceback (most recent call last):  File "/home/franklinpan/.local/lib/python3.8/site-packages/IPython/core/interactiveshell.py", line 3251, in run_code    exec(code_obj, self.user_global_ns, self.user_ns)  File "", line 1, in <module>    d3 = torch.cat((a, b), dim=2)IndexError: Dimension out of range (expected to be in range of [-2, 1], but got 2)

设置dim=-1,得到如下结果,当参数为-1时,与dim=1的返回结果相同
dim=-1,表示在第二维度进行拼接

d_1= torch.cat((a, b), dim=-1) print(d_1)Out[25]: tensor([[ 1,  2,  3, 10, 20, 30],        [ 4,  5,  6, 40, 50, 60],        [ 7,  8,  9, 70, 80, 90]]) d1 = torch.cat((a, b), dim=1)print(d1)Out[22]: tensor([[ 1,  2,  3, 10, 20, 30],        [ 4,  5,  6, 40, 50, 60],        [ 7,  8,  9, 70, 80, 90]])

设置dim=-2,与dim=0相同:
表示在第一维度进行拼接

d_2= torch.cat((a, b), dim=-2)print(d_2)Out[27]: tensor([[ 1,  2,  3],        [ 4,  5,  6],        [ 7,  8,  9],        [10, 20, 30],        [40, 50, 60],        [70, 80, 90]]) d1 = torch.cat((a, b), dim=0)print(d1)Out[20]: tensor([[ 1,  2,  3],        [ 4,  5,  6],        [ 7,  8,  9],        [10, 20, 30],        [40, 50, 60],        [70, 80, 90]])

可以看到,采用不同的参数,输出的张量维度仍然与原来张量的维度保持一致。
若输入参数的维度不一样,会产生什么结果呢?

当输出张量保持一个维度一致时,若在相同维度的方向进行连接torch.cat操作,则仍然可以张量的合并操作,若在维度不同的方向进行连接操作,会报错。(‍♀️torch.cat操作没有广播机制

**torch.stack()**操作
拼接函数,是拼接以后,再扩展一维。torch.stack()有两个参数,第一个是要拼接的张量的列表或是元组;第二个参数是拼接的维度。
此处不再重复dim=-3 or -2等操作,当dim=0时

c1 = torch.stack((a, b), dim=0) Out[12]: tensor([[[ 1,  2,  3],         [ 4,  5,  6],         [ 7,  8,  9]],        [[10, 20, 30],         [40, 50, 60],         [70, 80, 90]]])

当dim=1时

c2 = torch.stack((a, b), dim=1) Out[15]: tensor([[[ 1,  2,  3],         [10, 20, 30]],        [[ 4,  5,  6],         [40, 50, 60]],        [[ 7,  8,  9],         [70, 80, 90]]])

当 dim=2时

c3 = torch.stack((a, b), dim=2) Out[17]: tensor([[[ 1, 10],         [ 2, 20],         [ 3, 30]],        [[ 4, 40],         [ 5, 50],         [ 6, 60]],        [[ 7, 70],         [ 8, 80],         [ 9, 90]]])

若在torch.stack中使用不同维度的输入,得到报错的反馈
从实例可见,torch.stack操作将会增加合并后张量的维度

总结:

torch.cat()与torch.stack()操作都是对张量进行拼接操作,不同点如下:

torch.stack()将对张量维度进行扩张

torch.cat()可以对只有一个方向维度相同的张量进行合并,而torch.stack()要求输入张量的维度必须一样。

stack与cat的区别在于,得到的张量的维度会比输入的张量的大小多1,并且多出的那个维度就是拼接的维度,那个维度的大小就是输入张量的个数。见下面代码:

A=torch.tensor([[1,2,3],[4,5,6],[7,8,9]],dtype=torch.float)print("A:",A)B=torch.tensor([[-1,-2,-3],[-4,-5,-6],[-7,-8,-9]],dtype=torch.float)print("B:",B)print("*********************************")c=torch.cat((A,B),dim=0)#保持维度不变print(c)print(c.shape)d=torch.stack((A,B),dim=0)#多扩展一维度print(d)print(d.shape)

运行结果:

扩展:

torch.cat和torch.stack()的拼接为[]数据时:
见拼接列表数据