当前位置：首页 > news >正文

tensor 的连续性与 contiguous() 方法

news 2025/7/18 15:59:40

1、连续性

在“tensor 内部存储结构”这篇，我们已经介绍了tensor 的数据存储结构，其中说到：Tensor多维数组数据存储在存储区，底层实现是使用一块连续内存的 1维数数组进行存储，而该多维数组的形状则保存在了 Tensor 的metadata 中，例如：

t = torch.arange(12).reshape(3,4)

实际上，我们上面生成的数组 t ，它在存储区中是以一维数组形式存储的，如下图：

“连续性” 是指： Tensor底层一维数组元素的存储顺序与Tensor按行优先一维展开的元素顺序是否一致。

我们可以通过 flatten() 方法查看 t 的一维展开形式，通过 storage() 方法查看数据存储区的元素。若 t 一维展开的元素顺序和数据存储区的元素顺序一致，就说明： t 是连续的

import torcht = torch.arange(12).reshape(3,4)print(t.flatten())
print(t.storage())

2、不连续举例

import torcht = torch.arange(12).reshape(3,4)
print(t)t2 = t.transpose(0, 1)  # 对 t 进行转置
print(t2)print(t2.flatten())
print(t2.storage())

t2 和 t 共享同一个物理内存，即共用同一个源数据，源数据实际存储形式如下：

所以，t2 实际存储形式 ([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]) 与一维展开形式( [0, 4, 8, 1, 5, 9, 2, 6, 10, 3, 7, 11]) 不一致，故， t2 不是连续的。

当 tensor 在内存中不是连续存储时，可能会导致梯度计算错误，进而影响模型的训练和收敛性能。

3、is_contiguous() 方法、contiguous()方法

首先，你可通过 is_contiguous() 来判断 Tensor 是否连续

import torcht = torch.arange(12).reshape(3,4)
t2 = t.transpose(0, 1)
print(t2.is_contiguous())  # False

其次，你可以在不知道 Tensor 是否连续的情况下，直接使用 contiguous()方法，使其变得连续，但在不同的情况下， contiguous() 的操作是不一样的：
- 如果Tensor 不是连续的，则会重新开辟一块内存空间保证数据是在内存中是连续的
- 如果Tensor 是连续的，则 contiguous() 无操作

import torcht = torch.arange(12).reshape(3, 4)
t2 = t.transpose(0, 1)
print(t2)t3 = t2.contiguous()
print(t3)print(t3.data_ptr() == t2.data_ptr())

对 t2 使用 contiguous() 方法，生成 t3，t3 和 t2 是完全不同的tensor （不是使用同一个存储区的源数据）

4、view 与 reshape 对 tensor 连续性的要求

（1）view

在使用 view前，要保证 tensor 的连续性，否则会报错

import torcht = torch.arange(12).reshape(3, 4)
t2 = t.transpose(0, 1)
print(t2)t3 = t2.view(2, 6)
print(t3)

所以，如果 tensor 不连续，我们要先通过 contiguous() 方法，将数据转换为连续的tensor，再使用 view

import torcht = torch.arange(12).reshape(3, 4)
t2 = t.transpose(0, 1)
print(t2)t3 = t2.contiguous()
t3 = t3.view(2, 6)
print(t3)

（2）reshape

为了解决用户使用便捷性问题，PyTorch 在0.4版本以后提供了reshape方法，实现了类似于 tensor.contigous().view(*args) 的功能，如果不关心底层数据是否使用了新的内存，则使用 reshape方法更方便。

import torcht = torch.arange(12).reshape(3, 4)
t2 = t.transpose(0, 1)
print(t2)t3 = t2.reshape(2, 6)
print(t3)

查看全文

http://www.xdnf.cn/news/183457.html

全星APQP软件系统：驱动芯片半导体行业研发管理迈向高效与合规新高度

远程通信历史上为什么电话网络从模拟信号转向了数字信号？

Super Sample Tasker 学习-1

disruptor-spring-boot-start版本优化升级

LeetCode 每日一题 2025/4/21-2025/4/27

C++初阶-模板初阶

杭电oj（1008、1012、1013、1014、1017）题解

【文心快码】确实有点东西！

Redis 通用命令与keyspace

element-ui dropdown 组件源码分享

QML中的色彩应用

调度算法的模拟及应用

接口测试详解

electron-vite 应用打包自定义图标不显示问题

28-29【动手学深度学习】批量归一化 + ResNet

Java线程池详解

2024年12月GESP 图形化一级考级真题——飞行的小猫

Linux的例行性工作（crontab）

码蹄杯——tips

MAGI-1: Autoregressive Video Generation at Scale

基于Jamba模型的天气预测实战

java工具类

Redis哨兵模式深度解析：实现高可用与自动故障转移的终极指南

大语言模型架构基础与挑战

简单了解Java的I/O流机制与文件读写操作

智能电网新引擎：动态增容装置如何解锁输电线路潜力？

spark学习总结

C++/SDL 进阶游戏开发 —— 双人塔防（代号：村庄保卫战 14）

Java大厂面试：互联网医疗场景中的Spring Boot与微服务应用

第42周：文献阅读