当前位置: 首页 > news >正文

pytorch 一些常用语法

主页 - PyTorch中文文档

torch.cat() 张量连接

torch.cat(inputs, dimension=0) → Tensor

在给定维度上对输入的张量序列seq 进行连接操作。
参数:

  • inputs (sequence of Tensors) – 可以是任意相同Tensor 类型的python 序列
  • dimension (intoptional) – 沿着此维连接张量序列。
    • 沿行方向拼接(dim=0)​
    • 沿列方向拼接(dim=1)​

例子:

>>> x = torch.randn(2, 3)
>>> x0.5983 -0.0341  2.49181.5981 -0.5265 -0.8735
[torch.FloatTensor of size 2x3]>>> torch.cat((x, x, x), 0)0.5983 -0.0341  2.49181.5981 -0.5265 -0.87350.5983 -0.0341  2.49181.5981 -0.5265 -0.87350.5983 -0.0341  2.49181.5981 -0.5265 -0.8735
[torch.FloatTensor of size 6x3]>>> torch.cat((x, x, x), 1)0.5983 -0.0341  2.4918  0.5983 -0.0341  2.4918  0.5983 -0.0341  2.49181.5981 -0.5265 -0.8735  1.5981 -0.5265 -0.8735  1.5981 -0.5265 -0.8735
[torch.FloatTensor of size 2x9]

tensor 转化为标量

​场景​​推荐方法​
单元素张量 → Python值tensor.item()
零维标量张量tensor.item()
多元素张量 → Python列表tensor.tolist()
import torch  a = torch.tensor([5])  # 单元素张量(形状为 [1])  
b = torch.tensor(3.14) # 零维张量(标量张量)  
c = torch.tensor([3, 5])  # 多元素张量  
d = torch.tensor([[5, 3],[3, 7]])  print(a.item())  # 输出: 5(Python int)  
print(b.item())  # 输出: 3.140000104904175(Python float)  
print(c.tolist())  # 输出: [3, 5](Python list)  
print(d.tolist())  # 输出: [[5, 3], [3, 7]](Python list) # 以下操作会报错!  
# c.item()  # ValueError: only one element tensors can be converted to Python scalars

next(iter(DataLoader))

  • 首先,iter(data_iter) 将 DataLoader 对象转换为一个迭代器
  • 然后,next() 函数会从迭代器中获取下一个元素,第一次使用next()就是获取第一个批次

trainer.zero_grad()

trainer.zero_grad() 是 PyTorch 中的一个重要方法,用于清除模型中所有参数的梯度。以下是它的重要性:

  1. 在 PyTorch 中,梯度是默认累积的。这意味着如果不清除梯度,每次反向传播都会将新的梯度添加到现有梯度上。

  2. 在计算下一批数据的梯度之前,需要将前一批数据的梯度清零。否则:

    • 梯度会不正确地累积
    • 你会在当前更新中使用到之前批次的梯度
  3. PyTorch 中典型的训练循环模式是:

optimizer.zero_grad()    
# 清除现有梯度 
loss = loss_function()  
# 前向传播 
loss.backward()          
# 反向传播 
optimizer.step()
http://www.xdnf.cn/news/211537.html

相关文章:

  • 图漾官网Sample_V1版本C++语言完整参考例子---单相机版本
  • 企业办公协同平台安全一体化生态入住技术架构与接口标准分析报告
  • ubnuntu使用conda进行虚拟环境迁移,复制,克隆
  • Dify 使用模版转换实现更丰富的输入格式支持
  • linux FTP服务器搭建
  • 通信协议——SPI通信协议
  • Go语言中的错误处理
  • CSS:编写位置分类
  • PDF编辑器:Foxit PDF Editor Pro 版功能解析
  • JVM对象存储格式
  • 解决调用Claude 3.7接口 403 Request not allowed问题
  • 贝叶斯优化RF预测模型
  • 轻松实现CI/CD: 用Go编写的命令行工具简化Jenkins构建
  • 处理pdf文件的常用库unstructured和PyPDF2
  • 【PyTorch动态计算图原理精讲】从入门到灵活应用
  • vscode 配置qt
  • WEB漏洞--CSRF及SSRF案例
  • 可靠性工程:加速因子与筛选度计算模型解析
  • 修改输入框选择框颜色
  • jspm老年体检信息管理系统(源码+lw+部署文档+讲解),源码可白嫖!
  • 【论文阅读/复现】RT-DETR的网络结构/训练/推理/验证/导出模型
  • 如何让自己保持一定的神秘感--deepseek
  • k8s部署
  • Vim 中替换字符或文本
  • 水利三维可视化平台怎么做?快速上手的3步指南
  • CMA软件实验室评审政策解读
  • Fortran如何写注释?
  • MySQL下载与安装
  • 电子电器框架 --- 数据连接性和云集成在增强电气/电子架构方面的作用
  • Docker 容器双网卡访问物理雷达网络教程