当前位置：首页 > news >正文

[pytorch入门] 3. torchvision中的transforms

news 2026/2/7 9:58:50

torchvision中的transforms

是transforms.py工具箱，含有totensor、resize等工具
用于将特定格式的图片转换为想要的图片的结果，即用于图片变换

用法

在transforms中选择一个类创建对象，使用这个对象选择相应方法进行处理

能够选择的类

列表

["Compose","ToTensor",  # 转化为tensor类型"PILToTensor","ConvertImageDtype","ToPILImage", # tenor或ndarray转换为PIL image"Normalize",  # 归一化（用均值或标准差归一化tensor类型的image）"Resize","CenterCrop","Pad","Lambda","RandomApply","RandomChoice","RandomOrder","RandomCrop","RandomHorizontalFlip","RandomVerticalFlip","RandomResizedCrop","FiveCrop","TenCrop","LinearTransformation","ColorJitter","RandomRotation","RandomAffine","Grayscale","RandomGrayscale","RandomPerspective","RandomErasing","GaussianBlur","InterpolationMode","RandomInvert","RandomPosterize","RandomSolarize","RandomAdjustSharpness","RandomAutocontrast","RandomEqualize","ElasticTransform",
]

使用

NT
- 关注输入和输出类型
- 多看官方文档（可以进源码去看）

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transformswriter = SummaryWriter('logs')
img = Image.open('./dataset2/train/ants_image/5650366_e22b7e1065.jpg')
print(img)# ToTensor
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)       # 将PIL对象转换为tensor对象
writer.add_image("tensor_img",img_tensor)# Normalize 归一化：（输入-均值）/标准差
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5]) # 要提供一个均值一个标准差
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("norm_img",img_norm)# Resize 调整尺寸：(h,w)
print(img.size)
trans_resize = transforms.Resize((512,512))# img PIL -> resize -> img_resize PIL
img_resize = trans_resize(img)  # 这里要传入的是PIL image类型# img_resize PIL -> totensor -> img_resize tensor
img_resize = trans_totensor(img_resize)
print(img_resize)# Compose  -  resize 第二种用法： 等比缩放
trans_resize_2 = transforms.Resize(512)# PIL -> PIL -> tensor
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])  # 从右往左执行，后面参数的输入和前面参数的输出是一致的
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)# RandomCrop 随机裁剪
trans_random = transforms.RandomCrop(256) # 传一个int：代表正方形，传一个tuple：代表矩形
trans_compose_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):img_crop = trans_compose_2(img)writer.add_image("RandomCrop", img_crop, i)writer.close()

进入调试，就会发现tensor_img中有一些反向传播的钩子：
在这里插入图片描述
以及使用的设备：

可以理解为tensor类型包含了神经网络训练所需要的一些参数

其他

类中的__call__方法:对象可以直接用括号时自动用的该方法（区别于普通方法需要用“.”调用）

class Person:def __call__(self, name):print("__call__:", name)def hello(self, name):print("hello",name)p = Person()
p("jerry")
p.hello('tom')

[pytorch入门] 3. torchvision中的transforms

torchvision中的transforms 是transforms.py工具箱，含有totensor、resize等工具用于将特定格式的图片转换为想要的图片的结果，即用于图片变换用法在transforms中选择一个类创建对象，使用这个对象选择相应方法进行处理能够选择的类列…...

编程日记 2024/1/23 11:58:30

WINCC读写EXCEL-VBS

原创 RENHQ WINCC 关于VBS操作EXCEL的文档不管在论坛上还是在网上，相关的脚本已经很多，但是依然有很多人在问这个问题，于是把我以前在论坛上发的一个集合帖子的脚本拿来，重新开个帖子，如果再有人问的话，可…...

编程日记 2024/1/23 11:49:20

Python os模块

简介 Python的os模块是一个标准库模块，用于提供与操作系统相关的功能（相当于接口）。os模块允许Python程序与文件系统、目录结构、进程管理等操作系统级别的功能进行交互。主要功能文件和目录操作创建、删除、重命名文件和目录&#xf…...

编程日记 2024/1/23 11:46:17

Elasticsearch：2023 年 Lucene 领域发生了什么？

作者：来自 Elastic Adrien Grand 2023 年刚刚结束，又是 Apache Lucene 开发活跃的一年。让我们花点时间回顾一下去年的亮点。社区 2023 年，有： 5 个次要版本（9.5、9.6、9.7、9.8 和 9.9），1 …...

编程日记 2024/1/23 11:45:16

Java算法 leetcode简单刷题记录4

Java算法 leetcode简单刷题记录4 买卖股票的最佳时机： https://leetcode.cn/problems/best-time-to-buy-and-sell-stock/ 笨办法： 记录当天的值及之后的最大值，相减得到利润； 所有的天都计算下，比较得到利润最大值&…...

编程日记 2024/1/23 11:44:15

opencv#27模板匹配

图像模板匹配原理例如给定一张图片，如上图大矩阵所示，然后给定一张模板图像，如上图小矩阵。我们在大图像中去搜索与小图像中相同的部分或者是最为相似的内容。比如我们在图像中以灰色区域给出一个与模板图像尺寸大小一致的区域，…...

编程日记 2024/1/23 11:37:08

【论文阅读笔记】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation

1.介绍 Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation Swin-Unet：用于医学图像分割的类Unet纯Transformer 2022年发表在 Computer Vision – ECCV 2022 Workshops Paper Code 2.摘要在过去的几年里，卷积神经网络&#xff…...

编程日记 2024/1/23 11:35:05

这是实验拓扑，下面是基本配置： R1: sys sysname R1 user-interface console 0 idle-timeout 0 0 int loop 0 ip add 1.1.1.1 24 int g0/0/0 ip add 192.168.12.1 24 qR2: sys sysname R2 user-interface console 0 idle-timeout 0 0 int loop 0 ip add …...

编程日记 2024/1/23 11:34:04

基于极限学习机的曲线分类，基于极限学习机的光谱分类，基于极限学习机的分类预测

目录背影极限学习机基于极限学习机的曲线分类，基于极限学习机的光谱分类，基于极限学习机的分类预测主要参数 MATLAB代码效果图结果分析展望完整代码下载链接：基于极限学习机的曲线分类，基于极限学习机的光谱分类，基于极限学习机的分类预测的MATLAB代码资源-CSDN…...

编程日记 2024/1/23 11:32:02

miniconda安装

Miniconda是一个小型版的Anaconda，它包含了一个包管理工具conda和Python。Miniconda适用于那些只需要管理Python包和环境，而不需要Anaconda中包含的大部分科学计算工具的用户。 Miniconda的安装过程相对简单。你可以从清华大学开源软件镜像站下载Minico…...

编程日记 2024/1/23 11:31:00

PHP判断访客是否手机端(移动端浏览器)访问的方法总结

PHP判断访客是否手机端、移动端、浏览器访问的方法总结方法一：使用$_SERVER全局变量方法二：使用PHP的get_browser函数方法三：使用第三方库（Mobile Detect）方法四：使用WURFL设备数据库方法一：使…...

编程日记 2024/1/23 11:27:57

vscode无法自动补全

前提：安装c/c插件 c/c插件功能非常强大，几乎能满足日常编码过程中常用的功能；因此也包含自动补全的功能，开启方法如下： 文件->首选项->设置： 扩展->c/c->Intellisense，找到Intell…...

编程日记 2024/1/23 11:25:54

深度学习记录--指数加权平均

指数加权移动平均(exponentially weighted moving averages) 如何对杂乱的数据进行拟合？ 通过指数加权平均可以把数据图近似拟合成一条曲线公式： 其中表示第t个平均数，表示第t-1个平均数，表示第t个数据，表示变化参数…...

编程日记 2024/1/23 11:18:46

如何生成图源二维码？

数据是GIS的血液。自从苹果端与安卓端水经微图APP（简称“微图APP”）上线之后，有用户反馈图源比较少的问题。其实，微图APP支持通过图源二维码添加自定义图源，而该二维码则可以通过微图Web版生成。如何生成图源二维…...

编程日记 2024/1/23 11:17:44

PowerShell install 一键部署grafana

grafana 前言 Grafana 是一款开源的数据可视化和监控仪表盘工具。它提供了丰富的数据查询、可视化和报警功能，可用于实时监控、数据分析和故障排除等领域。通过 Grafana，您可以连接到各种不同的数据源，包括时序数据库（如 Prometheus、InfluxDB）和关系型数据库（如 MySQ…...

编程日记 2024/1/23 11:16:43

笨蛋学设计模式行为型模式-解释器模式【23】

行为型模式-解释器模式 8.10解释器模式8.10.1概念8.10.2场景8.10.3优势 / 劣势8.10.4解释器模式可分为8.10.5解释器模式8.10.6实战8.10.6.1题目描述8.10.6.2输入描述8.10.6.3输出描述8.10.6.4代码 8.10.7总结 8.10解释器模式 8.10.1概念解释器模式用于定义一个语言的文法…...

编程日记 2024/1/23 11:14:41

SAP ABAP SUBMIT常用用法

导语：一直对SUBMIT的用法模模糊糊，每次用都要去查询，本次痛下决心，腾出时间，梳理了一下，如果本文对你有帮助，点个赞再走～ 之前分享过SUBMIT调用程序获取内表的值，就不重…...

编程日记 2024/1/23 11:13:40

GitLab备份与恢复测试(基于Docker)

GitLab环境准备 docker run --name gitlab \ -p 2022:22 -p 2080:80 -p 2443:443 -d \ -v /opt/gitlab/config:/etc/gitlab \ -v /opt/gitlab/gitlab/logs:/var/log/gitlab \ -v /opt/gitlab/gitlab/data:/var/opt/gitlab \ gitlab/gitlab-ce:16.2.1-ce.0备份 1.修改配置文件…...

编程日记 2024/1/23 11:12:38

android studio开发的一些问题

1、编译后，输出日志乱码 Help-->Edit Custom VM Options...-->-Dfile.encodingUTF-8 2、编译时，出现：connect timed out 试过很多方法啦，都是不行的。最后我自己摸索出方法。 [1]android studio-->Project-->Grad…...

编程日记 2024/1/23 11:08:34

辞职对于我来说，不可避免（10）

人，从有辞职的想法，再到把辞职出口要多久，一天、一星期还是一个月 “别以为我不知道你搞了什么小动作，以后别瞎搞，不然我不客气”，从老板说出来这句话开始，这家公司我注定不可能再待下去。我很诧异，小蔡刚离职，公司干活的技术就我一个，况且我也没哪里得罪你，你冒出…...

编程日记 2024/1/23 11:05:31

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

文｜魏琳华编｜王一粟一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，…...

编程新知 2026/2/1 10:59:33

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下，商品详情API作为连接电商平台与开发者、商家及用户的关键纽带，其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息（如名称、价格、库存等）的获取与展示，已难以满足市场对个性化、智能…...

编程新知 2025/9/15 5:56:53

【JavaEE】-- HTTP

1. HTTP是什么？ HTTP（全称为"超文本传输协议"）是一种应用非常广泛的应用层协议，HTTP是基于TCP协议的一种应用层协议。应用层协议：是计算机网络协议栈中最高层的协议，它定义了运行在不同主机上…...

编程新知 2026/1/26 21:34:05

解锁数据库简洁之道：FastAPI与SQLModel实战指南

在构建现代Web应用程序时，与数据库的交互无疑是核心环节。虽然传统的数据库操作方式（如直接编写SQL语句与psycopg2交互）赋予了我们精细的控制权，但在面对日益复杂的业务逻辑和快速迭代的需求时，这种方式的开发效率和可…...

编程新知 2025/8/13 16:42:24

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架，支持"一次开发，多端部署"，可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务，为旅游应用带来&#xf…...

编程新知 2026/2/5 20:33:43

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2026/2/1 5:45:17

MMaDA: Multimodal Large Diffusion Language Models

CODE ： https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA，它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

编程新知 2026/2/3 15:24:36

uniapp微信小程序视频实时流+pc端预览方案

方案类型技术实现是否免费优点缺点适用场景延迟范围开发复杂度WebSocket图片帧定时拍照Base64传输✅ 完全免费无需服务器纯前端实现高延迟高流量帧率极低个人demo测试超低频监控500ms-2s⭐⭐RTMP推流TRTC/即构SDK推流❌ 付费方案 （部分有免费额度&#x…...

编程新知 2026/1/31 6:12:33

【python异步多线程】异步多线程爬虫代码示例

claude生成的python多线程、异步代码示例，模拟20个网页的爬取，每个网页假设要0.5-2秒完成。代码 Python多线程爬虫教程核心概念多线程：允许程序同时执行多个任务，提高IO密集型任务（如网络请求）的效率…...

编程新知 2025/12/16 18:04:55

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2026/1/31 22:59:12

[pytorch入门] 3. torchvision中的transforms

torchvision中的transforms

用法

能够选择的类

列表

使用

其他

相关文章：

[pytorch入门] 3. torchvision中的transforms

WINCC读写EXCEL-VBS

Python os模块

Elasticsearch：2023 年 Lucene 领域发生了什么？

Java算法 leetcode简单刷题记录4

opencv#27模板匹配

【论文阅读笔记】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation

IS-IS：01 ISIS基本配置

基于极限学习机的曲线分类，基于极限学习机的光谱分类，基于极限学习机的分类预测

miniconda安装

PHP判断访客是否手机端(移动端浏览器)访问的方法总结

vscode无法自动补全

深度学习记录--指数加权平均

如何生成图源二维码？

PowerShell install 一键部署grafana

笨蛋学设计模式行为型模式-解释器模式【23】

SAP ABAP SUBMIT常用用法

GitLab备份与恢复测试(基于Docker)

android studio开发的一些问题

辞职对于我来说，不可避免（10）

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

【JavaEE】-- HTTP

解锁数据库简洁之道：FastAPI与SQLModel实战指南

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

抖音增长新引擎：品融电商，一站式全案代运营领跑者

MMaDA: Multimodal Large Diffusion Language Models

uniapp微信小程序视频实时流+pc端预览方案

【python异步多线程】异步多线程爬虫代码示例

（转）什么是DockerCompose?它有什么作用？