当前位置：首页 > news >正文

详细介绍Pytorch中torchvision的相关使用

news 文章来源：https://blog.csdn.net/qq_52964132/article/details/141181245 2025/4/27 7:07:40

torchvision 是 PyTorch 的一个官方库，主要用于处理计算机视觉任务。提供了许多常用的数据集、模型架构、图像转换等功能，使得计算机视觉任务的开发变得更加高效和便捷。以下是对 torchvision 主要功能的详细介绍：

1. 数据集（Datasets）

torchvision 提供了许多常用的计算机视觉数据集，如 CIFAR-10、MNIST、ImageNet 等。这些数据集可以直接通过 torchvision.datasets 模块加载。

示例：加载 CIFAR-10 数据集

from torchvision import datasets
from torch.utils.data import DataLoader# 加载 CIFAR-10 数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True)
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True)# 使用 DataLoader 加载数据
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

2. 图像转换（Transforms）

torchvision.transforms 模块提供了许多常用的图像转换操作，如裁剪、缩放、旋转、翻转等。这些转换操作可以单独使用，也可以组合使用。

示例：组合图像转换操作

from torchvision import transforms# 定义转换操作
transform = transforms.Compose([transforms.Resize((256, 256)),transforms.RandomCrop(224),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])# 应用转换操作
train_dataset.transform = transform
test_dataset.transform = transform

3. 预训练模型（Models）

torchvision.models 模块提供了许多常用的预训练模型，如 ResNet、VGG、AlexNet、DenseNet 等。这些模型可以直接用于迁移学习或作为基准模型。

示例：加载预训练的 ResNet-50 模型

from torchvision import models
import torch.nn as nn# 加载预训练的 ResNet-50 模型
model = models.resnet50(pretrained=True)# 修改最后一层以适应新的分类任务
num_classes = 10
model.fc = nn.Linear(model.fc.in_features, num_classes)

4. 数据加载器（DataLoader）

torch.utils.data.DataLoader 是一个实用的数据加载器，可以与 torchvision 提供的数据集一起使用，方便地进行批量加载和数据迭代。

示例：使用 DataLoader 加载数据

from torch.utils.data import DataLoader# 使用 DataLoader 加载数据
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)# 训练模型
for images, labels in train_loader:# 训练代码pass

5. 自定义数据集（Custom Datasets）

如果需要使用自定义数据集，可以继承 torch.utils.data.Dataset 类，并实现 __len__ 和 __getitem__ 方法。

示例：自定义数据集

from torch.utils.data import Dataset
from PIL import Image
import osclass CustomDataset(Dataset):def __init__(self, root_dir, transform=None):self.root_dir = root_dirself.transform = transformself.images = os.listdir(root_dir)def __len__(self):return len(self.images)def __getitem__(self, idx):img_path = os.path.join(self.root_dir, self.images[idx])image = Image.open(img_path)if self.transform:image = self.transform(image)return image# 使用自定义数据集
custom_dataset = CustomDataset(root_dir='path/to/dataset', transform=transform)
custom_loader = DataLoader(custom_dataset, batch_size=64, shuffle=True)

6. 可视化（Visualization）

torchvision 还提供了一些用于可视化的工具，如 torchvision.utils.make_grid 可以将多个图像拼接成一个网格图像。

示例：可视化图像

import matplotlib.pyplot as plt
from torchvision import utils# 获取一批图像
images, labels = next(iter(train_loader))# 将图像拼接成网格
grid = utils.make_grid(images)# 显示图像
plt.imshow(grid.permute(1, 2, 0))
plt.show()

详细介绍Pytorch中torchvision的相关使用

torchvision 是 PyTorch 的一个官方库，主要用于处理计算机视觉任务。提供了许多常用的数据集、模型架构、图像转换等功能，使得计算机视觉任务的开发变得更加高效和便捷。以下是对 torchvision 主要功能的详细介绍： 1. 数据集（Dat…...

编程日记 2024/8/15 8:13:27

AI部署——主流模型推理部署框架

我们以最经典的Yolov5目标检测网络为例解释一下10种主流推理部署框架的大概内容，省略模型训练的过程，只讨论模型转换、环境配置、推理部署等步骤。 Intel的OpenVINO — CPUNvidia的TensorRT — GPU/CPUOpenCV DNN Module — GPU/CPUMicrosoft ONNX Runti…...

编程日记 2024/8/15 8:12:26

PyTorch之loading fbgemm.dll异常的解决办法

前言 PyTorch是一个深度学习框架，当我们在本地调试大模型时，可能会选用并安装它，目前已更新至2.4版本。一、安装必备 1. window 学习或开发阶段，我们通常在window环境下进行，因此需满足以下条件： Windo…...

编程日记 2024/8/15 8:11:25

Vscode——如何实现 Ctrl+鼠标左键跳转函数内部的方法

一、对于Python代码安装python插件即可实现二、对于C/C代码安装C/C插件即可实现...

编程日记 2024/8/15 8:10:24

力扣热题100_回溯_78_子集

文章目录题目链接解题思路解题代码题目链接 78. 子集给你一个整数数组 nums ，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例 1： 输入&#xff…...

编程日记 2024/8/15 8:09:23

浏览器如何工作（一）进程架构

分享cosine 大佬，版权©️大佬所有浏览器的核心功能浏览器，“浏览” 是这个产品的核心，浏览无非分为两步： 获取想浏览的资源展示得到的资源现代浏览器还增加了交互功能，这涉及到脚本运行。因此&#xff0c…...

编程日记 2024/8/15 8:08:22

【LeetCode】两数之和

给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例 1…...

编程日记 2024/8/15 8:07:21

UE5学习笔记11-为拿取武器添加动画

一、一点说明动画实例通过扩展为所有机器上的每个字符都存在动画蓝图，动画实例只能访问该计算机上的变量。二、思路我在武器组件中有一个武器类的指针，判断当前指针是否为空去判断当前角色是否装备武器三、实现 1.在角色C类中添加是否装备武器的函…...

编程日记 2024/8/15 8:06:20

68. 文本左右对齐【力扣(LeetCode) 】

一、题目描述给定一个单词数组 words 和一个长度 maxWidth ，重新排版单词，使其成为每行恰好有 maxWidth 个字符，且左右两端对齐的文本。你应该使用 “贪心算法” 来放置给定的单词；也就是说，尽可能多地往每行中放置单…...

编程日记 2024/8/15 8:04:17

【中等】猿人学web第一届第6题 js混淆-回溯

文章目录请求流程请求参数加密参数定位r() 方法z() 方法加密参数还原JJENCOde js代码加密环境检测_n("jsencrypt")12345 计算全部中奖的总金额请求代码注意请求流程请求参数打开调试工具，查看数据接口 https://match.yuanrenxue.cn/api/match/6 请…...

编程日记 2024/8/15 8:03:16

低、中、高频率段具体在不同应用中的范围是多少

1、低频率段（Low Frequency Range） ①建筑声学和噪声控制：通常将20 Hz 到 200 Hz 的频率范围视为低频段。在这一范围内，声音的波长较长，通常与低音（如重低音音乐）和建筑结构中的振动有关。 ②…...

编程日记 2024/8/15 8:02:15

Oxford Model600 Model400低温氦压缩机cryogenic helium compressor手侧

Oxford Model600 Model400低温氦压缩机cryogenic helium compressor手侧...

编程日记 2024/8/15 8:01:14

Golang面试题四（并发编程）

目录 1.Go常见的并发模型 2.哪些方法安全读写共享变量 3.如何排查数据竞争问题 4.Go有哪些同步原语 1. Mutex (互斥锁) 2. RWMutex (读写互斥锁) 3. Atomic 3.1.使用场景 3.2.整型操作 3.3.指针操作 3.4.使用示例 4. Channel 使用场景使用示例 5. sync.WaitGr…...

编程日记 2024/8/15 8:00:12

计算机学生高效记录并整理编程学习笔记的方法

哪些知识点需要做笔记？ 以下是我认为计算机学生大学四年可以积累的笔记。 ① 编程语言类（C语言CJava）：保留课堂笔记中可运行的代码部分，课后debug跑一跑。学习语言初期应该多写代码（从仿写到自己写&#…...

编程日记 2024/8/15 7:59:11

【书生大模型实战】L2-LMDeploy 量化部署实践闯关任务

一、关卡任务基础任务（完成此任务即完成闯关） 使用结合W4A16量化与kv cache量化的internlm2_5-7b-chat模型封装本地API并与大模型进行一次对话，作业截图需包括显存占用情况与大模型回复，参考4.1 API开发(优秀学员必做)使用Func…...

编程日记 2024/8/15 7:58:10

《编程学习笔记之道：构建知识宝库的秘诀》

在编程的浩瀚世界里，我们如同勇敢的探险家，不断追寻着知识的宝藏。而高效的笔记记录和整理方法，就像是我们手中的指南针，指引着我们在这片知识海洋中前行，不至于迷失方向。在这篇文章中，我们将深入探讨如何…...

编程日记 2024/8/15 7:56:08

DETR论文，基于transformer的目标检测网络 DETR:End-to-End Object Detection with Transformers

transformer的基本结构: encoder-decoder的基本流程为： 1）对于输入，首先进行embedding操作，即将输入映射为向量的形式，包含两部分操作，第一部分是input embedding：例如，在NLP领域&…...

编程日记 2024/8/15 7:55:06

untiy有渲染线程和逻辑线程嘛

之前我也这么认为，其实unity引擎是单线程的，当然后续的jobs不在考虑范围内如果你在一个awake 或者 start方法中延时，是会卡住主线程的比如其实游戏引擎有一个基础简单理解，那就是不断的进行一个循环，在这个周期循…...

编程日记 2024/8/15 7:53:04

什么是数据仓库ODS层？为什么需要ODS层？

在大数据时代，数据仓库的重要性不言而喻。它不仅是企业数据存储与管理的核心，更是数据分析与决策支持的重要基础。而在数据仓库的各个层次中，ODS层（Operational Data Store，操作型数据存储）作为关键一环&am…...

编程日记 2024/8/15 7:50:02

60. Permutation Sequence class Solution:def getPermutation(self, n: int, k: int) -> str:def rec(k, l, ans, n):if(n0): return# 保留第一个位置，剩下数字的组合leftCom math.factorial(n - 1) #用于计算 (n-1) 的阶乘值ele k // leftCommod k % leftCo…...

编程日记 2024/8/15 7:49:01

PCL 三线性插值

文章目录一、简介二、实现代码三、实现效果参考资料一、简介三线性插值是一种在三维空间中使用已知数据点进行插值的方法。它是在立方体内的插值方法，通过利用立方体的八个顶点的已知值来估算立方体内任意一点的值。三线性插值扩展了一维的线性插值和二维的双线性插值。其基…...

编程日记 2024/8/15 7:46:59

JVM虚拟机（一）介绍、JVM内存模型、JAVA内存模型，堆区、虚拟机栈、本地方法栈、方法区、常量池

目录学习JVM有什么用、为什么要学JVM？ JVM是什么呢？ 优点一：一次编写，到处运行。（Write Once, Run Anywhere，WORA） 优点二：自动内存管理，垃圾回收机制。优点三&am…...

编程日记 2024/8/15 7:45:58

Python利用xlrd复制一个Excel中的sheet保留原格式创建一个副本（注：xlrd只能读取xls）

目录专栏导读库的介绍库的安装完整代码总结专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手 🏳️‍🌈 博客主页：请点击——> 一晌小贪欢的博客主页求关注 👍 该系列文…...

编程日记 2024/8/15 7:44:57

40、Python之面向对象：扩展的对象属性解析顺序（描述符 + MRO）

引言在上一篇文章中，我们简单回顾了Python中在继承语境下的属性解析顺序，同时补充了能够控制、影响属性解析的3个函数/方法（2个魔术方法 1个内置函数），相信对Python中属性的解析，相较于MRO，有…...

编程日记 2024/8/15 7:34:48

stm32—时钟、定时器和看门狗

1. 时钟什么是时钟呢？ 一个可以产生周期性信号的设备什么是周期性信号？ 1 ----- ----- ----- 0 ----- ----- ----- 所以时钟信号就是周期性变化的信号关于时钟我们有两个比较重要…...

编程日记 2024/8/15 7:31:44

Windows平台RTSP|RTMP播放器如何实时调节音量

我们在做Windows平台RTSP、RTMP播放器的时候，有这样的技术需求，特别是多路监控的时候，并不是每一路audio都需要播放出来的，所以，这时候，需要有针对音量调节的设计： /** smart_player_sdk.cs* C…...

编程日记 2024/8/15 7:27:40

Leetcode JAVA刷刷站（10）正则表达式匹配

一、题目概述二、思路方向在Java中，实现一个支持.和*的正则表达式匹配器，可以通过递归或动态规划（DP）的方法来完成。这里，我将使用动态规划的方法来解决这个问题，因为它更容易理解和实现。动态规划的思…...

编程日记 2024/8/15 7:22:35

合并图片为pdf

1.先使用IDM在网页下载： 2.按文件类型分组，在按名称大小排序，之后使用Acrobat合并文件成一个pdf即可...

编程日记 2024/8/15 7:20:32

【Linux Install】Ubuntu20， Windows10 双系统安装

1. 制作启动盘 1.1 下载 Ubuntu 系统镜像 ISO 文件从 Ubuntu 官网下载 (https://cn.ubuntu.com/download/desktop)。官网访问慢的，从国内镜像点下。 1.2 烧录 Ubuntu ISO 镜像下载 Rufus：从Rufus官网下载 Rufus 工具。插入U 盘：将U盘插…...

编程日记 2024/8/15 7:19:31

Keepalived + LVS实现高可用

1、简介 LVS和Keepalived是Linux操作系统下实现高可用的负载均衡解决方案的重要工具。通过协同工作，它们能够实现一种高性能、高可用的负载均衡服务，使得用户能够透明地访问到集群中的服务。同时，它们还提供了强大的监控和故障切换功能&#…...

编程日记 2024/8/15 7:15:27