当前位置：首页 > news >正文

0基础学习PyTorch——GPU上训练和推理

news 2026/2/8 10:51:29

大纲

创建设备
训练
推理
总结

在《Windows Subsystem for Linux——支持cuda能力》一文中，我们让开发环境支持cuda能力。现在我们要基于《0基础学习PyTorch——时尚分类（Fashion MNIST）训练和推理》，将代码修改成支持cuda的训练和推理。

创建设备

我们首先需要依据环境是否支持cuda来创建相应设备。

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

因为我们开发环境WSL已经支持了cuda，所以此时我们创建的是GPU设备。

训练

训练的过程有两处修改：

将模型实例化到GPU上。

model = GarmentClassifier().to(device) # model = GarmentClassifier()

将数据移动到GPU上。

inputs, labels = data  # 获取输入数据和对应的标签
inputs, labels = inputs.to(device), labels.to(device)  # 将数据移动到GPU上

完整代码如下

from datetime import datetime
import torch
import torchvision
import torchvision.transforms as transforms
from garmentclassifier import GarmentClassifier# 定义图像转换操作：将图像转换为张量，并进行归一化处理
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))]) # 对图像的每个通道进行标准化，使得每个通道的像素值具有零均值和单位标准差# 加载FashionMNIST训练数据集，并应用定义的图像转换操作
training_set = torchvision.datasets.FashionMNIST('./data', train=True, transform=transform)# 创建数据加载器，用于批量加载训练数据，batch_size为4，数据顺序随机打乱
trainloader = torch.utils.data.DataLoader(training_set, batch_size=4, shuffle=True)# 将模型移动到GPU上
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 实例化模型并移动到GPU上
model = GarmentClassifier().to(device)# 定义损失函数为交叉熵损失
loss_fn = torch.nn.CrossEntropyLoss()
# 定义优化器为随机梯度下降（SGD），学习率为0.001，动量为0.9
optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)# 训练模型，训练2个epoch
for epoch in range(2):running_loss = 0.0  # 初始化累计损失# 枚举数据加载器中的数据，i是批次索引，data是当前批次的数据for i, data in enumerate(trainloader, 0):inputs, labels = data  # 获取输入数据和对应的标签inputs, labels = inputs.to(device), labels.to(device)  # 将数据移动到GPU上optimizer.zero_grad()  # 清空梯度outputs = model(inputs)  # 前向传播，计算模型输出loss = loss_fn(outputs, labels)  # 计算损失loss.backward()  # 反向传播，计算梯度optimizer.step()  # 更新模型参数running_loss += loss.item()  # 累加损失# 每2000个批次打印一次平均损失if i % 2000 == 1999:print(f'[{epoch + 1}, {i + 1}] loss: {running_loss / 2000}')running_loss = 0.0  # 重置累计损失# 获取当前时间戳，格式为 'YYYYMMDD_HHMMSS'
timestamp = datetime.now().strftime('%Y%m%d%H%M%S.pth')# 定义模型保存路径，包含时间戳
model_path = 'model_{}'.format(timestamp)      # 保存模型的状态字典到指定路径
torch.save(model.state_dict(), model_path)

在这里插入图片描述

推理

GPU上算出的模型不一定非要在GPU上推理，也可以在CPU上推理。
但是本文我们就是希望模型在GPU上推理，则可以对代码做如下修改。

将模型实例化到GPU上。

model = GarmentClassifier().to(device)  # model = GarmentClassifier()

将数据移动到GPU上。

image = image.to(device)  # 将图像移动到GPU上

完整代码如下

import os
import glob
import torch
import torchvision.transforms as transforms
from PIL import Image
from datetime import datetime
from garmentclassifier import GarmentClassifierdef get_latest_model_path(directory, pattern="model_*.pth"):# 获取目录下所有符合模式的文件model_files = glob.glob(os.path.join(directory, pattern))if not model_files:raise FileNotFoundError("No model files found in the directory.")# 找到最新的模型文件latest_model_file = max(model_files, key=os.path.getmtime)return latest_model_file# 定义图像转换操作：将图像转换为张量，并进行归一化处理
transform = transforms.Compose([transforms.Resize((28, 28)),  # 调整图像大小为28x28transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))
])# 将模型移动到GPU上
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 实例化模型并移动到GPU上
model = GarmentClassifier().to(device)  # 加载训练好的模型
model_path = get_latest_model_path('./')  # 获取最新的模型文件
model.load_state_dict(torch.load(model_path, weights_only=False)) # 加载模型参数
model.eval()  # 设置模型为评估模式# 从本地加载图像
image_path = 'shoe.jpg'  # 替换为实际的图像路径
image = Image.open(image_path).convert('L')  # 将图像转换为灰度图# 预处理图像
image = transform(image)
image = image.unsqueeze(0)  # 增加一个批次维度
image = image.to(device)  # 将图像移动到GPU上# 推理（预测）
with torch.no_grad():  # 在推理过程中不需要计算梯度outputs = model(image)  # 前向传播，计算模型输出_, predicted = torch.max(outputs, 1)  # 获取预测结果# 定义类别名称
classes = ('T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat','Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot')# 打印预测结果
print(f'Predicted label: {classes[predicted.item()]}')

在这里插入图片描述

总结

依据系统是否支持cuda来生成设备。
模型和数据都要移动到相同的设备上。
模型是由CPU还是GPU训练的，并不影响推理使用CPU还是GPU。

0基础学习PyTorch——GPU上训练和推理

大纲创建设备训练推理总结在《Windows Subsystem for Linux——支持cuda能力》一文中，我们让开发环境支持cuda能力。现在我们要基于《0基础学习PyTorch——时尚分类（Fashion MNIST）训练和推理》，将代码修改成支持cuda的训练和推…...

编程日记 2024/9/29 2:05:04

这款免费工具让你的电脑焕然一新,专业人士都在用

HiBit Uninstaller 采用单一可执行文件的形式,无需复杂的安装过程,用户可以即刻开始使用。这种便捷性使其成为临时使用或紧急情况下的理想选择。尽管体积小巧,但其功能却异常强大,几乎不会对系统性能造成任何负面影响。这款工具的一大亮点是其多样化的功能。它不仅能够常规卸…...

编程日记 2024/9/29 2:04:02

Java高级Day52-BasicDAO

138.BasicDao 基本说明： DAO：data access object 数据访问对象这样的通用类，称为 BasicDao，是专门和数据库交互的，即完成对数据库(表)的crud操作在BasicDao 基础上，实现一张表对应一个Dao，…...

编程日记 2024/9/29 2:03:01

【OceanBase 诊断调优】—— SQL 诊断宝典

视频 OceanBase 数据库 SQL 诊断和优化：https://www.oceanbase.com/video/5900015OB Cloud 云数据库 SQL 诊断与调优的应用实践：https://www.oceanbase.com/video/9000971SQL 优化：https://www.oceanbase.com/video/9000889阅读和管理SQL执行…...

编程日记 2024/9/29 2:00:59

微服务Redis解析部署使用全流程

目录 1、什么是Redis 2、Redis的作用 3、Redis常用的五种基本类型（重要知识点） 4、安装redis 4.1、查询镜像文件【省略】 4.2、拉取镜像文件 4.3、启动redis并设置密码 4.3.1、修改redis密码【可以不修改】 4.3.2、删除密码【坚决不推荐】 5、S…...

编程日记 2024/9/29 1:59:58

C++之STL—常用排序算法

sort (iterator beg, iterator end, _Pred) // 按值查找元素，找到返回指定位置迭代器，找不到返回结束迭代器位置 // beg 开始迭代器 // end 结束迭代器 // _Pred 谓词 random_shuffle(iterator beg, iterator end); // 指定范围内的元素随机调…...

编程日记 2024/9/29 1:58:57

【驱动】地平线X3派：备份与恢复SD卡镜像

1、备份镜像 1.1 安装gparted GParted是硬盘分区软件GNU Parted的GTK+图形界面前端，是GNOME桌面环境的默认分区软件。 GParted可以用于创建、删除、移动分区，调整分区大小，检查、复制分区等操作。可以用于调整分区以安装新操作系统、备份特定分区到另一块硬盘等。在Ubun…...

编程日记 2024/9/29 1:56:55

【C++报错已解决】std::ios_base::failure

🎬 鸽芷咕：个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想，就是为了理想的生活! 专栏介绍在软件开发和日常使用中，BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…...

编程日记 2024/9/29 1:55:54

matlab入门学习（四）多项式、符号函数、数据统计

一、多项式 %多项式（polynomial）%创建 p[1,2,3,4] %系数向量，按x降幂排列，最右边是常数（x的0次幂） f1poly2str(p,x) %系数向量->好看的字符串 f x^3 2 x^2 3 x 4（不能运算的式子&#xf…...

编程日记 2024/9/29 1:54:53

leetcode621. 任务调度器

给你一个用字符数组 tasks 表示的 CPU 需要执行的任务列表，用字母 A 到 Z 表示，以及一个冷却时间 n。每个周期或时间间隔允许完成一项任务。任务可以按任何顺序完成，但有一个限制：两个相同种类的任务之间必须有长度为 n 的冷却时…...

编程日记 2024/9/29 1:53:52

Spark 的 Skew Join 详解

Skew Join 是 Spark 中为了解决数据倾斜问题而设计的一种优化机制。数据倾斜是指在分布式计算中，由于某些 key 具有大量数据，而其他 key 数据较少，导致某些分区的数据量特别大，造成计算负载不均衡。数据倾斜会导致个别节点出现性能…...

编程日记 2024/9/29 1:51:50

讯飞星火编排创建智能体学习（一）最简单的智能体构建

目录开篇智能体的概念编排创建智能体创建第一个智能体编辑大模型节点测试与调试开篇前段时间在华为全联接大会上看到讯飞星火企业级智能体平台的演示，对于拖放的可视化设计非常喜欢，刚开始以为是企业用户才有的，回来之后查…...

编程日记 2024/9/29 1:50:49

mac-m1安装nvm，docker，miniconda

1.安装minicondaMAC OS(M1)安装配置miniconda_mac-mini m1 conda-CSDN博客 2.安装nvm（用第二个方法）Mac电脑安装nvm(node包版本管理工具)-CSDN博客 3.安装docker dmg下载链接docker-toolbox-mac-docker-for-mac安装包下载_开源镜像站-阿里云教程MacOS系…...

编程日记 2024/9/29 1:49:48

STM32F407之Flash

寄存器分类一般寄存器分为只读存储器 (ROM) 随机存储器(RAM) 只读存储器只读存储器也被称为ROM 在正常工作时只能读不能写。只读存储器经历的阶段 ROM->PROM->EPROM->EEPROM ->Flash 优点：掉电不丢失，解构简单缺点：只适…...

编程日记 2024/9/29 1:48:46

优化 Go 语言数据打包：性能基准测试与分析

场景：在局域网内，需要将多个机器网卡上抓到的数据包同步到一个机器上。原有方案：tcpdump -w 写入文件，然后定时调用 rsync 进行同步。改造方案：使用 Go 重写这个抓包逻辑及同步逻辑，直接将抓到的包通过网…...

编程日记 2024/9/29 1:47:45

【SQL】未订购的客户

目录语法需求示例分析代码语法 SELECT columns FROM table1 LEFT JOIN table2 ON table1.common_field table2.common_field; LEFT JOIN（或称为左外连接）是SQL中的一种连接类型，它用于从两个或多个表中基于连接条件返回左表…...

编程日记 2024/9/29 1:46:44

widget.cpp #include "widget.h"Widget::Widget(QWidget *parent): QWidget(parent) {QPushButton *btn1 new QPushButton("登录",this);this->setFixedSize(640,480);btn1->resize(80,40);btn1->move(200,300);btn1->setIcon(QIcon("C:…...

编程日记 2024/9/29 1:45:43

javascript-冒泡排序

前言：好久没学习算法了，今天看了一个视频课，之前掌握很好的冒泡排序居然没写出来？ <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport"…...

编程日记 2024/9/29 1:43:41

第九届蓝桥杯嵌入式省赛程序设计题解析（基于HAL库）

一.题目分析 （1）.题目 （2）.题目分析按键功能分析----存储位置的切换键 a. B1按下切换存储位置，切换后定时时间设定为当前位置存储的时间 b. B2短按切换时分秒高亮，设置完成后，长按把设置的时…...

编程日记 2024/9/29 1:39:36

MATLAB云计算集成：在云端扩展计算能力

摘要 MATLAB云计算集成是指将MATLAB的计算能力与云平台的弹性资源相结合，以实现高性能计算、数据处理和算法开发。本文详细介绍了MATLAB云计算的基本概念、优势、配置要点以及编程实践。 1. 云计算概述云计算是一种通过互联网提供计算资源（如服务器、…...

编程日记 2024/9/29 1:37:34

后进先出（LIFO）详解

LIFO 是 Last In, First Out 的缩写，中文译为后进先出。这是一种数据结构的工作原则，类似于一摞盘子或一叠书本： 最后放进去的元素最先出来 -想象往筒状容器里放盘子： （1）你放进的最后一个盘子&#xff08…...

编程新知 2026/2/8 1:22:58

css实现圆环展示百分比，根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

编程新知 2026/2/5 4:28:28

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

如何为服务器生成TLS证书

TLS（Transport Layer Security）证书是确保网络通信安全的重要手段，它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书，可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...

编程新知 2025/12/17 5:54:30

Linux云原生安全：零信任架构与机密计算

Linux云原生安全：零信任架构与机密计算构建坚不可摧的云原生防御体系引言：云原生安全的范式革命随着云原生技术的普及，安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测，到2025年，零信任架构将成为超…...

编程新知 2025/8/17 17:11:47

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

2025年#高考将在近日拉开帷幕，#AI 监考一度冲上热搜。当AI深度融入高考，#时间同步不再是辅助功能，而是决定AI监考系统成败的“生命线”。 AI亮相2025高考，40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕，江西、…...

编程新知 2026/2/3 2:10:25

AI+无人机如何守护濒危物种？YOLOv8实现95%精准识别

【导读】野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而，传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案，能够实现大范围覆盖并远程采集数据。尽管具备这些优势&#xf…...

编程新知 2026/1/26 12:50:00

十九、【用户管理与权限 - 篇一】后端基础：用户列表与角色模型的初步构建

【用户管理与权限 - 篇一】后端基础：用户列表与角色模型的初步构建前言准备工作第一部分：回顾 Django 内置的 `User` 模型第二部分：设计并创建 `Role` 和 `UserProfile` 模型第三部分：创建 Serializers第四部分：创建 ViewSets第五部分：注册 API 路由第六部分：后端初步测…...

编程新知 2026/1/9 3:08:54

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究

摘要：在消费市场竞争日益激烈的当下，传统体验营销方式存在诸多局限。本文聚焦开源AI智能名片链动2 1模式S2B2C商城小程序，探讨其在沉浸式体验营销中的应用。通过对比传统品鉴、工厂参观等初级体验方式，分析沉浸式体验的优势与价值…...

编程新知 2026/2/2 21:52:42

深度解析：etcd 在 Milvus 向量数据库中的关键作用

目录 🚀 深度解析：etcd 在 Milvus 向量数据库中的关键作用 💡 什么是 etcd？ 🧠 Milvus 架构简介 📦 etcd 在 Milvus 中的核心作用 🔧 实际工作流程示意 ⚠️ 如果 etcd 出现问题会怎样&am…...

编程新知 2025/10/31 3:16:51

0基础学习PyTorch——GPU上训练和推理

大纲

创建设备

训练

推理

总结

相关文章：

0基础学习PyTorch——GPU上训练和推理

这款免费工具让你的电脑焕然一新,专业人士都在用

Java高级Day52-BasicDAO

【OceanBase 诊断调优】—— SQL 诊断宝典

微服务Redis解析部署使用全流程

C++之STL—常用排序算法

【驱动】地平线X3派：备份与恢复SD卡镜像

【C++报错已解决】std::ios_base::failure

matlab入门学习（四）多项式、符号函数、数据统计

leetcode621. 任务调度器

Spark 的 Skew Join 详解

讯飞星火编排创建智能体学习（一）最简单的智能体构建

mac-m1安装nvm，docker，miniconda

STM32F407之Flash

优化 Go 语言数据打包：性能基准测试与分析

【SQL】未订购的客户

Qt(9.28)

javascript-冒泡排序

第九届蓝桥杯嵌入式省赛程序设计题解析（基于HAL库）

MATLAB云计算集成：在云端扩展计算能力

后进先出（LIFO）详解

css实现圆环展示百分比，根据值动态展示所占比例

Python爬虫（二）：爬虫完整流程

如何为服务器生成TLS证书

Linux云原生安全：零信任架构与机密计算

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

AI+无人机如何守护濒危物种？YOLOv8实现95%精准识别

十九、【用户管理与权限 - 篇一】后端基础：用户列表与角色模型的初步构建

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究

深度解析：etcd 在 Milvus 向量数据库中的关键作用