当前位置：首页 > news >正文

Pytorch intermediate(二) ResNet

news 文章来源：https://blog.csdn.net/qq_41828351/article/details/90740831 2025/4/27 7:39:06

实现了残差网络，残差网络结构。代码比之前复杂很多

conv3x3：将输入数据进行一次卷积，将数据转换成为，残差块需要的shape大小

ResidualBlock：残差块，也是所谓的恒等块。为什么被称为恒等块，大概可以理解为经过几层卷积过后大小形状不变，并且能和输入相加；如果形状变了，那么输入也会利用一次卷积得到和残差块输出大小相同的数据块。

可以看到在残差块中有一个判断，就是判断输入数据是否被向下采样，也就是形状是否变化，如果变化就进行上述处理。

ResNet：构建一个完整的残差网络。传入参数是一个残差块的结构，还有每一层中残差块的个数元组。重点看以下其中的层次结构。

conv3x3：将输入图片变成16通道

输入通道数：16

layer1：输入通道：16，输出通道：16，padding = 0，stride = 0

layer2：输入通道：16，输出通道：32，padding = 0， stride = 2。由于输入不等于输出通道数，增加了一层卷积层，并且带有对应的stride。

layer3：输入通道：32，输出通道：64，其余同上

pooling：均值池化

fc：全连接

update_lr：在每个epoch之后实现对learning_rate的下降

同样由于加入了batchnorm层，测试时需要使用model.eval()

网络结构：

ResNet((conv): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(layer1): Sequential((0): ResidualBlock((conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True))(1): ResidualBlock((conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)))(layer2): Sequential((0): ResidualBlock((conv1): Conv2d(16, 32, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)(bn1): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(downsample): Sequential((0): Conv2d(16, 32, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)(1): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)))(1): ResidualBlock((conv1): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn1): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)))(layer3): Sequential((0): ResidualBlock((conv1): Conv2d(32, 64, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)(bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(downsample): Sequential((0): Conv2d(32, 64, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)(1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)))(1): ResidualBlock((conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)(relu): ReLU(inplace)(conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)(bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)))(avg_pool): AvgPool2d(kernel_size=8, stride=8, padding=0)(fc): Linear(in_features=64, out_features=10, bias=True)
)

代码如下：

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms# Device configuration
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# Hyper-parameters
num_epochs = 80
learning_rate = 0.001# Image preprocessing modules
transform = transforms.Compose([transforms.Pad(4),transforms.RandomHorizontalFlip(),transforms.RandomCrop(32),transforms.ToTensor()])# CIFAR-10 dataset
train_dataset = torchvision.datasets.CIFAR10(root='../../data/',train=True, transform=transform,download=True)test_dataset = torchvision.datasets.CIFAR10(root='../../data/',train=False, transform=transforms.ToTensor())# Data loader
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,batch_size=100, shuffle=True)test_loader = torch.utils.data.DataLoader(dataset=test_dataset,batch_size=100, shuffle=False)# 3x3 convolution
def conv3x3(in_channels, out_channels, stride=1):return nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)# Residual block
class ResidualBlock(nn.Module):def __init__(self, in_channels, out_channels, stride=1, downsample=None):super(ResidualBlock, self).__init__()self.conv1 = conv3x3(in_channels, out_channels, stride)self.bn1 = nn.BatchNorm2d(out_channels)self.relu = nn.ReLU(inplace=True)self.conv2 = conv3x3(out_channels, out_channels)self.bn2 = nn.BatchNorm2d(out_channels)self.downsample = downsampledef forward(self, x):residual = xout = self.conv1(x)out = self.bn1(out)out = self.relu(out)out = self.conv2(out)out = self.bn2(out)if self.downsample:residual = self.downsample(x)out += residualout = self.relu(out)return out# ResNet
class ResNet(nn.Module):def __init__(self, block, layers, num_classes=10):super(ResNet, self).__init__()self.in_channels = 16self.conv = conv3x3(3, 16)self.bn = nn.BatchNorm2d(16)self.relu = nn.ReLU(inplace=True)self.layer1 = self.make_layer(block, 16, layers[0])self.layer2 = self.make_layer(block, 32, layers[1], 2)self.layer3 = self.make_layer(block, 64, layers[2], 2)self.avg_pool = nn.AvgPool2d(8)self.fc = nn.Linear(64, num_classes)def make_layer(self, block, out_channels, blocks, stride=1):downsample = Noneif (stride != 1) or (self.in_channels != out_channels):downsample = nn.Sequential(conv3x3(self.in_channels, out_channels, stride=stride),nn.BatchNorm2d(out_channels))layers = []layers.append(block(self.in_channels, out_channels, stride, downsample))self.in_channels = out_channelsfor i in range(1, blocks):layers.append(block(out_channels, out_channels))return nn.Sequential(*layers)def forward(self, x):out = self.conv(x)out = self.bn(out)out = self.relu(out)out = self.layer1(out)out = self.layer2(out)out = self.layer3(out)out = self.avg_pool(out)out = out.view(out.size(0), -1)out = self.fc(out)return outmodel = ResNet(ResidualBlock, [2, 2, 2]).to(device)# Loss and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)# For updating learning rate
def update_lr(optimizer, lr):    for param_group in optimizer.param_groups:param_group['lr'] = lr# Train the model
total_step = len(train_loader)
curr_lr = learning_rate
for epoch in range(num_epochs):for i, (images, labels) in enumerate(train_loader):images = images.to(device)labels = labels.to(device)# Forward passoutputs = model(images)loss = criterion(outputs, labels)# Backward and optimizeoptimizer.zero_grad()loss.backward()optimizer.step()if (i+1) % 100 == 0:print ("Epoch [{}/{}], Step [{}/{}] Loss: {:.4f}".format(epoch+1, num_epochs, i+1, total_step, loss.item()))# Decay learning rateif (epoch+1) % 20 == 0:curr_lr /= 3update_lr(optimizer, curr_lr)# Test the model
model.eval()
with torch.no_grad():correct = 0total = 0for images, labels in test_loader:images = images.to(device)labels = labels.to(device)outputs = model(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print('Accuracy of the model on the test images: {} %'.format(100 * correct / total))# Save the model checkpoint
torch.save(model.state_dict(), 'resnet.ckpt')

Pytorch intermediate(二) ResNet

实现了残差网络，残差网络结构。代码比之前复杂很多 conv3x3：将输入数据进行一次卷积，将数据转换成为，残差块需要的shape大小 ResidualBlock：残差块，也是所谓的恒等块。为什么被称为恒等块，大概…...

编程日记 2023/9/16 5:26:26

【2023集创赛】加速科技杯作品：高光响应的二硫化铼光电探测器

本文为2023年第七届全国大学生集成电路创新创业大赛（“集创赛”）加速科技杯西北赛区二等奖作品分享，参加极术社区的【有奖征集】分享你的2023集创赛作品，秀出作品风采，分享2023集创赛作品扩大影响力，更有丰…...

编程日记 2023/9/16 5:25:25

编写postcss插件，全局css文件px转vw

跟目录下创建plugins文件夹，创建postcss-px-to-viewport.ts文件文件内代码： // postcss 的插件 vite内置了postCss插件无需安装 import { Plugin } from postcss;interface Options {viewportWidth: number }const Options {viewportWidth: 375, // …...

编程日记 2023/9/16 5:24:24

精品SpringCloud的B2C模式在线学习网微服务分布式

《[含文档PPT源码等]精品基于SpringCloud实现的B2C模式在线学习网站-微服务-分布式》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程等软件开发环境及开发工具： 开发语言：Java 框架：springcloud JDK版本&#xf…...

编程日记 2023/9/16 5:23:23

解决vue项目导出当前页Table为Excel

解决vue项目中导出当前页表格为Excel表格的方案用到的技术： Vue2Element-uifile-saverxlsx 1、创建vue项目，安装element-ui 2、创建一个组件，组件内放入表格，和导出按钮 <template><div>…...

编程日记 2023/9/16 5:22:22

C++设计模式_04_Strategy 策略模式

接上篇，本篇将会介绍C设计模式中的Strategy 策略模式，和上篇模板方法Template Method一样，仍属于“组件协作”模式，它与Template Method有着异曲同工之妙。文章目录 1. 动机（ Motivation）2. 代码演示Stra…...

编程日记 2023/9/16 5:21:20

目标检测YOLO实战应用案例100讲-基于YOLOv3多模块融合的遥感目标检测（中）

目录 2.2.3 YOLO 2.3 目标检测算法分析 2.3.1 目标检测结果评价指标...

编程日记 2023/9/16 5:20:19

element 表格fixed列高度无法100%

下文提到的滚动条皆为横向滚动条错误方法（旧方法，点击查看旧博客） 一下代码虽然能解决fixed列高度无法100%问题，但是会出现fixed列下面的滚动条无法被点击的问题（被fixed列遮挡），所以该方法并不…...

编程日记 2023/9/16 5:19:18

【接口自动化测试】Eolink Apilkit 安装部署，支持 Windows、Mac、Linux 等系统

Eolink Apikit 有三种客户端，可以依据自己的情况选择。三种客户端的数据是共用的，因此可以随时切换不同的客户端。我们推荐使用新推出的 Apikit PC 客户端，PC 端拥有线上产品所有的功能，并且针对本地测试、自动化测试以及使用体…...

编程日记 2023/9/16 5:18:17

解决sass问题：npm ERR! node-sass@9.0.0 postinstall: `node scripts/build.js`

目录一、遇到问题解决办法二、再次遇到问题解决办法题外话一、遇到问题 1.运行这个项目的适合，遇到了没有sass的问题解决办法然后就用命令下载sass npm install node-sass 二、再次遇到问题 2.下载sass的时候又发现了一个这样的问题 npm ER…...

编程日记 2023/9/16 5:17:16

Python技巧---tqdm库的使用

文章目录一、tqdm基本知识二、在pytorch中使用tqdm 提示：以下是本篇文章正文内容，下面案例可供参考一、tqdm基本知识 “tqdm” 是一个 Python 库，用于在命令行界面中创建进度条。基本使用如下： from tqdm import tqdm impor…...

编程日记 2023/9/16 5:16:15

linux-线程条件变量(cond)

概述与互斥锁不同，条件变量是用来等待而不是用来上锁的。条件变量用来自动阻塞一个线程，直到某特殊情况发生为止。通常条件变量和互斥锁同时使用。条件变量使我们可以睡眠等待某种条件出现。条件变量是利用线程间共享的全局变量进行同步的一种机制&a…...

编程日记 2023/9/16 5:15:14

面试算法6：排序数组中的两个数字之和

题目输入一个递增排序的数组和一个值k，请问如何在数组中找出两个和为k的数字并返回它们的下标？假设数组中存在且只存在一对符合条件的数字，同时一个数字不能使用两次。例如，输入数组[1，2，4，6&…...

编程日记 2023/9/16 5:14:14

【智能家居-大模型】构建未来，聆思大模型智能家居交互解决方案正式发布

LISTENAI 近日，国内11家大模型陆续通过《生成式人工智能服务管理暂行办法》备案，多家大模型产品已正式开放，激发了新一轮大模型热潮。大模型在自然语言理解方面的巨大突破，实现了认知智能的技术跃迁，带来了时代的智慧…...

编程日记 2023/9/16 5:13:13

通讯网关软件002——利用CommGate X2HTTP-U实现HTTP访问OPC UA Server

本文介绍利用CommGate X2HTTP-U实现HTTP访问OPC UA Server。CommGate X2HTTP是宁波科安网信开发的网关软件，软件可以登录到网信智汇(wangxinzhihui.com)下载。【案例】如下图所示，实现上位机通过HTTP来获取OPC UA Server的数据。【解决方案】设置网关机…...

编程日记 2023/9/16 5:12:12

模拟经营类游戏是怎么开发的？

模拟经营类游戏开发是一个充满挑战但也充满乐趣的领域。下面是一些步骤和关键考虑因素，可以帮助您开始开发自己的模拟经营游戏： 明确游戏概念： 确定游戏开发的主题和类型，例如城市建设、农场经营、餐厅经营等。制定一个引人入胜…...

编程日记 2023/9/16 5:11:11

基于JAVA+SSM+微信小程序+MySql的图书捐赠管理系统设计与实现

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍： 在当今社会&#xff0…...

编程日记 2023/9/16 5:09:10

软件设计模式系列之六——单例模式

1 模式的定义单例模式（Singleton Pattern）是一种常见的创建型设计模式，其主要目的是确保一个类只有一个实例，并提供一个全局访问点来获取该实例。这意味着无论何时何地，只要需要该类的实例，都会返回同一个…...

编程日记 2023/9/16 5:07:08

verdi dump状态机的波形时直接显示状态名

前段时间看到别人用verdi看状态机的波形时，可以显示定义的状态参数，觉得很有意思，特地学习了一下通常拉出状态机信号的波形是下面这样的这种信号，我们要想知道每个数值代表的状态，还需要跟定义的parameter比对像这…...

编程日记 2023/9/16 5:06:07

代码随想录算法训练营19期第53天

1143.最长公共子序列视频讲解：动态规划子序列问题经典题目 | LeetCode：1143.最长公共子序列_哔哩哔哩_bilibili 代码随想录初步思路：动态规划。总结： dp[i][j] ：长度为[0, i - 1]的字符串A与长度为[0, j - 1]…...

编程日记 2023/9/16 5:05:06

二刷力扣--栈和队列

栈和队列栈和队列基础（Python） 栈一种先进后出，队列先进后出。 Python中可以用list实现栈，用append()模拟入栈，用pop()模拟出栈。也可以用list实现队列，但是效率较低，一般用collections.deq…...

编程日记 2023/9/16 5:04:05

第六章图十、关键路径

开始顶点（源点)： 在AOE网中仅有一个入度为0的顶点，称为开始顶点（源点)，它表示整个工程的开始; 结束顶点（汇点)： 也仅有一个出度为0的顶点，称为结束顶点（汇点)&#xf…...

编程日记 2023/9/16 5:03:04

Virtualbox固定存储硬盘转换为动态存储硬盘

现象一开始分配固定存储过大，占了太多空间，现在想换成动态存储释放空闲空间。解决关闭虚拟机进入虚拟介质管理从使用的硬盘复制出一个动态存储硬盘在设置中把硬盘替换为副本硬盘详细步骤参考： https://blog.csdn.net/qq_24033983/arti…...

编程日记 2023/9/16 5:02:03

【栈与队列面试题】有效的括号（动图演示）

leetcode20.括号匹配问题前言： 💥🎈个人主页:Dream_Chaser～ 🎈💥 ✨✨刷题专栏:http://t.csdn.cn/UlvTc ⛳⛳本篇内容:力扣上栈与队列的面试OJ题目目录 leetcode20.括号匹配问题 1.问题描…...

编程日记 2023/9/16 5:01:03

基于matlab实现的弹簧振动系统模型程序（动态模型）

完整代码： clear all; %System data m1.0; zeta0.01; omega01.0; Dt1.0; f01.0; x00.0; dotx00.0; xmaxsqrt(x0^2(dotx0/omega0)^2)min([0.5*abs(f0)*Dt/(m*omega0) f0/omega0^2]); omegadomega0*sqrt(1-zeta^2); dt00.1*pi/omega0; nstep500; a0.70; b0.…...

编程日记 2023/9/16 5:00:02

哨兵1号(Sentinel-1)SAR卫星介绍

1. 哥白尼计划说起欧空局的哨兵1号，就不得不先说一下欧空局的“哥白尼计划”。欧空局的哥白尼计划（Copernicus Programme）是欧空局与欧盟合作的一项极其重要的地球观测计划。该计划旨在提供免费开放的、可持续的地球观测数据&#xff0c…...

编程日记 2023/9/16 4:59:01

[maven] scopes 管理 profile 测试覆盖率

[maven] scopes & 管理 & profile & 测试覆盖率这里将一些其他的特性和测试覆盖率（主要是 jacoco） scopes maven 的 scope 主要就是用来限制和管理依赖的传递性，简单的说就是，每一个 scope 都有其对应的特性&…...

编程日记 2023/9/16 4:56:58

css网页打印字体设置

media print {font-family："SimHei";color: #000;border-color: #000; }常用字符编码表中文名英文名Unicode 编码黑体SimHeiSimHei微软雅黑Microsoft YaHei5FAE\8F6F\96C5\9ED1宋体SimSun\5B8B\4F53仿宋FangSong\4EFF\5B8B html5常用转义字符℃ 字符十…...

编程日记 2023/9/16 4:55:57

JAVA高级技术入门（单元测试，反射，注解，动态代理）

JAVA高级技术入门（单元测试，反射，注解，动态代理） 一、Junit单元测试二、反射1.认识反射，获取类概念：快速入门：获取Class对象的三种方式 2.1获取类的构造器2.2获取类的构造器的作用&a…...

编程日记 2023/9/16 4:54:57

uni-app 实现自定义按 A~Z 排序的通讯录(字母索引导航)

创建 convertPinyin.js 文件 convertPinyin.js 将下面的内容复制粘贴到其中 const pinyin (function() {let Pinyin function(ops) {this.initialize(ops);},options {checkPolyphone: false,charcase: "default"};Pinyin.fn Pinyin.prototype {init: functi…...

编程日记 2023/9/16 4:53:56

相关文章：