当前位置：首页 > news >正文

现代卷积网络实战系列3：PyTorch从零构建AlexNet训练MNIST数据集

news 文章来源：https://blog.csdn.net/weixin_50592077/article/details/133176449 2025/1/12 15:54:46

1、AlexNet

AlexNet提出了一下5点改进：

使用了Dropout，防止过拟合
使用Relu作为激活函数，极大提高了特征提取效果
使用MaxPooling池化进行特征降维，极大提高了特征提取效果
首次使用GPU进行训练
使用了LRN局部响应归一化（对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力）

2、AlexNet网络结构

AlexNet(
(feature): Sequential(
(0): Conv2d(1, 32, kernel_size=(5, 5), stride=(1, 1), padding=(1, 1))
(1): ReLU(inplace=True)
(2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(3): ReLU(inplace=True)
(4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(5): Conv2d(64, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(6): ReLU(inplace=True)
(7): Conv2d(96, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(8): ReLU(inplace=True)
(9): Conv2d(64, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(10): ReLU(inplace=True)
(11): MaxPool2d(kernel_size=2, stride=1, padding=0, dilation=1, ceil_mode=False)
)
(classifier): Sequential(
(0): Dropout(p=0.5, inplace=False)
(1): Linear(in_features=4608, out_features=2048, bias=True)
(2): ReLU(inplace=True)
(3): Dropout(p=0.5, inplace=False)
(4): Linear(in_features=2048, out_features=1024, bias=True)
(5): ReLU(inplace=True)
(6): Linear(in_features=1024, out_features=10, bias=True)
)
)

3、PyTorch构建AlexNet

class AlexNet(nn.Module):def __init__(self, num=10):super(AlexNet, self).__init__()self.feature = nn.Sequential(nn.Conv2d(1, 32, kernel_size=5, stride=1, padding=1),nn.ReLU(inplace=True),nn.Conv2d(32, 64, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(64, 96, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(96, 64, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(64, 32, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=1),)self.classifier = nn.Sequential(nn.Dropout(),nn.Linear(32 * 12 * 12, 2048),nn.ReLU(inplace=True),nn.Dropout(),nn.Linear(2048, 1024),nn.ReLU(inplace=True),nn.Linear(1024, num),)def forward(self, x):x = self.feature(x)x = x.view(-1, 32 * 12 * 12)x = self.classifier(x)return x

10个epoch训练过程的打印：

D:\conda\envs\pytorch\python.exe A:\0_MNIST\train.py

Reading data…
train_data: (60000, 28, 28) train_label (60000,)
test_data: (10000, 28, 28) test_label (10000,)

Initialize neural network
test loss: 2302.56
test accuracy: 10.1 %

epoch step: 1
training loss: 167.49
test loss: 46.66
test accuracy: 98.73 %

epoch step: 2
training loss: 59.43
test loss: 36.14
test accuracy: 98.95 %

epoch step: 3
training loss: 49.94
test loss: 24.93
test accuracy: 99.22 %

epoch step: 4
training loss: 38.7
test loss: 20.42
test accuracy: 99.45 %

epoch step: 5
training loss: 35.07
test loss: 26.18
test accuracy: 99.17 %

epoch step: 6
training loss: 30.65
test loss: 22.65
test accuracy: 99.34 %

epoch step: 7
training loss: 26.34
test loss: 20.5
test accuracy: 99.31 %

epoch step: 8
training loss: 26.24
test loss: 27.69
test accuracy: 99.11 %

epoch step: 9
training loss: 23.14
test loss: 22.55
test accuracy: 99.39 %

epoch step: 10
training loss: 20.22
test loss: 28.51
test accuracy: 99.24 %

Training finished

进程已结束，退出代码为 0

效果已经非常好了

现代卷积网络实战系列3：PyTorch从零构建AlexNet训练MNIST数据集

1、AlexNet AlexNet提出了一下5点改进： 使用了Dropout，防止过拟合使用Relu作为激活函数，极大提高了特征提取效果使用MaxPooling池化进行特征降维，极大提高了特征提取效果首次使用GPU进行训练使用了LRN局部响应归一化&#xff08…...

编程日记 2023/9/23 0:50:28

Django系列：Django应用（app）的创建与配置

Django系列 Django应用（app）的创建与配置作者：李俊才 （jcLee95）：https://blog.csdn.net/qq_28550263 邮箱 ：291148484163.com 本文地址：https://blog.csdn.net/qq_28550263/article…...

编程日记 2023/9/23 0:48:26

Linux查看程序和动态库依赖的动态库

一. 前言在一些时候，我们需要知道一个程序或者动态库所依赖的动态库有哪些。比如，当我们运行一个程序的时候，发现可能会报错，提示找不到某个符号，这时我们就需要知道程序依赖了什么库，从而添加对应需要的动…...

编程日记 2023/9/23 0:47:25

vue3 无法使用pnpm安装依赖或 Cannot find module preinstall.js

创建.npmrc文件在根目录 shamefully-hoisttrue auto-install-peerstrue strict-peer-dependenciesfalse删除 node_modules 和 pnpm-lock.yaml 文件重新 pnpm i 就可以啦...

编程日记 2023/9/23 0:46:24

C/C++连接数据库，包含完整代码。

C/C连接数据库本篇文章意在简洁明了的在linux环境下使用C/C连接远程数据库，并对数据库进行增删查改等操作。我所使用的环境是centos7，不要环境除环境配置外，代码是大同小异的。完整代码在最底部！！！ 1.前…...

编程日记 2023/9/23 0:43:22

AUTOSAR词典：CAN驱动Mailbox配置技术要点全解析

AUTOSAR词典：CAN驱动Mailbox配置技术要点全解析前言首先，请问大家几个小小问题，你清楚： AUTOSAR框架下的CAN驱动关键词定义吗？是不是有些总是傻傻分不清楚呢？CAN驱动Mailbox配置过程中有哪些关键配置参…...

编程日记 2023/9/23 0:40:18

C语言 coding style

头文件 The #define Guard #define的保护文件的唯一性，防止被多重包含格式 : <PROJECT>_< FILE>_H_ PROJECT : XS FILE : MV_CTR 头文件的包含顺序 C System FilesOther LibrariesUser LibraryConditional include 作用域局部变量 -变量定义时需要…...

编程日记 2023/9/23 0:39:17

Python办公自动化之PDF

Python操作PDF 1、Python操作PDF概述2、批量拆分3、批量合并4、提取内容（文字）5、提取内容（表格）6、提取图片7、PDF添加水印8、加密与解密1、Python操作PDF概述 Python操作PDF主要有两个库：PyPDF2和pdfplumber PyPDF2是一个用于处理PDF文件的Python第三方库官网文档参考：…...

编程日记 2023/9/23 0:38:17

【每日一题Day331】LC2560打家劫舍 IV | 二分查找 + 贪心

打家劫舍 IV【LC2560】沿街有一排连续的房屋。每间房屋内都藏有一定的现金。现在有一位小偷计划从这些房屋中窃取现金。由于相邻的房屋装有相互连通的防盗系统，所以小偷不会窃取相邻的房屋。小偷的窃取能力定义为他在窃取过程中能从单间房屋中窃取的最大金额…...

编程日记 2023/9/23 0:37:16

JVM 参数详解

GC有两种类型：Scavenge GC 和Full GC 1、Scavenge GC 一般情况下，当新对象生成，并且在Eden申请空间失败时，就会触发Scavenge GC，堆的Eden区域进行GC，清除非存活对象，并且把尚且存活的对象移动到…...

编程日记 2023/9/23 0:36:14

uni-app获取地理位置

在uni-app中，可以通过uni.getLocation()方法获取地理位置。具体步骤如下： 在uni-app项目中的manifest.json文件中，添加需要获取地理位置的权限： {"mp-weixin": {"appid": "...","permission…...

编程日记 2023/9/23 0:35:13

Learn Prompt-Prompt 高级技巧:思维链 Chain of Thought Prompting

Jason Wei等作者对思维链的定义是一系列的中间推理步骤（ a series of intermediate reasoning steps ）。目的是为了提高大型语言模型（LLM）进行复杂推理的能力。思维链通常是伴随着算术，常识和符号推理等复杂推理任务出…...

编程日记 2023/9/23 0:33:12

Vim编辑器使用入门

目录一、Vim 编辑器基础操作二、Vim 编辑器进阶操作三、Vim 编辑器高级操作四、Vim 编辑器文件操作五、Vim 编辑器文件管理六、Vim 编辑器进阶技巧七、Vim 编辑器增强功能 Vim的三种工作模式一、Vim 编辑器基础操作 1.移动光标 - 光标的移动控制移动光标有两…...

编程日记 2023/9/23 0:32:10

早餐与风景

来吧，我用流水账描述下这一天。时维九月，北京的早上有点冷，因为今天有个市场活动要去支撑，按照会议时间的要求，我需要在早上7点半就赶到会场，所以昨天晚上我加班到凌晨处理完了今天要给出去的材料&#xf…...

编程日记 2023/9/23 0:31:09

记录新疆出差期间的一些代码打开yaml文件python中的专有名词ctrlc 打开yaml文件 with open(/home/cyun/文档/cotton_ws/src/control/scripts/ControlParameter.yaml, r) as file:yaml_data yaml.load(file, Loaderyaml.FullLoader)后面发现像这种打开文件的最好是try一下 p…...

编程日记 2023/9/23 0:29:08

电脑桌面透明便签软件是哪个？

在现代快节奏的工作环境中，许多上班族都希望能够在电脑桌面上方便地记录工作资料、重要事项、工作流程等内容。为了解决这个问题，一款优秀的电脑桌面便签软件是必不可少的。在选择桌面便签软件时，许多用户也希望便签软件能够与电脑桌面壁纸相…...

编程日记 2023/9/23 0:28:06

Git创建干净分支，本地操作不依赖任何分支

clone远程项目: git clone gittest.git查看分支: git branch -a创建新分支: git checkout --orphan test, 返回Switched to a new branch test删除当前项目文件夹下所有文件: git rm -rf .提交变更: git commit -m "new branch for test"查看分支: git branch -a, 发…...

编程日记 2023/9/23 0:25:03

sqlmap tamper脚本编写

文章目录 tamper脚本是什么？指定tamper脚本运行sqlmap安全狗绕过tamper脚本 tamper脚本是什么？ SQLMap 是一款SQL注入神器，可以通过tamper 对注入payload 进行编码和变形，以达到绕过某些限制的目的。但是有些时候，SQLM…...

编程日记 2023/9/23 0:22:00

5.5V-65V Vin同步降压控制器，具有线路前馈SCT82630DHKR

描述： SCT82630是一款65V电压模式控制同步降压控制器，具有线路前馈。40ns受控高压侧MOSFET的最小导通时间支持高转换比，实现从48V输入到低压轨的直接降压转换，降低了系统复杂性和解决方案成本。如果需要，在低至6V的输…...

编程日记 2023/9/23 0:19:58

YOLOv5、YOLOv8改进：Decoupled Head解耦头

目录 1.Decoupled Head介绍 2.Yolov5加入Decoupled_Detect 2.1 DecoupledHead加入common.py中： 2.2 Decoupled_Detect加入yolo.py中： 2.3修改yolov5s_decoupled.yaml 1.Decoupled Head介绍 Decoupled Head是一种图像分割任务中常用的网络结构&#…...

编程日记 2023/9/23 0:18:57

Prometheus+Grafana可视化监控【Redis状态】

文章目录一、安装Docker二、安装Redis数据库(Docker容器方式)三、安装Prometheus四、安装Grafana五、Pronetheus和Grafana相关联六、安装redis_exporter七、Grafana添加Redis监控模板一、安装Docker 注意：我这里使用之前写好脚本进行安装Docker，如果已…...

编程日记 2023/9/23 0:17:56

怒刷LeetCode的第6天（Java版）

目录第一题题目来源题目内容解决方法方法一：哈希表方法二：逐个判断字符方法三：模拟减法第二题题目来源题目内容解决方法方法一：水平扫描法方法二：垂直扫描法方法三：分治法方…...

编程日记 2023/9/23 0:16:55

SSL双向认证-Nginx配置

SSL双向认证需要CA证书，开发过程可以利用自签CA证书进行调试验证。自签CA证书生成过程：SSL双向认证-自签CA证书生成 Nginx配置适用于前端项目或前后端都通过Nginx转发的时候（此时可不配置后端启用双向认证） 1.Nginx配置&#…...

编程日记 2023/9/23 0:14:54

GO学习之远程过程调用(RPC)

GO系列 1、GO学习之Hello World 2、GO学习之入门语法 3、GO学习之切片操作 4、GO学习之 Map 操作 5、GO学习之结构体操作 6、GO学习之通道(Channel) 7、GO学习之多线程(goroutine) 8、GO学习之函数(Function) 9、GO学习之接口(Interface) 10、GO学习之网络通信(Net/Htt…...

编程日记 2023/9/23 0:12:52

八大排序（四）--------直接插入排序

本专栏内容为：八大排序汇总通过本专栏的深入学习，你可以了解并掌握八大排序以及相关的排序算法。 💓博主csdn个人主页：小小unicorn ⏩专栏分类：八大排序汇总 🚚代码仓库：小小unicorn的代码仓库…...

编程日记 2023/9/23 0:11:51

MYSQL--存储引擎和日志管理

存储引擎： 一、存储引擎概念： MySQL中的数据用各种不同的技术存储在文件中，每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力，这些不同的技术以及配套的功能在MySQL中称为存储引擎。存储引擎是My…...

编程日记 2023/9/23 0:10:50

VUE之更换背景颜色

1. 确定需求在实现之前，首先需要明确需求，即用户可以通过某种方式更改页面背景颜色，所以我们需要提供一个可操作的控件来实现此功能。 2. 创建Vue组件为了实现页面背景颜色更换功能，我们可以创建一个Vue组件。下面是一个简单…...

编程日记 2023/9/23 0:09:50

大型集团借力泛微搭建语言汇率时区统一、业务协同的国际化OA系统

国际化、全球化集团，业务遍布全世界，下属公司众多，集团对管理方式和企业文化塑造有着很高的要求。不少大型集团以数字化方式助力全球统一办公，深化企业统一管理。面对大型集团全球化的管理诉求，数字化办公系统作为集…...

编程日记 2023/9/23 0:08:48

Quartz 建表语句SQL文件

SQL文件在jar里面，github下载 https://github.com/quartz-scheduler/quartz/releases/tag/v2.3.2 解压，sql文件路径：quartz-core\src\main\resources\org\quartz\impl\jdbcjobstore tables_mysql_innodb.sql # # In your Quartz propertie…...

编程日记 2023/9/23 0:07:48

nginx SseEmitter 长连接

1、问题还原： 在做openai机器人时，后台使用 SseEmitterEventSource 实现流式获取数据，前端通过 EventSourcePolyfill 函数接收后端的数据，在页面流式输出到页面，做成逐字打稿的效果。本地测试后，可以正常获…...

编程日记 2023/9/23 0:06:47

做邀请函的网站/网站推广的平台

为什么要使用构建器(Buildle模式) 静态工厂和构造方法都有共同的局限性：不能很好的扩展到大量的可选参数。模拟一个场景: 一个Person对象,它有2个必要的参数(name,age),2个可选参数(sex,address)，我们来获取它的实例。 1、静态工厂方法实现 - 重叠构造方…...

编程日记 2025/1/12 14:52:26

做网站vi系统是什么/百度网站客服

我采用得是STM32F10RC 参考得是STM32普中科技的给出得例子：https://www.bilibili.com/video/av30149282/?p45（这里给出网址） 1、基本介绍包含有两个看门狗，独立看门狗：IWDG 窗口看门狗：WWDG 用来检测由…...

编程日记 2025/1/12 13:36:32

低价做网站/佛山网站建设模板

写入文件操作加载文件模块操作 const fs require(fs/promises);实现写文件操作 let msg Hello World, 你好世界!;调用 fs.writeFile() 进行文件写入 // fs.writeFile(file, data[, options], callback) fs.writeFile(./hello.txt, msg, utf8, function(err) {// console.log…...

编程日记 2025/1/12 12:17:01

安平县哪里做网站/日本积分榜最新排名

最近发现有些读者通过将我的教程进行二次出售来获取暴利，我在此对其表示强烈的谴责朋友们, 如需转载请标明出处：www.captainbed.net 总目录（请务必点击总目录从前言看起，这样才能充分理解本篇文章） 什么是人工智能&am…...

编程日记 2025/1/12 9:52:18

大理中小企业网站建设/营销推广软文案例

CK_Label_v13一、产品参数 1. 电池供电版产品型号 CK_Label_v13 尺寸 70x34.7x13.6mm 屏幕尺寸 2.1 inch 分辨率 250*122 像素密度 130dpi 显示技术电子墨水屏显示显示颜色黑/白外观颜色黑色按键 1 指示灯 1 RGB灯灯光颜色 7种(红/绿/蓝/黄/紫/白…...

编程日记 2025/1/12 6:20:17

广东两学一做网站/论坛营销

作者：郑连虎，在数学学院取得理学学位的文科生，中国人民大学硕博连读生在读，山东大学管理学学士、理学学士个人公众号：阿虎定量笔记本期目录01网页抓取02中文分词03文档矩阵04词频共现05文本聚类06主题建模07情感分析08…...

编程日记 2025/1/12 5:46:36

1、AlexNet

2、AlexNet网络结构

3、PyTorch构建AlexNet

相关文章：