当前位置：首页 > news >正文

论文复现--基于LeNet网络结构的数字识别

news 2026/2/8 19:02:55

前言

一直就听说学习深度学习无非就是看论文，然后复现，不断循环，这段时间也看了好几篇论文(虽然都是简单的)，但是对于我一个人自学，复现成功，我感觉还是挺开心的

本人初学看论文的思路：聚焦网络结构与其实验的效果

LeNet虽然简单，很老了，但是毕竟经典，对于初学的的我来说，我感觉还是很有必要学习的，可以积累CNN网络结构模型
注意：minist数据集可以直接下载，不用自己找，详情请看导入数据

本来今天打算更新C从C++的变化基础的，但是由于种种原因，就先更新这篇吧

论文(知网可查询)：基于LeNet-5的手写数字识别的改进方法

网络结构(LeNet)：

卷积层：两层
池化层：两层
卷积层参数：
- 第一层：维度变化(1->6)，步伐：1，卷积核：5 * 5
- 第二层：维度变化(6->16)，步伐：1，卷积核：5 * 5
池化层：
- 两层都是：卷积核：2 * 2，步伐：2
全连接层：3层
- 16 * 5 * 5 --> 120 --> 84 --> 10
网络结构图如下(论文截图)：

结果

轮次10，有点大了，可以降低
相比第一课，发现在训练集的损失率、测试集的损失率、训练集的准确率都有提升，详情情况结果可视化

1、前期准备

1、设置GPU

import torch  # 用于张量计算和自动求导
import torch.nn as nn  # 构建神经网络和损失函数
import matplotlib.pyplot as plt # 绘图
import torchvision   # 专门处理视觉的库# 设置GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)
print(torch.__version__)
print(torchvision.__version__)

cuda
2.4.0
0.19.0

2、导入数据

# 将所有的数据图片统一格式, 论文大小为：32 * 32
from torchvision import transforms, datasets transforms = transforms.Compose([transforms.Resize([32, 32]),  # 统一图片大小transforms.ToTensor(),           # 统一规格transforms.Normalize(mean=[0.1307], std=[0.3081])  # MNIST的均值和方差
])

# download设置为True，可以自动下载图片
train_ds = torchvision.datasets.MNIST('data', train=True, transform=transforms, download=False)test_ds = torchvision.datasets.MNIST('data', train=True, transform=transforms, download=False)

batch_size = 32
train_dl = torch.utils.data.DataLoader(train_ds, batch_size=batch_size, shuffle=True)test_dl = torch.utils.data.DataLoader(test_ds, batch_size=batch_size, shuffle=True)

# 取一个批次查看数据格式
# 数据的shape为：[batch_size, channel, heigh, weight]
# batch_size是自己设定的，channel，height，weight分别是图片的通道数，高度，宽度
imgs, labels = next(iter(train_dl))
imgs.shape

结果：

torch.Size([32, 1, 32, 32])

3、数据可视化

import numpy as np# 指定图片的大小，图像的大小为20宽，5高
plt.figure(figsize=(20,5))
for i, imgs in enumerate(imgs[:20]):# 维度缩减npimg = np.squeeze(imgs.numpy())# 将整个figure分层2行10列，绘制第i+1个子图plt.subplot(2, 10, i + 1)plt.imshow(npimg, cmap=plt.cm.binary)plt.axis('off')

在这里插入图片描述

2、构建简单的CNN网络

import torch.nn.functional as Fnum_classes = 10 # 图片的类别数class Model(nn.Module):def __init__(self):super().__init__()# 特征提取网络设置self.conv1 = nn.Conv2d(1, 6, kernel_size=5) self.pool1 = nn.MaxPool2d(2)                 self.conv2 = nn.Conv2d(6, 16, kernel_size=5) self.pool2 = nn.MaxPool2d(2)                 # 分类网络设置self.fc1 = nn.Linear(16 * 5 * 5, 120)self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, num_classes)# 前向传播def forward(self, x):x = F.relu(self.conv1(x))x = self.pool1(x)x = F.relu(self.conv2(x))x = self.pool2(x)x = x.view(-1, 16 * 5 * 5)x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = self.fc3(x)return x

加载并且打印模型

from torchinfo import summary# 将模型转移到GPU中
model = Model().to(device)summary(model)

=================================================================
Layer (type:depth-idx)                   Param #
=================================================================
Model                                    --
├─Conv2d: 1-1                            156
├─MaxPool2d: 1-2                         --
├─Conv2d: 1-3                            2,416
├─MaxPool2d: 1-4                         --
├─Linear: 1-5                            48,120
├─Linear: 1-6                            10,164
├─Linear: 1-7                            850
=================================================================
Total params: 61,706
Trainable params: 61,706
Non-trainable params: 0
=================================================================

for X, y in train_dl:print(X.shape)  # 检查输入数据的形状break  # 只打印第一个批次的数据形状

torch.Size([32, 1, 32, 32])

3、模型训练

1、设置超参数

loss_fn = nn.CrossEntropyLoss()  # 创建损失函数
learn_rate = 1e-2  # 学习率
opt = torch.optim.SGD(model.parameters(), lr = learn_rate)

2、编写训练函数

def train(dataloader, model, loss_fn, optimizer):size = len(dataloader.dataset)      # 训练集大小一共60000张图片num_batchs = len(dataloader)        # 批次数目，1875  (60000/32)train_loss, train_acc = 0, 0  # 初始化训练损失和正确率for X, y in dataloader:  # 获取图片及其标签X, y = X.to(device), y.to(device)  # 计算预测误差pred = model(X)     # 网络输出loss = loss_fn(pred, y)     # 计算网络输出和真实值的差距# 反向传播optimizer.zero_grad()  # gred属性归零loss.backward()        # 反向传播optimizer.step()       # 每一步自动跟新# 记录acc和losstrain_acc += (pred.argmax(1) == y).type(torch.float).sum().item()train_loss += loss.item()train_acc /= sizetrain_loss /= num_batchsreturn train_acc, train_loss

3、编写测试函数

def test(dataloader, model, loss_fn):size = len(dataloader.dataset)  # 测试集的大小，一共10000张图片num_batches = len(dataloader)   # 批次数目，313（10000/32 = 321.5，向上取整）test_loss, test_acc = 0, 0# 当不进行训练时候，停止梯度更新，节省计算内存消耗with torch.no_grad():for imgs, target in dataloader:imgs, target = imgs.to(device), target.to(device)# 计算losstarget_pred = model(imgs)loss = loss_fn(target_pred, target)test_loss += loss.item()test_acc += (target_pred.argmax(1) == target).type(torch.float).sum().item()test_acc /= sizetest_loss /= num_batchesreturn test_acc, test_loss

4、正式训练

epochs = 10
train_loss = []
train_acc = []
test_loss = []
test_acc = []for epoch in range(epochs):model.train()epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)model.eval()epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)train_acc.append(epoch_train_acc)train_loss.append(epoch_train_loss)test_acc.append(epoch_test_acc)test_loss.append(epoch_test_loss)template = ('Eopch: {:2d}, Train_acc: {:.1f}%, Train_loss: {:.3f}, Test_acc: {:.1f}%, test_loss: {:.3f}')print(template.format(epoch+1, epoch_train_acc * 100, epoch_train_loss, epoch_test_acc, epoch_test_loss))print('Done')

Eopch:  1, Train_acc: 75.9%, Train_loss: 0.739, Test_acc: 1.0%, test_loss: 0.144
Eopch:  2, Train_acc: 96.4%, Train_loss: 0.117, Test_acc: 1.0%, test_loss: 0.079
Eopch:  3, Train_acc: 97.6%, Train_loss: 0.080, Test_acc: 1.0%, test_loss: 0.073
Eopch:  4, Train_acc: 98.0%, Train_loss: 0.063, Test_acc: 1.0%, test_loss: 0.056
Eopch:  5, Train_acc: 98.4%, Train_loss: 0.053, Test_acc: 1.0%, test_loss: 0.048
Eopch:  6, Train_acc: 98.5%, Train_loss: 0.047, Test_acc: 1.0%, test_loss: 0.041
Eopch:  7, Train_acc: 98.7%, Train_loss: 0.042, Test_acc: 1.0%, test_loss: 0.035
Eopch:  8, Train_acc: 98.8%, Train_loss: 0.037, Test_acc: 1.0%, test_loss: 0.029
Eopch:  9, Train_acc: 99.0%, Train_loss: 0.033, Test_acc: 1.0%, test_loss: 0.029
Eopch: 10, Train_acc: 99.0%, Train_loss: 0.030, Test_acc: 1.0%, test_loss: 0.023
Done

4、结果可视化

import matplotlib.pyplot as plt
import warnings
# 忽略警告
warnings.filterwarnings("ignore")               #忽略警告信息
plt.rcParams['font.sans-serif']    = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False      # 用来正常显示负号
plt.rcParams['figure.dpi']         = 100        #分辨率epochs_range = range(epochs)plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Train Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

在这里插入图片描述

论文复现--基于LeNet网络结构的数字识别

前言一直就听说学习深度学习无非就是看论文，然后复现，不断循环，这段时间也看了好几篇论文(虽然都是简单的)，但是对于我一个人自学，复现成功，我感觉还是挺开心的本人初学看论文的思路：聚焦网络…...

编程日记 2024/9/14 5:56:10

Vue3 响应式工具函数isRef()、unref()、isReactive()、isReadonly()、isProxy()

isRef() isRef()：检查某个值是否为 ref。 isRef函数接收一个参数，即要判断的值。如果该参数是由ref创建的响应式对象，则返回true；否则，返回false。 import { ref, isRef } from vue const normalValue 这是一个普通…...

编程日记 2024/9/14 5:55:09

数据结构之简单选择排序介绍与举例

简单选择排序简单选择排序是一种排序算法，其基本思想是：通过n-i次关键字间的比较，从n-i1个记录中选出关键字最小的记录，并和第i个记录交换之。举例： 给定数组 [64, 25, 12, 22, 11]，进行简单选择排序。…...

编程日记 2024/9/14 5:54:08

九、Redis 的实际使用与Redis的设计

一、多级缓存架构在线上系统中，一定不会单纯的只部署一个Redis集群，而是使用Redis结合其他的多级缓存应用进行架构。使用多级缓存架构的优点就是可以使不同类型的数据分布在不同的应用中，比如redis的热点key可以存储到nginx本地缓存、服务…...

编程日记 2024/9/14 5:53:07

乔拓云模板助力，微信小程序快速上线无需愁备案

想要快速打造并上线自己的微信小程序吗？乔拓云平台是您的不二之选！无需担心复杂的备案流程，乔拓云提供免费服务，远程协助您轻松完成微信小程序的备案工作。只需简单几步，您的小程序就能闪亮登场：首先&…...

编程日记 2024/9/14 5:51:04

Android命令行查看CPU频率和温度

在 Android 设备上，你可以通过命令行工具 adb 来查看 CPU 温度和 CPU 频率，并确定是否有降频情况。以下是具体步骤： 1. 查看 CPU 频率你可以使用以下命令来查看 CPU 各个核心的当前频率： adb shell cat /sys/devices/system/c…...

编程日记 2024/9/14 5:49:03

力扣: 翻转字符串里的单词

文章目录需求分析代码结尾需求给你一个字符串 s ，请你反转字符串中单词的顺序。单词是由非空格字符组成的字符串。s 中使用至少一个空格将字符串中的单词分隔开。返回单词顺序颠倒且单词之间用单个空格连接的结果字符串。注意：输入字符…...

编程日记 2024/9/14 5:48:02

Wophp靶场寻找漏洞练习

1.命令执行漏洞打开网站划到最下，此处的输入框存在任意命令执行漏洞输入命令whoami 2.SQL注入搜索框存在SQL注入，类型为整数型最终结果可以找到管理员账户和密码 3.任意文件上传漏洞在进入管理员后台后，上传木马文件访问该文件&…...

编程日记 2024/9/14 5:47:00

国内智能运维厂商月度动态 202408

作为市场人员，虽然也添加了各类行业媒体、同行厂商的关注，但被同事问起业内动向时，常常也是记忆模糊、拍破脑袋也说不完整一件事。所以找机会翻看了一下各大厂商的公号，先做个简单的8月汇总。格式暂时是这样的： 整…...

编程日记 2024/9/14 5:44:57

C++ 左值与右值浅谈

左值与右值序言概念左值和右值的划分理解右值引用常量左值引用与右值引用移动语义引用折叠完美转发参考资料序言虽然平常都算是了解左值，右值的用法，但是好记性不如烂笔头，记下来供大家评鉴，有错改错，有善赞善&a…...

编程日记 2024/9/14 5:43:56

oracle 如何查死锁

在Oracle中查看死锁通常涉及查询数据字典视图和动态性能视图。以下是一个基本的查询示例，用于检测和显示最近的死锁： SELECT dd.inst_id, dd.name, o.object_id, o.object_type, s.sid, s.serial#, s.username, p.spid, s.program,d.xidusn,d.xidslot,d…...

编程日记 2024/9/14 5:42:55

如何编写ChatGPT提示词

为ChatGPT编写有效的提示需要实施几个关键策略，以使文本到文本生成 AI 工具产生所需的输出。您可以使用 ChatGPT 提示（也称为 ChatGPT 命令）来增强您的工作或提高您在各个行业的表现。例如，营销人员可以提示 ChatGPT 为社交媒体帖…...

编程日记 2024/9/14 5:41:54

java项目之基于Spring Boot智能无人仓库管理源码（springboot+vue）

项目简介智能无人仓库管理实现了以下功能： 基于Spring Boot智能无人仓库管理的主要使用者分为： 管理员的功能有：员工信息的查询管理，可以删除员工信息、修改员工信息、新增员工信息 💕💕作者&#xff1a…...

编程日记 2024/9/14 5:40:53

大厂前端常见的笔试题目

https://zhuanlan.zhihu.com/p/488383397前端面试手写题目总结-CSDN博客大厂前端面试中常见的手写代码题目涵盖了多个方面，包括但不限于算法、数据结构、JavaScript 基础知识、DOM 操作、异步编程等。以下是一些常见的手写代码题目及其简要说明： 1. 排…...

编程日记 2024/9/14 5:38:52

网络插件 Cilium 更换 Calico

网络插件 Cilium 更换 Calico 集群使用 submariner ，通过网络检测发现 Cilium 插件可能兼容性不太好 subctl diagnose allCilium 彻底卸载 helm uninstall cilium -n kube-system# 检查集群中的所有 CNI 插件（集群的每个节点都需要删除） s…...

编程日记 2024/9/14 5:37:50

SpringSecurity原理解析（二）：认证流程

1、SpringSecurity认证流程包含哪几个子流程？ 1）账号验证 2）密码验证 3）记住我—>Cookie记录 4）登录成功—>页面跳转 2、UsernamePasswordAuthenticationFilter 在SpringSecurity中处理认证逻辑是在UsernamePas…...

编程日记 2024/9/14 5:36:49

数据中台 | 数据资源管理平台介绍

01 产品概述数据资源的盘查、集成、存储、组织、共享等全方位管理能力，无论对于企业的数字化转型，还是对企业数据资产的开发、运营、交易及入表，都具有极为关键的作用。今天，小兵就来为大家介绍我们自研数据智能平台中的核心产品…...

编程日记 2024/9/14 5:33:46

智慧环保平台建设方案

智慧环保平台建设方案摘要政策导向与建设背景背景：全国生态环境保护大会提出坚决打好污染防治攻坚战，推动生态文明建设，目标是在2035年实现生态环境质量根本好转。构建生态文明体系，包括生态文化、生态经济、目标责任、生态文明…...

编程日记 2024/9/14 5:32:45

SpringMVC映射请求；SpringMVC返回值类型；SpringMVC参数绑定；

一，SpringMVC映射请求 SpringMVC 使用 RequestMapping 注解为控制器指定可以处理哪些URL请求 1.1RequestMapping修饰类注解RequestMapping修饰类，提供初步的请求映射信息，相对于WEB应用的跟目录。注： 如果在类名前&#xff0…...

编程日记 2024/9/14 5:30:43

【第28章】Spring Cloud之Sentinel注解支持

文章目录前言一、注解埋点支持二、SentinelResource 注解三、实战1. 准备2. 纯资源定义3. 添加资源配置四、熔断(fallback)1. 业务代码1.1 Controller1.2 Service1.3 ServiceImpl 2. 熔断配置3. 熔断测试总结前言上一章我们已经完成了对Sentinel的适配工作，这…...

编程日记 2024/9/14 5:27:39

JavaSec-RCE

简介 RCE(Remote Code Execution)，可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景：Groovy代码注入 Groovy是一种基于JVM的动态语言，语法简洁，支持闭包、动态类型和Java互操作性&#xff0c…...

编程新知 2026/2/8 6:37:39

【网络】每天掌握一个Linux命令 - iftop

在Linux系统中，iftop是网络管理的得力助手，能实时监控网络流量、连接情况等，帮助排查网络异常。接下来从多方面详细介绍它。目录【网络】每天掌握一个Linux命令 - iftop工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景…...

编程新知 2025/10/10 17:03:53

【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15

缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下： struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...

编程新知 2025/11/27 21:52:13

docker详细操作--未完待续

docker介绍 docker官网: Docker：加速容器应用程序开发 harbor官网：Harbor - Harbor 中文使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像是什么 Docker 是一种开源的容器化平台，用于将应用程序及其依赖项（如库、运行时环…...

编程新知 2026/2/5 4:33:24

Unity3D中Gfx.WaitForPresent优化方案

前言在Unity中，Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染（即CPU被阻塞），这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案： 对惹，这里有一个游戏开发交流小组&…...

编程新知 2026/2/7 17:31:44

1688商品列表API与其他数据源的对接思路

将1688商品列表API与其他数据源对接时，需结合业务场景设计数据流转链路，重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点： 一、核心对接场景与目标商品数据同步场景：将1688商品信息…...

编程新知 2025/11/30 16:55:32

2023赣州旅游投资集团

单选题 1.“不登高山，不知天之高也；不临深溪，不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的参考答案: C 本题解…...

编程新知 2025/11/8 16:42:13

R 语言科研绘图第 55 期 --- 网络图-聚类

在发表科研论文的过程中，科研绘图是必不可少的，一张好看的图形会是文章很大的加分项。为了便于使用，本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中，获取方式： R 语言科研绘图模板 --- sciRplothttps://mp.…...

编程新知 2026/1/30 2:34:31

【FTP】ftp文件传输会丢包吗？批量几百个文件传输，有一些文件没有传输完整，如何解决？

FTP（File Transfer Protocol）本身是一个基于 TCP 的协议，理论上不会丢包。但 FTP 文件传输过程中仍可能出现文件不完整、丢失或损坏的情况，主要原因包括： ✅ 一、FTP传输可能“丢包”或文件不完整的原因原因描述网络…...

编程新知 2025/8/17 3:31:21

yaml读取写入常见错误 (‘cannot represent an object‘, 117)

错误一：yaml.representer.RepresenterError: (‘cannot represent an object’, 117) 出现这个问题一直没找到原因，后面把yaml.safe_dump直接替换成yaml.dump，确实能保存，但出现乱码： 放弃yaml.dump，又切…...

编程新知 2026/2/4 11:44:10