当前位置：首页 > news >正文

【构建卷积神经网络】

news 2026/2/8 13:11:54

构建卷积神经网络

卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致

全连接层：batch784，各个像素点之间都是没有联系的。
卷积层：batch12828，各个像素点之间是有联系的。

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets,transforms 
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

首先读取数据

分别构建训练集和测试集（验证集）
DataLoader来迭代取数据

# 定义超参数 
input_size = 28  #图像的总尺寸28*28
num_classes = 10  #标签的种类数
num_epochs = 3  #训练的总循环周期
batch_size = 64  #一个撮（批次）的大小，64张图片# 训练集
train_dataset = datasets.MNIST(root='./data',  train=True,   transform=transforms.ToTensor(),  download=True) # 测试集
test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor())# 构建batch数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=True)

卷积网络模块构建

一般卷积层，relu层，池化层可以写成一个套餐
注意卷积最后结果还是一个特征图，需要把图转换成向量才能做分类或者回归任务

图像是二维卷积 conv2
视频是三维卷积 conv3
单向量是一维卷积 conv1
官网有关conv2d的输出宽度和长度的计算公式
在这里插入图片描述

class CNN(nn.Module):def __init__(self):super(CNN, self).__init__()self.conv1 = nn.Sequential(         # 输入大小 (1, 28, 28)nn.Conv2d(in_channels=1,              # 1：灰度图；3：RGBout_channels=16,            # 要得到几多少个特征图,即是卷积核的个数 kernel_size=5,              # 卷积核大小stride=1,                   # 步长padding=2,                  # 如果希望卷积后大小跟原来一样，需要设置padding=(kernel_size-1)/2 if stride=1),                              # 输出的特征图为 (16, 28, 28)nn.ReLU(),                      # relu层nn.MaxPool2d(kernel_size=2),    # 进行池化操作（2x2 区域）, 输出结果为： (16, 14, 14))self.conv2 = nn.Sequential(         # 下一个套餐的输入 (16, 14, 14)nn.Conv2d(16, 32, 5, 1, 2),     # 输出 (32, 14, 14)nn.ReLU(),                      # relu层nn.Conv2d(32, 32, 5, 1, 2),nn.ReLU(),nn.MaxPool2d(2),                # 输出 (32, 7, 7))self.conv3 = nn.Sequential(         # 下一个套餐的输入 (32, 7, 7)nn.Conv2d(32, 64, 5, 1, 2),     # 输出 (64, 7, 7)nn.ReLU(),             # 输出 (64, 7, 7))self.out = nn.Linear(64 * 7 * 7, 10)   # 全连接层得到的结果def forward(self, x):x = self.conv1(x)x = self.conv2(x)x = self.conv3(x)x = x.view(x.size(0), -1)           # flatten操作，结果为：(batch_size, 64 * 7 * 7)output = self.out(x)return output

准确率作为评估标准

def accuracy(predictions, labels):pred = torch.max(predictions.data, 1)[1] rights = pred.eq(labels.data.view_as(pred)).sum() return rights, len(labels)

训练网络模型

# 实例化
net = CNN() 
#损失函数
criterion = nn.CrossEntropyLoss() 
#优化器
optimizer = optim.Adam(net.parameters(), lr=0.001) #定义优化器，普通的随机梯度下降算法#开始训练循环
for epoch in range(num_epochs):#当前epoch的结果保存下来train_rights = [] for batch_idx, (data, target) in enumerate(train_loader):  #针对容器中的每一个批进行循环net.train()                             output = net(data) loss = criterion(output, target) optimizer.zero_grad() loss.backward() optimizer.step() right = accuracy(output, target) train_rights.append(right) if batch_idx % 100 == 0: net.eval() val_rights = [] for (data, target) in test_loader:output = net(data) right = accuracy(output, target) val_rights.append(right)#准确率计算train_r = (sum([tup[0] for tup in train_rights]), sum([tup[1] for tup in train_rights]))val_r = (sum([tup[0] for tup in val_rights]), sum([tup[1] for tup in val_rights]))print('当前epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}\t训练集准确率: {:.2f}%\t测试集正确率: {:.2f}%'.format(epoch, batch_idx * batch_size, len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.data, 100. * train_r[0].numpy() / train_r[1], 100. * val_r[0].numpy() / val_r[1]))

在这里插入图片描述

练习

再加入一层卷积，效果怎么样？
当前任务中为什么全连接层是3277 其中每一个数字代表什么含义

【构建卷积神经网络】

构建卷积神经网络卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致全连接层：batch784，各个像素点之间都是没有联系的。卷积层：batch12828，各个像素点之间是有联系的。 impor…...

编程日记 2023/8/9 6:26:31

SSH 认证原理

SSH协议登录服务器： $ ssh userhost 主要有两种登录方式：第一种为密码口令登录，第二种为公钥登录密码口令登录通过密码进行登录，主要流程为： 1、客户端连接上服务器之后，服务器把自己的公钥传给客户端…...

编程日记 2023/8/9 6:25:31

基于DETR (DEtection TRansformer)开发构建MSTAR雷达影像目标检测系统

关于DETR相关的实践在之前的文章中很详细地介绍过，感兴趣的话可以自行移步阅读即可： 《DETR (DEtection TRansformer)基于自建数据集开发构建目标检测模型超详细教程》《书接上文——DETR评估可视化》基于MSTAR雷达影像数据开发构建目标检测系统&am…...

编程日记 2023/8/9 6:24:28

Java分布式微服务1——注册中心（Eureka/Nacos）

文章目录基础知识注册中心Eureka注册中心与Ribbon负载均衡1、Eureka注册中心2、Eureka的搭建3、Eureka服务注册4、复制服务实例5、拉取服务6、Ribbon负载均衡的流程及Eureka规则调整：7、Ribbon负载均衡饥饿加载 Nacos注册中心1、服务端Nacos安装与启动2、客户端Nac…...

编程日记 2023/8/9 6:23:26

(文章复现)建筑集成光储系统规划运行综合优化方法matlab代码

参考文献： [1]陈柯蒙,肖曦,田培根等.一种建筑集成光储系统规划运行综合优化方法[J].中国电机工程学报,2023,43(13):5001-5012. 1.基本原理本文建立的双层耦合模型内、外层分别对应求解容量配置与能量调度问题。外层模型设置光伏与储能容量备选集并将容量配置组合…...

编程日记 2023/8/9 6:22:25

【Redis】——RDB快照

Redis 是内存数据库，但是它为数据的持久化提供了两个技术，一个是AOF日志，另一个是RDB快照： AOF 文件的内容是操作命令；RDB 文件的内容是二进制数据。 RDB 快照就是记录某一个瞬间的内存数据，记录的是实际…...

编程日记 2023/8/9 6:21:24

微服务监控技术skywalking的部署与使用（亲测无坑）

微服务监控技术skywalking的部署与使用 1. 前期准备2. skywalking安装部署2.1 Java Agent2.2 apache/skywalking-oap-server2.3 apache/skywalking-ui 3. 项目启动4.效果展示 1. 前期准备注：本篇文章采用docker部署，采用8.2.0版本，版本一定…...

编程日记 2023/8/9 6:20:22

DLA 神经网络的极限训练方法：gradient checkpointing

gradient checkpointing 一般来说，训练的过程需要保存中间结果（不管是GPU还是CPU）。前向传播根据输入(bottom_data)计算输出(top_data)，后向传播由top_diff计算bottom_diff（如果某个变量打开梯度进行训练的话&#xff…...

编程日记 2023/8/9 6:19:21

python excel 操作

excel文件内容如下： 一、xlrd 读Excel 操作 1、打开Excel文件读取数据 filexlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个 r 2、常用函数 （1）获取一个sheet工作表 table file.sheets(…...

编程日记 2023/8/9 6:18:20

记一次Linux启动Mysql异常解决

文章目录第一步： netstat -ntlp 查看端口情况2、启动Mysql3、查看MySQL日志 tail -100f /var/log/mysqld.log4、查看磁盘占用情况：df -h5、思路小结第一步： netstat -ntlp 查看端口情况并没有发现3306数据库端口 2、启动Mysql service …...

编程日记 2023/8/9 6:17:19

ATFX汇市：美联储年内或仍将加息依次，美指向下空间不大

环球汇市行情摘要—— 昨日，美元指数上涨0.08%，收盘在102.08点， 欧元贬值0.07%，收盘价1.1003点； 日元贬值0.51%，收盘价142.47点； 英镑升值0.28%，收盘价1.2784点； 瑞…...

编程日记 2023/8/9 6:16:18

【博客687】k8s informer的list-watch机制剖析

k8s informer的list-watch机制剖析 1、list-watch场景： client-go中的reflector模块首先会list apiserver获取某个资源的全量信息，然后根据list到的rv来watch资源的增量信息。希望使用client-go编写的控制器组件在与apiserver发生连接异常时&#xff0c…...

编程日记 2023/8/9 6:15:17

用Python获取链家二手房房源数据，做可视化图分析数据

前言数据采集的步骤是固定: 发送请求, 模拟浏览器对于url地址发送请求获取数据, 获取网页数据内容 --> 请求那个链接地址, 返回服务器响应数据解析数据, 提取我们需要的数据内容保存数据, 保存本地文件所需模块 win R 输入cmd 输入安装命令 pip install 模块名 (如果你…...

编程日记 2023/8/9 6:14:16

Yield Guild Games：社区更新 — 2023 年第二季度

本文重点介绍了 Yield Guild Games (YGG) 2023 年第二季度社区更新中涵盖的关键主题，包括公会发展计划 (GAP) 第 3 季的总结、YGG 领导团队的新成员以及 YGG 的最新消息地区公会网络和广泛的游戏合作伙伴生态系统。在 YGG 品牌焕然一新的基础上，第二季…...

编程日记 2023/8/9 6:13:15

Stable Diffusion - 运动服 (Gymwear Leggings) 风格服装与背景的 LoRA 配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132179050 测试模型：DreamShaper 8 运动裤 (Gymwear Leggings) 是紧身的裤子，通常用于健身、瑜伽、跑步等运动。运动裤的…...

编程日记 2023/8/9 6:12:13

js-7：javascript原型、原型链及其特点

1、原型 JavaScript常被描述为一种基于原型的语言-每个对象拥有一个原型对象。当试图访问一个对象的属性时，它不仅仅在该对象上搜寻，还会搜寻该对象的原型，以及该对象的原型的原型，依次层层向上搜索，直到找到一个名字…...

编程日记 2023/8/9 6:11:12

可以在 while 和 foreach 循环中使用continue语句。 continue - 语法带有 while 循环的 continue 语句的语法如下- while(condition) {statement(s); } continue {statement(s); } 具有 foreach 循环的 continue 语句的语法如下- foreach $a (listA) {statement(s); } co…...

编程日记 2023/8/9 6:10:11

【贪心算法】leetcode刷题

贪心算法无固定套路。核心思想：先找局部最优，再扩展到全局最优。 455.分发饼干两种思路： 1、从大到小。局部最优就是大饼干喂给胃口大的，充分利用饼干尺寸喂饱一个，全局最优就是喂饱尽可能多的小孩。先遍历的胃口&a…...

编程日记 2023/8/9 6:09:10

PyMySQL库版本引起的python执行sql编码错误

前言长话短说，之前在A主机（centos7.9）上运行的py脚本拿到B主机上（centos7.9）运行报错： UnicodeEncodeError: latin-1 codec cant encode characters in position 265-266: ordinal not in range(256)两个…...

编程日记 2023/8/9 6:08:08

第二章-算法

第二章-算法数据结构和算法的关系算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。算法的特性算法有五个基本特征：输入、输出、有穷性、确定性和可行性。输入：算法具…...

编程日记 2023/8/9 6:07:07

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/8/23 5:51:08

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook，用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途，下面我将全面详细地介绍它的特性和用法。基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

编程新知 2025/6/11 15:21:26

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

【2025年】解决Burpsuite抓不到https包的问题

环境：windows11 burpsuite:2025.5 在抓取https网站时，burpsuite抓取不到https数据包，只显示： 解决该问题只需如下三个步骤： 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...

编程新知 2026/1/28 3:43:20

【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】

1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种系统属性定义文件（System Property Definition File），用于声明和管理 Bluetooth 模块相…...

编程新知 2025/11/22 12:02:51

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试，通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小，增大可提高计算复杂度duration: 测试持续时间（秒&…...

编程新知 2025/12/7 12:35:20

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者! 文章目录介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...

编程新知 2026/2/6 11:41:39

Java毕业设计：WML信息查询与后端信息发布系统开发

JAVAWML信息查询与后端信息发布系统实现一、系统概述本系统基于Java和WML(无线标记语言)技术开发，实现了移动设备上的信息查询与后端信息发布功能。系统采用B/S架构，服务器端使用Java Servlet处理请求，数据库采用MySQL存储信息&#xff0…...

编程新知 2025/10/27 13:29:11

深度剖析 DeepSeek 开源模型部署与应用：策略、权衡与未来走向

在人工智能技术呈指数级发展的当下，大模型已然成为推动各行业变革的核心驱动力。DeepSeek 开源模型以其卓越的性能和灵活的开源特性，吸引了众多企业与开发者的目光。如何高效且合理地部署与运用 DeepSeek 模型，成为释放其巨大潜力的关键所在&…...

编程新知 2025/12/27 19:12:07

[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG

TrustRAG: Enhancing Robustness and Trustworthiness in RAG [2501.00879] TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation 代码：HuichiZhou/TrustRAG: Code for "TrustRAG: Enhancing Robustness and Trustworthin…...

编程新知 2026/2/4 17:33:27

【构建卷积神经网络】

构建卷积神经网络

首先读取数据

卷积网络模块构建

准确率作为评估标准

训练网络模型

练习

相关文章：

【构建卷积神经网络】

SSH 认证原理

基于DETR (DEtection TRansformer)开发构建MSTAR雷达影像目标检测系统

Java分布式微服务1——注册中心（Eureka/Nacos）

(文章复现)建筑集成光储系统规划运行综合优化方法matlab代码

【Redis】——RDB快照

微服务监控技术skywalking的部署与使用（亲测无坑）

DLA 神经网络的极限训练方法：gradient checkpointing

python excel 操作

记一次Linux启动Mysql异常解决

ATFX汇市：美联储年内或仍将加息依次，美指向下空间不大

【博客687】k8s informer的list-watch机制剖析

用Python获取链家二手房房源数据，做可视化图分析数据

Yield Guild Games：社区更新 — 2023 年第二季度

Stable Diffusion - 运动服 (Gymwear Leggings) 风格服装与背景的 LoRA 配置

js-7：javascript原型、原型链及其特点

无涯教程-Perl - continue 语句函数

【贪心算法】leetcode刷题

PyMySQL库版本引起的python执行sql编码错误

第二章-算法

SkyWalking 10.2.0 SWCK 配置过程

React hook之useRef

React Native 开发环境搭建（全平台详解）

【2025年】解决Burpsuite抓不到https包的问题

【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】

拉力测试cuda pytorch 把 4070显卡拉满

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

Java毕业设计：WML信息查询与后端信息发布系统开发

深度剖析 DeepSeek 开源模型部署与应用：策略、权衡与未来走向

[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG