当前位置：首页 > news >正文

pytorch神经网络入门代码

news 2026/2/9 0:13:59

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms# 定义神经网络结构
class SimpleNN(nn.Module):def __init__(self, input_size, hidden_size, num_classes):super(SimpleNN, self).__init__()self.fc1 = nn.Linear(input_size, hidden_size)self.relu = nn.ReLU()self.fc2 = nn.Linear(hidden_size, num_classes)def forward(self, x):out = self.fc1(x)out = self.relu(out)out = self.fc2(out)return out# 设置超参数
input_size = 784  # MNIST数据集的输入大小是28x28=784
hidden_size = 784
num_classes = 10learning_rate = 0.01
num_epochs = 10# 加载MNIST数据集
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = torchvision.datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor())# 数据加载器
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=100, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=100, shuffle=False)# 实例化模型
model = SimpleNN(input_size, hidden_size, num_classes)# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=learning_rate)# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):for i, (images, labels) in enumerate(train_loader):# 将输入数据转换为一维向量images = images.reshape(-1, 28*28)# 前向传播outputs = model(images)loss = criterion(outputs, labels)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (i+1) % 100 == 0:print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_step, loss.item()))# 测试模型
with torch.no_grad():correct = 0total = 0for images, labels in test_loader:images = images.reshape(-1, 28*28)outputs = model(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total))# 获取模型参数
params = model.parameters()# 打印每个参数的名称和值
for name, param in model.named_parameters():print(f'Parameter name: {name}')print(f'Parameter value: {param}')

以下代码测试正确率为：99.37%

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms# 定义适合MNIST数据集的CNN模型
class MNISTCNN(nn.Module):def __init__(self):super(MNISTCNN, self).__init__()# 卷积块 1self.conv_block1 = nn.Sequential(nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, padding=1),nn.ReLU(),nn.MaxPool2d(kernel_size=2))# 卷积块 2self.conv_block2 = nn.Sequential(nn.Conv2d(in_channels=32, out_channels=64, kernel_size=3, padding=1),nn.ReLU(),nn.MaxPool2d(kernel_size=2))# 全连接层self.fc_layer = nn.Sequential(nn.Linear(64 * 7 * 7, 512),  # 假设经过前面的卷积和池化后特征图大小为7x7nn.ReLU(),nn.Dropout(p=0.5),nn.Linear(512, 10)  # MNIST有10个类别)def forward(self, x):x = self.conv_block1(x)x = self.conv_block2(x)# 将卷积层输出展平为一维向量x = x.view(x.size(0), -1)# 通过全连接层x = self.fc_layer(x)return x# 创建模型实例
model = MNISTCNN()# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 加载MNIST数据集并预处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)# 使用DataLoader加载批量数据
batch_size = 64
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=False)# 开始训练
num_epochs = 10
for epoch in range(num_epochs):for inputs, labels in train_loader:# 前向传播outputs = model(inputs)loss = criterion(outputs, labels)# 反向传播和优化optimizer.zero_grad()  # 清空梯度缓存loss.backward()  # 计算梯度optimizer.step()  # 更新参数# 每个epoch结束时打印损失print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')# 测试模型
model.eval()  # 将模型切换到评估模式（禁用Dropout和BatchNorm等）
with torch.no_grad():correct = 0total = 0for images, labels in test_loader:outputs = model(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print(f'Test Accuracy: {100 * correct / total}%')

pytorch神经网络入门代码

import torch import torch.nn as nn import torch.optim as optim import torchvision import torchvision.transforms as transforms# 定义神经网络结构 class SimpleNN(nn.Module):def __init__(self, input_size, hidden_size, num_classes):super(SimpleNN, self).__init_…...

编程日记 2024/2/18 6:14:00

代码随想录算法训练营第三十四天｜860.柠檬水找零 406.根据身高重建队列 452. 用最少数量的箭引爆气球

860.柠檬水找零链接：力扣（LeetCode）官网 - 全球极客挚爱的技术成长平台细节： 1. 首先根据题意就是只有5.的成本，然后就开始找钱，找钱也是10.和5. 2. 直接根据10 和 5 进行变量定义，然后去循环…...

编程日记 2024/2/18 6:12:59

Ditto：提升剪贴板体验的宝藏软件（复制粘贴效率翻倍、文本处理好助手）

名人说：莫道桑榆晚，为霞尚满天。——刘禹锡（刘梦得，诗豪） 创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder😊） 目录一、什么是Ditto？二、下载安装三、如…...

编程日记 2024/2/18 6:10:57

【自然语言处理-工具篇】spaCy＜2＞--模型的使用

前言之前已经介绍了spaCy的安装，接下来我们要通过下载和加载模型去开始使用spaCy。下载模型经过训练的 spaCy 管道可以作为 Python 包安装。这意味着它们是应用程序的一个组件，就像任何其他模块一样。可以使用 spaCy download的命令安装模型，也可以通过将 pip 指向路径或…...

编程日记 2024/2/18 6:08:55

Java之通过Jsch库连接Linux实现文件传输

Java之通过JSch库连接Linux实现文件传输文章目录 Java之通过JSch库连接Linux实现文件传输1. JSch2. Java通过Jsch连接Linux1. poxm.xml2. 工具类3. 调用案例 1. JSch 官网：JSch - Java Secure Channel (jcraft.com) JSch是SSH2的纯Java实现。 JSch 允许您连接到 ss…...

编程日记 2024/2/18 6:05:52

Nginx七层负载均衡之动静分离

思路: servera:负载均衡服务器 serverb:静态服务器 serverc:动态服务器 serverd:默认服务器 servera(192.168.233.132): # 安装 Nginx 服务器 yum install nginx -y#关闭防火墙和selinux systemctl stop firewalld setenforce 0# 切换到 Nginx 配置文…...

编程日记 2024/2/18 6:04:51

305_C++_定义了一个定时器池 TimerPool 类和相关的枚举类型和结构体

头文件：定义了一个定时器池 TimerPool 类和相关的枚举类型和结构体 #ifndef TIMERPOOL_H #define TIMERPOOL_H #include "rsglobal.h" #include "taskqueue.h" #incl...

编程日记 2024/2/18 6:03:49

大整数因数分解工具——yafu

一、安装 yafu--下载链接二、配置环境变量，直接从cmd打开 1.找到yafu-x64.exe 所在的文件路径 2.点击设置——系统——系统信息——高级系统设置——环境变量——点击PATH（上下都可以）——新建添加yafu-x64.exe 所在路径——点击确定 3…...

编程日记 2024/2/18 6:01:46

非关系型数据库（NOSQL）和关系型数据库（SQL）区别详解

前言： 在我们的日常开发中，关系型数据库和非关系型数据库的使用已经是一个成熟的软件产品开发过程中必不可却的存储数据的工具了。那么用了这么久的关系数据库和非关系型数据库你们都知道他们之间的区别了吗？下面我们来详细的介绍一下。关系…...

编程日记 2024/2/18 5:57:41

7.Cloud-GateWay

0.概述 https://cloud.spring.io/spring-cloud-static/spring-cloud-gateway/2.2.1.RELEASE/reference/html/ 1.入门配置 1.1 POM  <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-sta…...

编程日记 2024/2/18 5:56:40

【Linux】Framebuffer 应用

# 前置知识 LCD 操作原理在 Linux 系统中通过 Framebuffer 驱动程序来控制 LCD。 Frame 是帧的意思， buffer 是缓冲的意思，这意味着 Framebuffer 就是一块内存，里面保存着一帧图像。 Framebuffer 中保存着一帧图像的每一个像素颜色值&…...

编程日记 2024/2/18 5:54:38

markdown绘制流程图相关代码片段记录

有时候会使用typora来绘制一些流程图，进行编码之类的工作，在网络搜集了一些笔记，做个记录，方便日后进行复习，相关的记录如下： 每次作图时，代码以「graph <布局方向>」开头，如…...

编程日记 2024/2/18 5:51:35

云计算基础-计算虚拟化-CPU虚拟化

CPU指令系统在CPU的工作原理中，CPU有不同的指令集，如下图，CPU有4各指令集：Ring0-3，指令集是在服务器上运行的所有命令，最终都会在CPU上执行，但是CPU并不是说所有的命令都是一视同仁的&#xf…...

编程日记 2024/2/18 5:48:32

MySQL数据库⑪_C/C++连接MySQL_发送请求

目录 1. 下载库文件 2. 使用库 3. 链接MySQL函数 4. C/C链接示例 5. 发送SQL请求 6. 获取查询结果本篇完。 1. 下载库文件要使用C/C连接MySQL，需要使用MySQL官网提供的库。进入MySQL官网选择适合自己平台的mysql connect库，然后点击下载就行…...

编程日记 2024/2/18 5:44:28

选择排序和快速排序（1）

目录选择排序基本思想选择排序的实现图片实现代码实现快速排序基本思想快速排序的实现图片实现代码实现选择排序基本思想每一次从待排序的数据元素中选出最小（最大）的元素，存放在序列的起始位置，直到全部…...

编程日记 2024/2/18 5:42:26

得物面试：Redis用哈希槽，而不是一致性哈希，为什么？

尼恩说在前面在40岁老架构师尼恩的读者交流群(50)中，最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格，遇到很多很重要的面试题： Redis为何用哈希槽而不用一致性哈希？ 最近…...

编程日记 2024/2/18 5:40:24

matlab发送串口数据，并进行串口数据头的添加，我们来看下pwm解析后并通过串口输出的效果

uintt16位的话会在上面前面加上00，16位的话一定是两个字节，一共16位的数据如果是unint8的话就不会， 注意这里给的是13，但是现实的00 0D，这是大小端的问题，在matlanb里设置，我们就默认用这个模式…...

编程日记 2024/2/18 5:38:22

二分、快排、堆排与双指针

二分 int Binary_Search(vector<int> A,int key){int nA.size();int low0,highn-1,mid;while(low<high){mid(lowhigh)/2;if(A[mid]key)return mid;else if(A[mid]>key)highmid-1;elselowmid1; }return -1; }折半插入排序 ——找到第一个 ≥ \ge ≥tem的元素 voi…...

编程日记 2024/2/18 5:37:21

微信小程序步数返还的时间戳为什么返回的全是1970？

微信小程序步数返还的时间戳为什么返回的全是1970？ 将返回的时间乘以 1000 再 new Date() 转化就对了微信返回的是秒S单位的，我们要转化为毫秒ms单位，才能进行格式化日期。微信给我们下了个坑， 参考： https://d…...

编程日记 2024/2/18 5:36:20

Python函数——函数介绍

一、引言在Python编程中，函数是构建高效代码的关键。通过创建可重用的代码块，我们可以使程序更加清晰、易读且易于维护。在本文中，我们将深入了解Python函数的基本概念及其特性。二、Python函数的基本概念函数是一段具有特定功能的代码块…...

编程日记 2024/2/18 5:29:13

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/8 4:37:34

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2026/2/8 20:43:02

如何将联系人从 iPhone 转移到 Android

从 iPhone 换到 Android 手机时，你可能需要保留重要的数据，例如通讯录。好在，将通讯录从 iPhone 转移到 Android 手机非常简单，你可以从本文中学习 6 种可靠的方法，确保随时保持连接，不错过任何信息。第 1…...

编程新知 2026/1/31 5:09:27

VTK如何让部分单位不可见

最近遇到一个需求，需要让一个vtkDataSet中的部分单元不可见，查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行，是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示，主要是最后一个参数，透明度…...

编程新知 2025/12/12 4:55:21

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

系列回顾： 在上一篇中，我们成功地为应用集成了数据库，并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了！但是，如果你仔细审视那些 API，会发现它们还很“粗糙”：有…...

编程新知 2026/1/22 20:46:43

Spring AI 入门：Java 开发者的生成式 AI 实践之路

一、Spring AI 简介在人工智能技术快速迭代的今天，Spring AI 作为 Spring 生态系统的新生力量，正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务（如 OpenAI、Anthropic）的无缝对接&…...

编程新知 2025/12/25 18:03:56

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接：3403. 从盒子中找出字典序最大的字符串 I 代码如下： class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

编程新知 2025/10/31 5:18:02

Go语言多线程问题

打印零与奇偶数（leetcode 1116） 方法1：使用互斥锁和条件变量 package mainimport ("fmt""sync" )type ZeroEvenOdd struct {n intzeroMutex sync.MutexevenMutex sync.MutexoddMutex sync.Mutexcurrent int…...

编程新知 2025/9/23 8:19:28

高防服务器价格高原因分析

高防服务器的价格较高，主要是由于其特殊的防御机制、硬件配置、运营维护等多方面的综合成本。以下从技术、资源和服务三个维度详细解析高防服务器昂贵的原因： 一、硬件与技术投入大带宽需求 DDoS攻击通过占用大量带宽资源瘫痪目标服务器，因此…...

编程新知 2025/12/8 14:33:23

云安全与网络安全：核心区别与协同作用解析

在数字化转型的浪潮中，云安全与网络安全作为信息安全的两大支柱，常被混淆但本质不同。本文将从概念、责任分工、技术手段、威胁类型等维度深入解析两者的差异，并探讨它们的协同作用。一、核心区别定义与范围网络安全：聚焦于保…...

编程新知 2026/2/8 1:53:29

相关文章：