当前位置：首页 > news >正文

深度学习第5天：GAN生成对抗网络

news 2026/2/8 20:06:52

Image Description

☁️主页 Nowl

🔥专栏《深度学习》

📑君子坐而论道，少年起而行之

在这里插入图片描述

文章目录

一、GAN
- 1.基本思想
- 2.用途
- 3.模型架构
二、具体任务与代码
- 1.任务介绍
- 2.导入库函数
- 3.生成器与判别器
- 4.预处理
- 5.模型训练
- 6.图片生成
- 7.不同训练轮次的结果对比

一、GAN

1.基本思想

想象一下，市面上有许多仿制的画作，人们为了辨别这些伪造的画，就会提高自己的鉴别技能，然后仿制者为了躲过鉴别又会提高自己的伪造技能，这样反反复复，两个群体的技能不断得到提高，这就是GAN的基本思想

2.用途

我们知道GAN的全名是生成对抗网络，那么它就是以生成为主要任务，所以可以用在这些方面

生成虚拟数据集，当数据集数量不够时，我们可以用这种方法生成数据
图像清晰化，可以将模糊图片清晰化
文本到图像的生成，可以训练文生图模型

GAN的用途还有很多，可以在学习过程中慢慢发现

3.模型架构

GAN的主要结构包含一个生成器和一个判别器，我们先输入一堆杂乱数据（被称为噪声）给生成器，接着让判别器将生成器生成的数据与真实的数据作对比，看是否能判别出来，以此往复训练

在这里插入图片描述

二、具体任务与代码

1.任务介绍

相信很多人都对手写数字数据集不陌生了，那我们就训练一个生成手写数字的GAN，注意：本示例代码需要的运行时间较长，请在高配置设备上运行或者减少训练回合数

在这里插入图片描述

2.导入库函数

先导入必要的库函数，包括torch用来处理神经网络方面的任务，numpy用来处理数据

import torch
import torch.nn as nn
import torch.optim as optim
from torch.autograd.variable import Variable
from torchvision import transforms, datasets
import numpy as np

3.生成器与判别器

使用torch定义生成器与判别器的基本结构，这里由于任务比较简单，只用定义线性层就行，再给线性层添加相应的激活函数就行了

# 定义生成器（Generator）和判别器（Discriminator）的简单网络结构
class Generator(nn.Module):def __init__(self):super(Generator, self).__init__()self.model = nn.Sequential(nn.Linear(100, 256),nn.ReLU(),nn.Linear(256, 784),nn.Tanh())def forward(self, noise):return self.model(noise)class Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.model = nn.Sequential(nn.Linear(784, 256),nn.LeakyReLU(0.2),nn.Linear(256, 1),nn.Sigmoid())def forward(self, image):return self.model(image)

4.预处理

这一部分定义了模型参数，加载了数据集，定义了损失函数与优化器，这些是神经网络训练时的一些基本参数

# 定义一些参数
batch_size = 100
learning_rate = 0.0002
epochs = 500# 加载MNIST数据集
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))
])mnist_data = datasets.MNIST(root='./data', train=True, transform=transform, download=True)
data_loader = torch.utils.data.DataLoader(dataset=mnist_data, batch_size=batch_size, shuffle=True)# 初始化生成器、判别器和优化器
generator = Generator()
discriminator = Discriminator()
optimizer_G = optim.Adam(generator.parameters(), lr=learning_rate)
optimizer_D = optim.Adam(discriminator.parameters(), lr=learning_rate)# 损失函数
criterion = nn.BCELoss()

5.模型训练

这一部分开始训练模型，通过反向传播逐步调整模型的参数，注意模型训练的过程，观察生成器和判别器分别是怎么在训练中互相作用不断提高的

# 训练 GAN
for epoch in range(epochs):for data, _ in data_loader:data = data.view(data.size(0), -1)real_data = Variable(data)target_real = Variable(torch.ones(data.size(0), 1))target_fake = Variable(torch.zeros(data.size(0), 1))# 训练判别器optimizer_D.zero_grad()output_real = discriminator(real_data)loss_real = criterion(output_real, target_real)loss_real.backward()noise = Variable(torch.randn(data.size(0), 100))fake_data = generator(noise)output_fake = discriminator(fake_data.detach())loss_fake = criterion(output_fake, target_fake)loss_fake.backward()optimizer_D.step()# 训练生成器optimizer_G.zero_grad()output = discriminator(fake_data)loss_G = criterion(output, target_real)loss_G.backward()optimizer_G.step()print(f'Epoch [{epoch+1}/{epochs}], Loss D: {loss_real.item()+loss_fake.item()}, Loss G: {loss_G.item()}')

6.图片生成

这一部分再一次随机生成了一些噪声，并把他们传入生成器生成图片，其中包含一些格式转化过程，再通过matplotlib绘图库显示结果

# 生成一些图片
num_samples = 16
noise = Variable(torch.randn(num_samples, 100))
generated_samples = generator(noise)
generated_samples = generated_samples.view(num_samples, 1, 28, 28).detach()import matplotlib.pyplot as plt
import torchvision.utils as vutilsplt.figure(figsize=(8, 8))
plt.axis("off")
plt.title("Generated Images")
plt.imshow(np.transpose(vutils.make_grid(generated_samples, nrow=4, padding=2, normalize=True).cpu(), (1, 2, 0))
)
plt.show()

7.不同训练轮次的结果对比

在这里插入图片描述

感谢阅读，觉得有用的话就订阅下《深度学习》专栏吧，有错误也欢迎指出

深度学习第5天：GAN生成对抗网络

☁️主页 Nowl 🔥专栏《深度学习》 📑君子坐而论道，少年起而行之文章目录一、GAN1.基本思想2.用途3.模型架构二、具体任务与代码1.任务介绍2.导入库函数3.生成器与判别器4.预处理5.模型训练6.图片生成7.不同训练轮次的结果对比一…...

编程日记 2023/12/15 13:04:37

从零开始搭建企业管理系统（七）：RBAC 之用户管理

RBAC 之用户管理创建表（Entity）用户表角色表权限表用户角色表关系注解ManyToMany 角色权限表接口开发UserControllerUserServiceUserServiceImplUserRepository 问题解决update 更新问题懒加载问题JSON 循环依赖问题根据上一小结对表的设计&#xff0…...

编程日记 2023/12/15 13:03:36

phpstudy搭建WordPress教程

一、phpstudy新建配置WordPress 打开phpstudy，启动Apache（或者Nginx）和MySQL服务来到数据库部分，点击[创建数据库]，填写新建数据库的名称，用户名以及密码，完成后点击确认来到网站部分&#x…...

编程日记 2023/12/15 13:00:33

typedef的使用

在C语言中，有一个关键字叫做typedef，有些人对此感到很疑惑。不熟悉此知识的同学都会对编程失去细心，直接劝退（因为之前我就是这样）。、因为好不容易认识了C语言中所有的关键字（就是类型吧，像啥…...

编程日记 2023/12/15 12:56:30

服务器系统启动卡logo问题解决分析

系统版本：Kylin-4.0.2-server-sp4-20200808.J1-57s-xxc_01-20210112-x86_64 问题：系统启动一直卡在麒麟logo那里，进不去系统。在gurb里去掉系统启动参数quiet和splash，发现启动卡在如下界面。排查：开始怀疑是掉电导致…...

编程日记 2023/12/15 12:53:27

Linux NAPI ------------- epoll边缘触发模式

Linux处理网络数据包的一般流程分组到达内核的时间是不可预测的。所有现代的设备驱动程序都使用中断来通知内核有分组到达。网络驱动程序对特定于设备的中断设置了一个处理例程，因此每当该中断被引发时（即分组到达），内核都调用…...

编程日记 2023/12/15 12:52:25

使用poi-tl填充word模板，并转化为pdf输出

后端依赖 <dependency><groupId>com.deepoove</groupId><artifactId>poi-tl</artifactId><version>1.12.0</version> </dependency>Word版本 Word版本填充代码 // 培训详情HashMap<String, Object> textMap new Ha…...

编程日记 2023/12/15 12:51:24

计算机视觉-机器学习-人工智能顶会会议召开地址

计算机视觉-机器学习-人工智能顶会会议召开地址最近应该要整理中文资料的参考文献，很多会议文献都需要补全会议地点（新国标要求）。四处百度感觉也挺麻烦的，而且没有比较齐全的网站可以搜索。因此自己整理了一下计算机视觉-机器…...

编程日记 2023/12/15 12:47:21

GAN的原理分析与实例

为了便于理解，可以先玩一玩这个网站：GAN Lab: Play with Generative Adversarial Networks in Your Browser! GAN的本质：枯叶蝶和鸟。生成器的目标：让枯叶蝶进化，变得像枯叶，不被鸟准确识别。判别器的目标&…...

编程日记 2023/12/15 12:43:17

什么是POM设计模式？

为什么要用POM设计模式前期，我们学会了使用PythonSelenium编写Web UI自动化测试线性脚本线性脚本（以快递100网站登录举栗）： import timefrom selenium import webdriver from selenium.webdriver.common.by import Bydriver …...

编程日记 2023/12/15 12:40:15

没有数据线,在手机上查看电脑备忘录怎么操作

在工作中，电脑和手机是我最常用的工具。我经常需要在电脑上记录一些重要的工作事项，然后又需要在手机上查看这些记录，以便随时了解工作进展。但是，每次都需要通过数据线来传输数据，实在是太麻烦了。有一次&#xff0…...

编程日记 2023/12/15 12:34:10

Elasitcsearch--解决CPU使用率升高

原文网址：Elasitcsearch--解决CPU使用率升高_IT利刃出鞘的博客-CSDN博客简介本文介绍如何解决ES导致的CPU使用率升高的问题。问题描述线上环境 Elasticsearch CPU 使用率飙升常见问题如下： Elasticsearch 使用线程池来管理并发操作的 CPU 资源。…...

编程日记 2023/12/15 12:30:07

vue和jQuery有什么区别

Vue 和 jQuery 是两种不同类型的前端工具，它们有一些显著的区别： Vue 响应式数据绑定：Vue 提供了双向数据绑定和响应式更新的能力，使得数据与视图之间的关系更加直观和易于维护。组件化开发：Vue 鼓励使用组件化的方式…...

编程日记 2023/12/15 12:29:06

[Android] Binder all-in-all

前言： Binder 是一种 IPC 机制，使用共享内存实现进程间通讯，既可以传递消息，也可以传递创建在共享内存中的对象，而Binder本身就是用共享内存实现的，因此遵循Binder写法的类是可以实例化后在进程间传递的。…...

编程日记 2023/12/15 12:25:03

无人零售柜：快捷舒适购物体验

无人零售柜：快捷舒适购物体验通过无人零售柜和人工智能技术，消费者在购物过程中可以自由选择商品，根据个人需求和喜好查询商品清单。这种自主选择的购物环境能够为消费者提供更加舒适和满意的体验。此外，无人零售柜还具有节约时间…...

编程日记 2023/12/15 12:24:02

Bash script进阶笔记

数组类型 arr(1 2 3) # 最基础的方式声明数组，用小括号()，元素之间逗号分隔 arr([1]10 [2]20 [3]30) # 初始化时指定index declare -a arr(1 2 3) # 用declare -a声明数组，小括号外面可选使用单引号、双引号 declare -a arr‘(1 2 3)’…...

编程日记 2023/12/15 12:23:01

OpenCV图像处理——Python开发中OpenCV视频流的多线程处理方式

前言在做视觉类项目中，常常需要在Python环境下使用OpenCV读取本地的还是网络摄像头的视频流，之后再调入各种模型，如目标分类、目标检测，人脸识别等等。如果使用单线程处理，很多时候会出现比较严重的时延，…...

编程日记 2023/12/15 12:20:59

webGL开发智慧城市流程

开发智慧城市的WebGL应用程序涉及多个方面，包括城市模型、实时数据集成、用户界面设计等。以下是一个一般性的流程，您可以根据项目的具体需求进行调整，希望对大家有所帮助。 1.需求分析： 确定智慧城市应用程序的具体需求和功能。考…...

编程日记 2023/12/15 12:18:58

Django讲课笔记02：Django环境搭建

文章目录一、学习目标二、相关概念（一）Python（二）Django 三、环境搭建（一）安装Python1. 从官方网站下载最新版本的Python2. 运行安装程序并按照安装向导进行操作3. 勾选添加到路径复选框4. 完成安装过程5.…...

编程日记 2023/12/15 12:16:56

黑豹程序员-原生JS拖动div到任何地方-自定义布局

效果图代码html <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"> <html xmlns"http://www.w3.org/1999/xhtml"> <head> <meta http-equiv"Content-Type" content"text/html; charsetutf-8" /…...

编程日记 2023/12/15 12:15:55

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

Leetcode 3577. Count the Number of Computer Unlocking Permutations

Leetcode 3577. Count the Number of Computer Unlocking Permutations 1. 解题思路2. 代码实现题目链接：3577. Count the Number of Computer Unlocking Permutations 1. 解题思路这一题其实就是一个脑筋急转弯，要想要能够将所有的电脑解锁&#x…...

编程新知 2026/1/4 2:33:39

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

升级Dledger高可用集群一、主从架构的不足与Dledger的定位主从架构缺陷数据备份依赖Slave节点，但无自动故障转移能力，Master宕机后需人工切换，期间消息可能无法读取。Slave仅存储数据，无法主动升级为Master响应请求&#xff…...

编程新知 2025/9/2 3:37:40

蓝桥杯冶炼金属

原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V，是一个正整数，表示每 V V V 个普通金属 O O O 可以冶炼出 …...

编程新知 2026/2/4 10:54:26

LangChain知识库管理后端接口：数据库操作详解—— 构建本地知识库系统的基础《二》

这段 Python 代码是一个完整的知识库数据库操作模块，用于对本地知识库系统中的知识库进行增删改查（CRUD）操作。它基于 SQLAlchemy ORM 框架和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述该模块…...

编程新知 2025/11/26 18:23:29

动态 Web 开发技术入门篇

一、HTTP 协议核心 1.1 HTTP 基础协议全称 ：HyperText Transfer Protocol（超文本传输协议） 默认端口 ：HTTP 使用 80 端口，HTTPS 使用 443 端口。请求方法 ： GET ：用于获取资源，…...

编程新知 2025/10/3 0:42:17

腾讯云V3签名

想要接入腾讯云的Api，必然先按其文档计算出所要求的签名。之前也调用过腾讯云的接口，但总是卡在签名这一步，最后放弃选择SDK，这次终于自己代码实现。可能腾讯云翻新了接口文档，现在阅读起来，清晰了很多&…...

编程新知 2026/1/24 4:39:04

C#学习第29天：表达式树（Expression Trees）

目录什么是表达式树？ 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持： 3.性能优化 4.元数据处理 5.代码转换和重写适用场景代码复杂性…...

编程新知 2025/10/20 9:03:01

C++ 设计模式《小明的奶茶加料风波》

👨‍🎓 模式名称：装饰器模式（Decorator Pattern） 👦 小明最近上线了校园奶茶配送功能，业务火爆，大家都在加料： 有的同学要加波霸 🟤，有的要加椰果…...

编程新知 2026/1/31 8:45:21

MinIO Docker 部署：仅开放一个端口

MinIO Docker 部署：仅开放一个端口在实际的服务器部署中，出于安全和管理的考虑，我们可能只能开放一个端口。MinIO 是一个高性能的对象存储服务，支持 Docker 部署，但默认情况下它需要两个端口：一个是 API 端口（用于存储和访问数据），另一个是控制台端口（用于管理界面…...

编程新知 2025/12/23 11:08:56

文章目录

一、GAN

1.基本思想

2.用途

3.模型架构

二、具体任务与代码

1.任务介绍

2.导入库函数

3.生成器与判别器

4.预处理

5.模型训练

6.图片生成

7.不同训练轮次的结果对比

相关文章：