当前位置：首页 > news >正文

pytorch生成对抗网络

news 文章来源：https://blog.csdn.net/weixin_36104843/article/details/145406869 2025/4/20 3:48:57

人工智能例子汇总：AI常见的算法和例子-CSDN博客

生成对抗网络（GAN，Generative Adversarial Network）是一种深度学习模型，由两个神经网络组成：生成器（Generator）和判别器（Discriminator）。这两个网络通过对抗过程共同训练，从而使生成器能够生成越来越真实的假数据。

GAN的基本工作原理：

生成器（G）：它的任务是生成与真实数据相似的假数据。生成器通常从一个随机噪声（例如，均匀分布或高斯分布的噪声）开始，经过多层神经网络的处理，输出伪造的数据样本。
判别器（D）：它的任务是区分输入数据是来自真实数据分布，还是生成器伪造的假数据。判别器通常是一个二分类器，其输出是一个表示“真实”或“假”的概率值。

训练过程：

对抗过程：生成器和判别器相互博弈。生成器希望生成尽可能像真的数据，以骗过判别器；而判别器希望准确区分真假数据。最终，生成器会通过优化损失函数，使得生成的数据与真实数据尽可能相似，判别器的性能则被提升到一个极限，使得它不能再轻易地区分真假数据。
数学公式：
判别器的目标是最大化其输出的正确分类概率，即区分真假数据。
生成器的目标是最小化其输出的“假数据”被判定为假的概率。

常见的GAN变种：

DCGAN（Deep Convolutional GAN）：使用卷积神经网络（CNN）来增强生成器和判别器的表现。
WGAN（Wasserstein GAN）：引入了Wasserstein距离，改进了训练稳定性。
CycleGAN：能够在没有成对样本的情况下进行图像到图像的转换，例如将马变成斑马。

以下是一个简化的PyTorch GAN实现的框架，生成一个语音的梅尔频谱（假设已经处理了音频并提取了梅尔频谱特征）

import torch
import torch.nn as nn
import torch.optim as optim
import torchaudio
import matplotlib.pyplot as plt# 生成器（Generator）
class Generator(nn.Module):def __init__(self, z_dim=100):super(Generator, self).__init__()self.fc = nn.Sequential(nn.Linear(z_dim, 128),nn.ReLU(),nn.Linear(128, 256),nn.ReLU(),nn.Linear(256, 512),nn.ReLU(),nn.Linear(512, 1024),nn.ReLU(),nn.Linear(1024, 80),  # 80表示梅尔频谱的时间步（例如：80个梅尔频率）nn.Tanh()  # 生成梅尔频谱，范围在[-1, 1]之间)def forward(self, z):return self.fc(z)# 判别器（Discriminator）
class Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.fc = nn.Sequential(nn.Linear(80, 512),  # 输入为梅尔频谱的时间步nn.LeakyReLU(0.2),nn.Linear(512, 256),nn.LeakyReLU(0.2),nn.Linear(256, 1),nn.Sigmoid()  # 输出判定是“真”还是“假”)def forward(self, x):return self.fc(x)# 初始化生成器和判别器
z_dim = 100
generator = Generator(z_dim)
discriminator = Discriminator()# 优化器
lr = 0.0002
g_optimizer = optim.Adam(generator.parameters(), lr=lr, betas=(0.5, 0.999))
d_optimizer = optim.Adam(discriminator.parameters(), lr=lr, betas=(0.5, 0.999))# 损失函数
criterion = nn.BCELoss()# 加载数据（假设已经提取了梅尔频谱特征，取一个示例）
def load_example_mel_spectrogram():# 假设这是一个真实梅尔频谱的示例，实际数据应从音频文件中提取mel = torch.rand((80))  # 生成一个假的梅尔频谱数据return mel.unsqueeze(0)  # 扩展维度以适应网络# 训练GAN
num_epochs = 1000
for epoch in range(num_epochs):# 真实数据real_data = load_example_mel_spectrogram()real_labels = torch.ones(real_data.size(0), 1)  # 标签为1表示真实数据# 假数据z = torch.randn(real_data.size(0), z_dim)  # 随机噪声fake_data = generator(z)fake_labels = torch.zeros(real_data.size(0), 1)  # 标签为0表示假数据# 训练判别器discriminator.zero_grad()real_loss = criterion(discriminator(real_data), real_labels)fake_loss = criterion(discriminator(fake_data.detach()), fake_labels)d_loss = (real_loss + fake_loss) / 2d_loss.backward()d_optimizer.step()# 训练生成器generator.zero_grad()g_loss = criterion(discriminator(fake_data), real_labels)  # 生成器希望判别器判定为真实g_loss.backward()g_optimizer.step()if epoch % 100 == 0:print(f"Epoch [{epoch}/{num_epochs}], D Loss: {d_loss.item()}, G Loss: {g_loss.item()}")# 可视化生成的梅尔频谱（只显示最后一次生成的结果）if epoch == num_epochs - 1:plt.figure(figsize=(10, 4))plt.imshow(fake_data.detach().numpy(), aspect='auto', origin='lower')plt.title(f"Generated Mel Spectrogram - Epoch {epoch}")plt.colorbar()plt.show()# 测试阶段：使用训练好的生成器进行语音生成
z_test = torch.randn(1, z_dim)  # 创建一个新的随机噪声向量
generated_mel_spectrogram = generator(z_test)# 可视化生成的梅尔频谱
plt.figure(figsize=(10, 4))
plt.imshow(generated_mel_spectrogram.detach().numpy(), aspect='auto', origin='lower')
plt.title("Generated Mel Spectrogram from Test Data")
plt.colorbar()
plt.show()

解释：

测试阶段：
- 在训练完成后，我们使用一个新的随机噪声向量z_test来生成一个新的梅尔频谱。
- generated_mel_spectrogram = generator(z_test)是生成梅尔频谱的过程。
可视化：
- 使用plt.imshow()来可视化生成的梅尔频谱图，origin='lower'是确保频谱图正确显示。
- plt.colorbar()添加颜色条，以便更清晰地理解梅尔频谱的数值范围。

结果：

在训练过程中，你会看到每个epoch的损失值，并在最后一次epoch时显示生成的梅尔频谱。
在测试阶段，生成器会基于随机噪声生成一个新的梅尔频谱并进行可视化，帮助你观察最终模型生成的语音特征。

pytorch生成对抗网络

人工智能例子汇总：AI常见的算法和例子-CSDN博客生成对抗网络（GAN，Generative Adversarial Network）是一种深度学习模型，由两个神经网络组成：生成器（Generator）和判别器&#xff0…...

编程日记 2025/2/3 13:48:30

Visual Studio Code应用本地部署的deepseek

1.打开Visual Studio Code，在插件中搜索continue，安装插件。 2.添加新的大语言模型，我们选择ollama. 3.直接点connect，会链接本地下载好的deepseek模型。参看上篇文章：deepseek本地部署-CSDN博客 4.输入需求生成可用…...

编程日记 2025/2/3 13:46:28

用 HTML、CSS 和 JavaScript 实现抽奖转盘效果

顺序抽奖前言这段代码实现了一个简单的抽奖转盘效果。页面上有一个九宫格布局的抽奖区域，周围八个格子分别放置了不同的奖品名称，中间是一个 “开始抽奖” 的按钮。点击按钮后，抽奖区域的格子会快速滚动，颜色不断变化&#xf…...

编程日记 2025/2/3 13:42:20

Skewer v0.2.2安装与使用-生信工具43

01 Skewer 介绍 Skewer（来自于 SourceForge）实现了一种基于位掩码的 k-差异匹配算法，专门用于接头修剪，特别设计用于处理下一代测序（NGS）双端序列。 fastp安装及使用-fastp v0.23.4（bioinfoma…...

编程日记 2025/2/3 13:35:12

C语言：链表排序与插入的实现

好的！以下是一篇关于这段代码的博客文章：从零开始：链表排序与插入的实现在数据结构的学习中，链表是一种非常基础且重要的数据结构。今天，我们将通过一个简单的 C 语言程序，来探讨如何实现一个从小到大排序的链表，并在其中插入一个新的节点。这个过程不仅涉及链表的基…...

编程日记 2025/2/3 13:34:11

【Elasticsearch】doc_values 可以用于查询操作

确实，doc values 可以用于查询操作，尽管它们的主要用途是支持排序、聚合和脚本中的字段访问。在某些情况下，Elasticsearch 也会利用 doc values 来执行特定类型的查询。以下是关于 doc values 在查询操作中的使用及其影响的详细解释&#xff…...

编程日记 2025/2/3 13:29:04

深度学习深度解析：从基础到前沿

引言深度学习作为人工智能的一个重要分支，通过模拟人脑的神经网络结构来进行数据分析和模式识别。它在图像识别、自然语言处理、语音识别等领域取得了显著成果。本文将深入探讨深度学习的基础知识、主要模型架构以及当前的研究热点和发展趋势。基础概念与数学原理…...

编程日记 2025/2/3 13:27:00

JVM的GC详解

获取GC日志方式大抵有两种第一种就是设定JVM参数在程序启动时查看，具体的命令参数为: -XX:PrintGCDetails # 打印GC日志 -XX:PrintGCTimeStamps # 打印每一次触发GC时发生的时间第二种则是在服务器上监控:使用jstat查看,如下所示，命令格式为jstat -gc…...

编程日记 2025/2/3 13:22:53

【开源免费】基于Vue和SpringBoot的校园网上店铺系统（附论文）

本文项目编号 T 187 ，文末自助获取源码 \color{red}{T187，文末自助获取源码} T187，文末自助获取源码目录一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程四、功能截图五、文案资料5.1 选题背景5.2 国内…...

编程日记 2025/2/3 13:20:45

测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：4862 标注数量(xml文件个数)：4862 标注数量(txt文件个数)：4862 …...

编程日记 2025/2/3 13:18:43

Vue 3 30天精进之旅：Day 12 - 异步操作

在现代前端开发中，异步操作是一个非常常见的需求，例如从后端API获取数据、进行文件上传等任务。Vue 3 结合组合式API和Vuex可以方便地处理这些异步操作。今天我们将重点学习如何在Vue应用中进行异步操作，包括以下几个主题： 异步操…...

编程日记 2025/2/3 13:15:40

【网络】3.HTTP(讲解HTTP协议和写HTTP服务)

目录 1 认识URL1.1 URI的格式 2 HTTP协议2.1 请求报文2.2 响应报文 3 模拟HTTP3.1 Socket.hpp3.2 HttpServer.hpp3.2.1 start()3.2.2 ThreadRun()3.2.3 HandlerHttp（） 总结 1 认识URL 什么是URI？ URI 是 Uniform Resource Identifier的缩写&…...

编程日记 2025/2/3 13:14:38

行列式 det 行列式定义参考 d e t ( A ) ∑ i 1 , i 2 , ⋯ , i n ( − 1 ) σ ( i 1 , ⋯ , i n ) a 1 , i 1 a 2 , i 2 , ⋯ , a n , i n det(A) \sum_{i_1,i_2,\cdots,i_n } (-1)^{\sigma(i_1,\cdots,i_n)} a_{1,i_1}a_{2,i_2},\cdots, a_{n,i_n} det(A)i1,i2,⋯,in…...

编程日记 2025/2/3 13:11:32

docker部署SpringBoot项目简单流程

一、docker基础命令理解学习 1、常见命令 docker启动之前要关闭防火墙systemctl stop firewalld # 关闭防火墙systemctl disable firewalld # 禁止开机启动防火墙systemctl start docker # 启动docker服务systemctl stop docker # 停止docker服务systemctl restart docker # …...

编程日记 2025/2/3 13:10:30

Python学习——函数参数详解

Python中的函数参数传递机制允许多种灵活的参数类型，可以根据需求灵活配置参数，这使得函数具有更强大的扩展性和适应性。以下是对各类参数类型的详细说明： 1. 定义函数的不同参数类型 1.1 位置参数定义方式：def func(a, b2) 特…...

编程日记 2025/2/3 13:05:25

Chromium132 编译指南 - Android 篇（一）：编译前准备

1. 引言欢迎来到《Chromium 132 编译指南 - Android 篇》系列的第一部分。本系列指南将引导您逐步完成在 Android 平台上编译 Chromium 132 版本的全过程。Chromium 作为一款由 Google 主导开发的开源浏览器引擎，为众多现代浏览器提供了核心驱动力。而 Android 作…...

编程日记 2025/2/3 13:04:24

.Net / C# 繁体中文与简体中文互相转换, 支持地方特色词汇

版本号 Nuget 搜索 “OpenCCNET”, 注意别找错, 好多库的名字都差不多支持 “繁,简” 的互相转换, 支持多个地区常用词汇的转换, 还支持日文的新旧转换. OpenCC 在 .Net 中的实现 https://github.com/CosineG/OpenCC.NET <PackageReference Include"OpenCCNET"…...

编程日记 2025/2/3 13:01:20

Java泛型深度解析（JDK23）

第一章泛型革命 1.1 类型安全的进化史前泛型时代的类型转换隐患代码的血泪史（Java 1.4版示例）： List rawList new ArrayList(); rawList.add("Java"); rawList.add(Integer.valueOf(42)); // 编译通过// 灾难在运行时爆发…...

编程日记 2025/2/3 12:56:14

【贪心算法篇】：“贪心”之旅--算法练习题中的智慧与策略（一）

✨感谢您阅读本篇文章，文章内容是个人学习笔记的整理，如果哪里有误的话还请您指正噢✨ ✨ 个人主页：余辉zmh–CSDN博客 ✨ 文章所属专栏：贪心算法篇–CSDN博客文章目录一.贪心算法1.什么是贪心算法2.贪心算法的特点二.例题1.柠…...

编程日记 2025/2/3 12:55:10

AJAX XML

AJAX XML 引言随着互联网技术的不断发展，Web应用对用户交互性和实时性的要求越来越高。AJAX（Asynchronous JavaScript and XML）技术的出现，为Web应用开发提供了强大的支持。AJAX技术允许Web应用在不重新加载整个页面的情况下，与服务器进行异步通信。XML作为数据传输格式…...

编程日记 2025/2/3 12:44:47

踏入编程世界的第一个博客

我，一个双非一本大一新生，普通的不能再普通了，面对宏伟庞大的计算机世界仍显得举手无措，我自以为自身仍有些许骨气，不想普普通通，甚是浑浑噩噩的度过四年大学，经历了高考的打击，双非…...

编程日记 2025/2/3 12:42:45

2025年1月22日（网络编程 udp）

系统信息： ubuntu 16.04LTS Raspberry Pi Zero 2W 系统版本： 2024-10-22-raspios-bullseye-armhf Python 版本：Python 3.9.2 已安装 pip3 支持拍摄 1080p 30 (1092*1080), 720p 60 (1280*720), 60/90 (640*480) 已安装 vim 已安装 git 学习…...

编程日记 2025/2/3 12:41:44

数据结构与算法之栈: LeetCode 641. 设计循环双端队列 (Ts版)

设计循环双端队列 https://leetcode.cn/problems/design-circular-deque/description/ 描述设计实现双端队列。实现 MyCircularDeque 类: MyCircularDeque(int k) ：构造函数,双端队列最大为 k 。boolean insertFront()：将一个元素添加到双端队列头部…...

编程日记 2025/2/3 12:36:39

从零开始学 HTML：构建网页的基本框架与技巧

系列文章目录 01-从零开始学 HTML：构建网页的基本框架与技巧文章目录系列文章目录前言一、HTML 文档的基本框架1.1 <!DOCTYPE html>、<html>、<head>、<body> 标签解析1.1.1 <!DOCTYPE html> 标签1.1.2 <html> 标签1.1.3 &l…...

编程日记 2025/2/3 12:34:32

一些杂记2

1.#define 1.1定义 #define 是一个预处理指令，用于定义宏宏，是预处理阶段（在编译之前）由预处理器处理的代码片段 1.2使用 1.2.1 #define 可以定义常量 #define PI 3.14159 1.2.2 #define 可以定义宏函数 #define SQUARE(x) ((…...

编程日记 2025/2/3 12:33:30

C语言 --- 分支

C语言 --- 分支语句分支语句含义if...else语句单分支if语句语法形式双分支 if-else 语句语法形式悬空else含义问题描述多分支 if-else 语句语法形式 switch...case语句含义语法形式总结 💻作者简介：曾与你一样迷茫，现以经验助你入门 C 语…...

编程日记 2025/2/3 12:32:29

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.10 ndarray内存模型：从指针到缓存优化

2.10 ndarray内存模型：从指针到缓存优化目录 #mermaid-svg-p0zxLYqAnn59O2Xe {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-p0zxLYqAnn59O2Xe .error-icon{fill:#552222;}#mermaid-svg-p0zxLYqAnn59O…...

编程日记 2025/2/3 12:31:28

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.6 广播机制核心算法：维度扩展的数学建模

2.6 广播机制核心算法：维度扩展的数学建模目录/提纲 #mermaid-svg-IfELXmhcsdH1tW69 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-IfELXmhcsdH1tW69 .error-icon{fill:#552222;}#mermaid-svg-IfELXm…...

编程日记 2025/2/3 12:30:26

K8S极简教程(4小时快速学会)

1. K8S 概览 1.1 K8S 是什么 K8S官网文档：https://kubernetes.io/zh/docs/home/ 1.2 K8S核心特性服务发现与负载均衡：无需修改你的应用程序即可使用陌生的服务发现机制。存储编排：自动挂载所选存储系统，包括本地存储。Secret和…...

编程日记 2025/2/3 12:29:25

系统URL整合系列视频二（界面原型）

视频系统URL整合系列视频二（界面原型） 视频介绍 （全国）大型分布式系统Web资源URL整合需求界面原型讲解。当今社会各行各业对软件系统的web资源访问权限控制越来越严格，控制粒度也越来越细。安全级别提高的同时也增加…...

编程日记 2025/2/3 12:28:24

pytorch生成对抗网络

GAN的基本工作原理：

训练过程：

数学公式：

常见的GAN变种：

解释：

结果：

相关文章：

pytorch生成对抗网络

Visual Studio Code应用本地部署的deepseek

用 HTML、CSS 和 JavaScript 实现抽奖转盘效果

Skewer v0.2.2安装与使用-生信工具43

C语言：链表排序与插入的实现

【Elasticsearch】doc_values 可以用于查询操作

深度学习深度解析：从基础到前沿

JVM的GC详解

【开源免费】基于Vue和SpringBoot的校园网上店铺系统（附论文）

测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别

Vue 3 30天精进之旅：Day 12 - 异步操作

【网络】3.HTTP(讲解HTTP协议和写HTTP服务)

[paddle] 矩阵相关的指标

docker部署SpringBoot项目简单流程

Python学习——函数参数详解

Chromium132 编译指南 - Android 篇（一）：编译前准备

.Net / C# 繁体中文与简体中文互相转换, 支持地方特色词汇

Java泛型深度解析（JDK23）

【贪心算法篇】：“贪心”之旅--算法练习题中的智慧与策略（一）

AJAX XML

踏入编程世界的第一个博客

2025年1月22日（网络编程 udp）

数据结构与算法之栈: LeetCode 641. 设计循环双端队列 (Ts版)

从零开始学 HTML：构建网页的基本框架与技巧

一些杂记2

C语言 --- 分支

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.10 ndarray内存模型：从指针到缓存优化

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】2.6 广播机制核心算法：维度扩展的数学建模

K8S极简教程(4小时快速学会)

系统URL整合系列视频二（界面原型）