当前位置：首页 > news >正文

机器学习算法模型系列——Adam算法

news 2025/7/3 15:08:30

Adam是一种自适应学习率的优化算法，结合了动量和自适应学习率的特性。

主要思想是根据参数的梯度来动态调整每个参数的学习率。

核心原理包括：

动量（Momentum）：Adam算法引入了动量项，以平滑梯度更新的方向。这有助于加速收敛并减少震荡。
自适应学习率：Adam算法计算每个参数的自适应学习率，允许不同参数具有不同的学习速度。
偏差修正（Bias Correction）：Adam算法在初期迭代中可能受到偏差的影响，因此它使用偏差修正来纠正这个问题。

Adam相关公式

初始化：

参数： $eq?%5Cbeta$
学习率： $eq?%5Calpha$
梯度估计的移动平均（一阶矩）： $eq?m%3D0$
梯度平方的移动平均（二阶矩）： $eq?v%3D0$
时间步数： $eq?t%3D0$

每个迭代步骤：

$eq?t%3Dt+1$
计算梯度： $eq?g_%7Bt%7D%20%3D%5Cbigtriangledown%20f%20_%7Bt%7D%28%5Ctheta%20_%7Bt%7D%29$
更新一阶矩： $eq?m_%7Bt%7D%20%3D%5Cbeta_%7B1%7D%5Ccdot%20m_%7Bt-1%7D+%281-%5Cbeta_%7B1%7D%29%5Ccdot%20g_%7Bt%7D$
更新二阶矩： $eq?v_%7Bt%7D%20%3D%5Cbeta_%7B2%7D%5Ccdot%20v_%7Bt-1%7D+%281-%5Cbeta_%7B2%7D%29%5Ccdot%20g_%7Bt%7D%5E%7B2%7D$
修正偏差（Bias Correction）： $eq?%5Chat%7Bm%7D_%7Bt%7D%20%3D%5Cfrac%7Bm_%7Bt%7D%7D%7B%281-%5Cbeta_%7B1%7D%5E%7Bt%7D%29%7D$ 和 $eq?%5Chat%7Bv%7D_%7Bt%7D%20%3D%5Cfrac%7Bv%7Bt%7D%7D%7B%281-%5Cbeta_%7B2%7D%5E%7Bt%7D%29%7D$
更新参数： $eq?%7B%5Ctheta%7D_%7Bt+1%7D%20%3D%7B%5Ctheta%7D_%7Bt%7D%20-%5Calpha%20%5Ccdot%20%5Cfrac%7B%5Chat%7Bm%7D%7Bt%7D%7D%7B%28%5Csqrt%7Bv_%7Bt%7D%7D-%5Cvarepsilon%20%29%7D$ ，其中 $eq?%5Cvarepsilon$ 是一个小的常数，以防分母为零。

项目：基于Adam优化算法的神经网络训练

在这个项目中，我们将使用Adam优化算法来训练一个简单的神经网络，以解决二分类问题。我们将深入讨论Adam算法的原理和公式，并展示如何在Python中实施它。最后，我们将绘制学习曲线，以可视化模型的训练进展。

项目：基于Adam优化算法的神经网络训练

模型训练

使用Python代码实现Adam算法来训练一个二分类的神经网络。

使用Python中的NumPy库来进行计算，并使用一个合成的数据集来演示。

import numpy as np
import matplotlib.pyplot as plt# 定义模型和数据
np.random.seed(42)
X = np.random.rand(100, 2)  # 特征数据
y = (X[:, 0] + X[:, 1] > 1).astype(int)  # 二分类标签# 定义神经网络模型
def sigmoid(x):return 1 / (1 + np.exp(-x))def predict(X, weights):return sigmoid(np.dot(X, weights))# 初始化参数和超参数
theta = np.random.rand(2)  # 参数初始化
alpha = 0.1  # 学习率
beta1 = 0.9  # 一阶矩衰减因子
beta2 = 0.999  # 二阶矩衰减因子
epsilon = 1e-8  # 用于防止分母为零# 初始化Adam算法所需的中间变量
m = np.zeros(2)
v = np.zeros(2)
t = 0# 训练模型
num_epochs = 100
for epoch in range(num_epochs):for i in range(len(X)):t += 1gradient = (predict(X[i], theta) - y[i]) * X[i]m = beta1 * m + (1 - beta1) * gradientv = beta2 * v + (1 - beta2) * gradient**2m_hat = m / (1 - beta1**t)v_hat = v / (1 - beta2**t)theta -= alpha * m_hat / (np.sqrt(v_hat) + epsilon)# 输出训练后的参数
print("训练完成后的参数：", theta)# 定义损失函数
def loss(X, y, weights):y_pred = predict(X, weights)return -np.mean(y * np.log(y_pred) + (1 - y) * np.log(1 - y_pred))# 记录损失值
loss_history = []
for i in range(len(X)):loss_history.append(loss(X[i], y[i], theta))# 绘制损失函数曲线
plt.plot(range(len(X)), loss_history)
plt.xlabel("Iteration")
plt.ylabel("Loss Function Value")
plt.title("Change in Loss Function Over Time")
plt.show()

这个图形将显示损失函数值随着迭代次数的减小而减小，这表明Adam优化算法成功地训练了模型。

机器学习算法模型系列——Adam算法

Adam是一种自适应学习率的优化算法，结合了动量和自适应学习率的特性。主要思想是根据参数的梯度来动态调整每个参数的学习率。核心原理包括： 动量（Momentum）：Adam算法引入了动量项，以平滑梯度更新的方向…...

编程日记 2024/11/21 16:08:55

按钮基类 QAbstractButton 标题与图标 // 参数text的内容显示到按钮上 void QAbstractButton::setText(const QString &text); // 得到按钮上显示的文本内容, 函数的返回就是 QString QAbstractButton::text() const;// 得到按钮设置的图标 QIcon icon() const; // 给按钮…...

编程日记 2024/11/21 16:04:49

基于xr-frame实现微信小程序的手部、手势识别3D模型叠加和石头剪刀布游戏功能

前言 xr-frame是一套小程序官方提供的XR/3D应用解决方案，基于混合方案实现，性能逼近原生、效果好、易用、强扩展、渐进式、遵循小程序开发标准。xr-frame在基础库v2.32.0开始基本稳定，发布为正式版，但仍有一些功能还在开发&#…...

编程日记 2024/11/21 16:01:44

基于Kafka2.1解读Consumer原理

文章目录概要整体架构流程技术名词解释技术细节coordinatorfetcherclientconsumer#poll的主要流程全局总览小结概要继上一篇讲Producer原理的文章过去已经一个多月了，今天来讲讲Consumer的原理。其实源码早就读了部分了，但是最近工作比较忙&#x…...

编程日记 2024/11/21 16:00:43

深度学习：ResNet每一层的输出形状

其中 /**在输出通道数为64、步幅为2的7 7卷积层后，接步幅为2的3 3的最大汇聚层,与GoogLeNet区别是每个卷积层后增加了批量规范层**/ b1 nn.Sequential(nn.Conv2d(1, 64, kernel_size7, stride2, padding3),nn.BatchNorm2d(64), nn.ReLU(),nn.MaxPool2d(kernel_s…...

编程日记 2024/11/21 15:58:40

国内几大网络安全公司介绍 - 网络安全

Posted by zhaol under 安全 , 电信 , 评论 , 中国中国国内的安全市场进入“战国时期”，启明星辰、绿盟、天融信、安氏、亿阳、联想网御、华为等战国七雄拥有雄厚的客户资源和资金基础，帐前皆有勇猛善战之士，渐渐开始统领国内安全市场的潮流…...

编程日记 2024/11/21 15:56:38

修改Android Studio项目配置JDK路径和项目Gradle路径的GUI工具

概述本工具提供了一个基于Python Tkinter的图形用户界面（GUI），用于帮助用户搜索并更新Android Studio项目中的config.properties文件里的java.home路径，以及workspace.xml文件中的last_opened_file_path路径。该工具旨在简化手动…...

编程日记 2024/11/21 15:55:37

✅DAY30 贪心算法 | 452. 用最少数量的箭引爆气球 | 435. 无重叠区间 | 763.划分字母区间

452. 用最少数量的箭引爆气球解题思路：首先把原数组按左边界进行排序。然后比较[i-1]的右边界和[i]的左边界是否重叠，如果重叠，更新当前右边界为最小右边界和[i1]的左边界判断是重叠。 class Solution:def findMinArrowShots(self, points:…...

编程日记 2024/11/21 15:54:36

关于Redis单线程模型以及IO多路复用的理解

IO多路复用 -> redis主线程 -> 事件队列 -> 事件处理器 1.IO多路复用机制的作用： 操作系统的多路复用机制（如 epoll、select）负责监听多个文件描述符（如客户端连接）上的事件。当某个文件描述符上的事件就绪…...

编程日记 2024/11/21 15:50:32

学习ASP.NET Core的身份认证（基于Cookie的身份认证1）

B/S架构程序可通过Cookie、Session、JWT、证书等多种方式认证用户身份，虽然之前测试过用户登录代码，也学习过开源项目中的登录认证，但其实还是对身份认证疑惑甚多，就比如登录验证后用户信息如何保存、客户端下次连接时如何获取用户…...

编程日记 2024/11/21 15:46:24

奇门遁甲中看债务时用神该怎么取？

奇门遁甲中看债务的用神一、值符值符在债务关系中可代表债权人（放贷人）。例如在预测放贷时，以值符为放贷人，如果值符克天乙（借贷人）或者天乙生值符，这种情况下可以放贷；反之&#…...

编程日记 2024/11/21 15:44:23

Redis 集群主要有以下几种类型

Redis 集群主要有以下几种类型： 主从复制模式： 这种模式包含一个主数据库实例（master）与一个或多个从数据库实例（slave）。客户端可以对主数据库进行读写操作，对从数据库进行读操作，主…...

编程日记 2024/11/21 15:42:19

使用 Axios 拦截器优化 HTTP 请求与响应的实践

目录前言1. Axios 简介与拦截器概念1.1 Axios 的特点1.2 什么是拦截器 2. 请求拦截器的应用与实践2.1 请求拦截器的作用2.2 请求拦截器实现 3. 响应拦截器的应用与实践3.1 响应拦截器的作用3.2 响应拦截器实现 4. 综合实例：一个完整的 Axios 配置5. 使用拦截器的好…...

编程日记 2024/11/21 15:41:18

mini-lsm通关笔记Week2Day5

项目地址：https://github.com/skyzh/mini-lsm 个人实现地址：https://gitee.com/cnyuyang/mini-lsm Summary 在本章中，您将： 实现manifest文件的编解码。系统重启时从manifest文件中恢复。要将测试用例复制到启动器代码中并运行…...

编程日记 2024/11/21 15:40:16

mybatis的动态sql用法之排序

概括在最近的开发任务中，涉及到了一些页面的排序，其中最为常见的就是时间的降序和升序。这个有的前端控件就可以完成，但是对于一些无法用前端控件的，只能通过后端来进行解决。后端的解决方法就是使用mybatis的动态sql拼接。 …...

编程日记 2024/11/21 15:39:15

OneToMany 和 ManyToOne

在使用 ORM（如 TypeORM）进行实体关系设计时，OneToMany 和 ManyToOne 是非常重要的注解，常用来表示两个实体之间的一对多关系。下面通过例子详细说明它们的使用场景和工作方式。 OneToMany 和 ManyToOne 的基本概念 ManyToOne 表示…...

编程日记 2024/11/21 15:38:14

《生成式 AI》课程第3講 CODE TASK 任务3:自定义任务的机器人

课程《生成式 AI》课程第3講：訓練不了人工智慧嗎？你可以訓練你自己-CSDN博客我们希望你创建一个定制的服务机器人。您可以想出任何您希望机器人执行的任务，例如，一个可以解决简单的数学问题的机器人0 一个机器人&#xff0c…...

编程日记 2024/11/21 15:36:12

反转链表、链表内指定区间反转

反转链表给定一个单链表的头结点pHead（该头节点是有值的，比如在下图，它的val是1），长度为n，反转该链表后，返回新链表的表头。如当输入链表{1,2,3}时，经反转后，原链表变…...

编程日记 2024/11/21 15:35:10

Debezium系列之：Debezium3版本使用快照过程中的指标

Debezium系列之：Debezium3版本使用快照过程中的指标一、背景二、技术原理三、增量快照四、阻塞快照指标一、背景使用快照技术的过程中可以观察指标，从而确定快照的进度二、技术原理 Debezium系列之：Debezium 中的增量快照Debezium系列之：Incremental snapshotting设计原理…...

编程日记 2024/11/21 15:34:09

第一讲，Opencv计算机视觉基础之计算机视觉概述

深度剖析计算机视觉：定义、任务及未来发展趋势引言计算机视觉（Computer Vision）是人工智能的重要分支之一，旨在让机器通过视觉感知和理解环境。随着深度学习的快速发展，计算机视觉在自动驾驶、安防监控、医疗影像等…...

编程日记 2024/11/21 15:31:06

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

HoST框架核心实现方法详解 - 论文深度解读（第二部分）《Learning Humanoid Standing-up Control across Diverse Postures》系列文章：论文深度解读 + 算法与代码分析（二）作者机构：上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学论文主题：人形机器人…...

编程新知 2025/6/17 5:29:50

【Linux】C语言执行shell指令

在C语言中执行Shell指令在C语言中，有几种方法可以执行Shell指令： 1. 使用system()函数这是最简单的方法，包含在stdlib.h头文件中： #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

编程新知 2025/6/21 17:11:09

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

引擎版本： 3.8.1 语言： JavaScript/TypeScript、C、Java 环境：Window 参考：Java原生反射机制您好，我是鹤九日！ 回顾在上篇文章中：CocosCreator Android项目接入UnityAds 广告SDK。我们简单讲…...

编程新知 2025/6/20 11:32:51

ServerTrust 并非唯一

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

编程新知 2025/6/19 14:22:44

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试，通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小，增大可提高计算复杂度duration: 测试持续时间（秒&…...

编程新知 2025/6/21 10:39:11

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

目录一、目的二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结一、目的当前市场上有很多目标检测智能识别的相关算法，当前调用一个医疗行业的AI识别算法后返回…...

编程新知 2025/6/26 10:08:59

Device Mapper 机制

Device Mapper 机制详解 Device Mapper（简称 DM）是 Linux 内核中的一套通用块设备映射框架，为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程，并配以详细的…...

编程新知 2025/6/27 3:13:40

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2025/6/25 17:20:51

R语言速释制剂QBD解决方案之三

本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...

编程新知 2025/6/28 14:07:12

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统实现kefu123登录，不允许匿名访问，kefu只能访问/data/kefu目录，不能查看其他目录创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...

编程新知 2025/6/27 23:54:47

机器学习算法模型系列——Adam算法

Adam相关公式

项目：基于Adam优化算法的神经网络训练

项目：基于Adam优化算法的神经网络训练

模型训练

相关文章：

机器学习算法模型系列——Adam算法

Qt按钮类--＞day09

基于xr-frame实现微信小程序的手部、手势识别3D模型叠加和石头剪刀布游戏功能

基于Kafka2.1解读Consumer原理

深度学习：ResNet每一层的输出形状

国内几大网络安全公司介绍 - 网络安全

修改Android Studio项目配置JDK路径和项目Gradle路径的GUI工具

✅DAY30 贪心算法 | 452. 用最少数量的箭引爆气球 | 435. 无重叠区间 | 763.划分字母区间

关于Redis单线程模型以及IO多路复用的理解

学习ASP.NET Core的身份认证（基于Cookie的身份认证1）

奇门遁甲中看债务时用神该怎么取？

Redis 集群主要有以下几种类型

使用 Axios 拦截器优化 HTTP 请求与响应的实践

mini-lsm通关笔记Week2Day5

mybatis的动态sql用法之排序

OneToMany 和 ManyToOne

《生成式 AI》课程第3講 CODE TASK 任务3:自定义任务的机器人

反转链表、链表内指定区间反转

Debezium系列之：Debezium3版本使用快照过程中的指标

第一讲，Opencv计算机视觉基础之计算机视觉概述

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

【Linux】C语言执行shell指令

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

ServerTrust 并非唯一

拉力测试cuda pytorch 把 4070显卡拉满

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

Device Mapper 机制

C++使用 new 来创建动态数组

R语言速释制剂QBD解决方案之三

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf