当前位置：首页 > news >正文

梯度下降算法，gradient descent algorithm

news 文章来源：https://blog.csdn.net/Advsance/article/details/140738551 2025/4/7 14:16:12

定义：是一个优化算法，也成最速下降算法，主要的部的士通过迭代找到目标函数的最小值，或者收敛到最小值。
说人话就是求一个函数的极值点，极大值或者极小值

算法过程中有几个超参数：
学习率n，又称每次走的步长, n会影响获得最优解的速度，取值不合适的时候可能达不到最优解
阈值 threshold，当两步之间的差值

求解步骤

给定初始点x，阈值和学习率
计算函数在该点的导数
根据梯度下降公式得到下一个x点：x=x-学习率*导数
计算更新前后两点函数值的差值
如果差值小于阈值则找到极值点，否则重复2-5步

例如用梯度下降算法计算下列函数的极值点 $y = (x-2.5)^2 -1$
构造数据

import numpy as np
import matplotlib.pyplot as  plt
plot_x = np.linspace(-1, 6, 141)
plot_y = (plot_x - 2.5) ** 2 - 1
plt.plot(plot_x, plot_y)


def J(theta):  #原始函数return ((theta - 2.5)**2 - 1)def dJ(theta): #导数return 2*(theta - 2.5)def gradient_descent(xs, x, eta, espilon):theta = xxs.append(x)while True:gradient = dJ(theta)last_theta = thetatheta = theta - eta * gradientxs.append(theta)if (abs(J(theta) - J(last_theta)) < espilon):breaketa = 0.0001 #每次前进的 x
xs = []
espilon = 1e-8
gradient_descent(xs, 1, eta, espilon)plt.plot(plot_x, J(plot_x))
plt.plot(np.array(xs), J(np.array(xs)), color="r", marker="+")
print(xs[-1])

2.495000939618705
请添加图片描述

起点我们也可以从另一端开始
例如5

eta = 0.0001 #每次前进的 x
xs = []
espilon = 1e-8
gradient_descent(xs, 5, eta, espilon)plt.plot(plot_x, J(plot_x))
plt.plot(np.array(xs), J(np.array(xs)), color="r", marker="+")
print(xs[-1])

请添加图片描述

计算的极值点 $y = -(x-2.5)^2 -1$

def J(theta):  #原始函数return -((theta - 2.5)**2 - 1)def dJ(theta): #导数return -2*(theta - 2.5)def gradient_descent(xs, x, eta, espilon):theta = xxs.append(x)while True:gradient = dJ(theta)last_theta = thetatheta = theta + eta * gradientxs.append(theta)if (abs(J(theta) - J(last_theta)) < espilon):breaketa = 0.0001 #每次前进的 x
xs = []
espilon = 1e-8
gradient_descent(xs, 1, eta, espilon)plt.plot(plot_x, J(plot_x))
plt.plot(np.array(xs), J(np.array(xs)), color="r", marker="+")
print(xs[-1])

请添加图片描述

使用梯度下降算法计算最简单的线性模型

假设有两组数据

x = np.array([55, 71, 68, 87, 101, 87, 75, 78, 93, 73])
y = np.array([91, 101, 87, 109, 129, 98, 95, 101, 104, 93])

线性模型的损失函数如下：

$\sum_{n=1}^n (y_i - (w_0 + w_i x_i))^2$

其中 w0 和 w1 是我们要求的值，他们代表了线性方程中的两个系数

分别对w0 和 w1求偏导数

$\frac{\partial f}{\partial w_0} = -2\sum_{n=1}^n(y_i-(w_0+w_ix_i))$

$\frac{\partial f}{\partial w_1} = -2\sum_{n=1}^nx_i(y_i-(w_0+w_ix_i))$

注意区分w1 多了一个xi

参照公式 x=x-学习率*导数
得到

w0_gradient = -2 * sum((y - y_hat))
w1_gradient = -2 * sum(x * (y - y_hat))

def ols_gradient_descent(x, y, lr, num_iter):'''x 自变量y 因变量num_iter -- 迭代次数返回:w1 -- 线性方程系数w0 -- 线性方程的截距'''w1 = 0w0 = 0for i in range(num_iter):y_hat = (w1 * x) + w0w0_gradient = -2 * sum((y - y_hat))w1_gradient = -2 * sum(x * (y - y_hat))w1 -= lr * w1_gradientw0 -= lr * w0_gradientreturn w1, w0x = np.array([55, 71, 68, 87, 101, 87, 75, 78, 93, 73])
y = np.array([91, 101, 87, 109, 129, 98, 95, 101, 104, 93])lr = 0.00001 # 迭代步长
num_iter = 500 #迭代次数
w1, w0 = ols_gradient_descent(x, y, lr=0.00001, num_iter=500)print(w1, w0)
xs = np.array([50, 100])
ys = xs * w1 + w0plt.plot(xs, ys, color = "r")
plt.scatter(x, y)

w1 = 1.2633124475159723
w0 = 0.12807483308616532

请添加图片描述

梯度下降算法，gradient descent algorithm

定义：是一个优化算法，也成最速下降算法，主要的部的士通过迭代找到目标函数的最小值，或者收敛到最小值。说人话就是求一个函数的极值点，极大值或者极小值算法过程中有几个超参数： 学习率n，又称…...

编程日记 2024/7/27 21:35:04

Spring boot 2.0 升级到 3.3.1 的相关问题（六）

文章目录 Spring boot 2.0 升级到 3.3.1 的相关问题 （六）spring-data-redis 和 Spring AOP 警告的问题问题描述问题调研结论解决方案方案1-将冲突的Bean 提升为InfrastructureBean方案2 其他相关资料 Spring boot 2.0 升级到 3.3.1 的相关问题 &#xff…...

编程日记 2024/7/27 21:34:03

C++模版基础知识与STL基本介绍

目录一. 泛型编程二. 函数模板 1. 概念 2. 函数模版格式 3. 函数模版的原理 4. 模版函数的实例化 (1). 隐式实例化 (2.) 显式实例化 5. 模版参数的匹配原则三. 类模板 1. 类模板的定义格式 2. 类模板的实例化四. STL的介绍 1. 什么是STL？ 2. STL的版…...

编程日记 2024/7/27 21:33:02

Android 防止重复点击

1.第一种方式： // 两次点击按钮之间的点击间隔不能少于1000毫秒 private static final int MIN_CLICK_DELAY_TIME 700; private static long lastClickTime; /** * 是否是快速点击 * return */ public static boolean isFastClick() { …...

编程日记 2024/7/27 21:32:02

使用阿里云云主机通过nginx搭建文件服务器

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、准备基础环境二、安装配置nginx三、阿里云安全组配置安全组配置 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/4ee96f38312e4771938e40f463987…...

编程日记 2024/7/27 21:30:00

微信Android一面凉经(2024)

微信Android一面凉经(2024) 笔者作为一名双非二本毕业7年老Android, 最近面试了不少公司, 目前已告一段落, 整理一下各家的面试问题, 打算陆续发布出来, 供有缘人参考。今天给大家带来的是《微信Android一面凉经(2024)》。面试职位: 微信-客户端开发工程师-基础功能(广州) And…...

编程日记 2024/7/27 21:27:56

VMware、Docker - 让虚拟机走主机代理，解决镜像封禁问题

文章目录虚拟机全局代理配置找到 VMnet8 的 IPv4 地址代理相关配置虚拟机代理配置 Docker 代理配置修改镜像修改 Docker 代理配置虚拟机全局代理配置找到 VMnet8 的 IPv4 地址 a）打开此电脑，输入 “控制面板”，然后回车. b）之…...

编程日记 2024/7/27 21:26:55

版本管理｜为什么不推荐使用Git Rebase

文章目录什么是 Git Rebase？如何使用 Git Rebase？基本语法示例更多选项注意事项何时使用何时避免其他注意事项为什么需要谨慎使用 Git Rebase？面试中的常见问题问题 1: Git Rebase 和 Git Merge 有何不同？问题 2: 为什么有时应…...

编程日记 2024/7/27 21:24:54

解决异常：Caused by: java.security.cert.CertificateException: No subject alternative names matching IP address xxx.xx.xx.xx found // Https POST 请求private cn.hutool.json.JSON PostGsData(String url, String appKey, String token, Map<String, Ob…...

编程日记 2024/7/27 21:23:53

C# 数组常用遍历方式

// 假设数组Point[] points new Point[2];// 第一种遍历 forfor (int i 0; i < points.Length; i){Point p points[i];Console.WriteLine($"X{p.X},y{p.Y}");}// 第二种遍历 foreachforeach (Point p in points){Console.WriteLine($"X{p.X},y{p.Y}"…...

编程日记 2024/7/27 21:22:52

【JavaScript】详解Day.js：轻量级日期处理库的全面指南

文章目录一、Day.js简介1. 什么是Day.js？2. 安装Day.js 二、Day.js的基本用法1. 创建日期对象2. 格式化日期3. 解析日期字符串4. 操作日期5. 比较日期三、Day.js的高级功能1. 插件机制2. 国际化支持四、实际应用案例1. 事件倒计时2. 日历应用在JavaScript开发中…...

编程日记 2024/7/27 21:21:51

AI算法与图像处理 | 吴恩达团队新作！多模态方向

本文来源公众号“AI算法与图像处理”，仅用于学术分享，侵权删，干货满满。原文链接：吴恩达团队新作！多模态方向研究评估了先进多模态基础模型在 10 个数据集上的多样本上下文学习，揭示了持续的性能提升。…...

编程日记 2024/7/27 21:20:50

云服务器Ubuntu18.04进行Nginx配置

云服务器镜像版本信息：Ubuntu 18.04 server 64bit，本文记录了在改版本镜像上安装Nginx，并介绍了Nginx配置文件目录，便于后面再次有需求时进行复习。文章目录 Nginx的安装Nginx配置文件分析 Nginx的安装 1.执行下面命令进行安装…...

编程日记 2024/7/27 21:18:47

SQL labs-SQL注入（四，sqlmap对于post传参方式的注入）

本文仅作为学习参考使用，本文作者对任何使用本文进行渗透攻击破坏不负任何责任。序言：本文主要讲解基于SQL labs靶场，sqlmap工具进行的post传参方式的SQL注入。传参方式有两类，一类是直接在url栏内进行url编码后进行的传参&am…...

编程日记 2024/7/27 21:17:46

R包：plot1cell单细胞可视化包

介绍 plot1cell是用于单细胞数据seurat数据对象的可视化包。安装 ## You might need to install the dependencies below if they are not available in your R library. bioc.packages <- c("biomaRt","GenomeInfoDb","EnsDb.Hsapiens.v86&qu…...

编程日记 2024/7/27 21:16:44

Tent混沌人工蜂群与粒子群混合算法遇到问题，具体问题及解决方案如文。

🏆本文收录于《CSDN问答解惑-专业版》专栏，主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由🚀；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述 Tent混沌人工蜂…...

编程日记 2024/7/27 21:13:41

Python文献调研（一）环境搭建

一、安装Python版本 1.点击进入Python官网 Download Python | Python.org 2.根据自己的需求选择python的版本，点击【Download】 3.自定义安装路径，记得勾选Add Python xxx to PATH 这步是自动配置环境变量的，如果忘记勾选，建议…...

编程日记 2024/7/27 21:10:37

URL重写

目录步骤1 规则语法 Nginx URL重写规则语法 Apache URL重写规则语法步骤2 规则配置 Apache URL重写规则配置启用mod_rewrite模块配置.htaccess文件编写重写规则测试重写规则 Nginx URL重写规则配置配置server或location块测试重写规则步骤1 规则语法 Ngin…...

编程日记 2024/7/27 21:08:35

git配置环境变量

一.找到git安装目录打开此git安装目录下的bin文件，复制此文件路径二.配置环境变量 2.1 右键点击此电脑的属性栏 2.2 点击高级系统配置 2.3 点击环境变量 2.4 按图中步骤进行配置三.配置完成 win r 输入cmd打开终端终端页面中输入 git --version 如图所示…...

编程日记 2024/7/27 21:07:33

vue3编程-import.meta.glob实现动态路由（菜单）

import.meta.glob 是vite提供的批量懒加载组件的方法本地开发环境： const modules import.meta.glob(../views/**/*.vue)这段代码返回的modules是一个Map： key是vue文件的相对路径，值是一个函数，将函数打印出来，如…...

编程日记 2024/7/27 21:06:32

富唯智能转运机器人：高效、智能、未来的选择

在现代工业中，高效的物流和物料处理是提升生产效率的关键。富唯智能转运机器人，以其卓越的技术和智能化的设计，为各行业提供了完美的解决方案。产品概述富唯智能转运机器人搭载ICD系列核心控制器，拥有多种移载平台&#xff0c…...

编程日记 2024/7/27 21:04:29

跨境电商独立站：Shopify/Wordpress/店匠选哪个？

在面对不断增加的平台运营压力时，不少跨境电商的商家逐渐将注意力转向建立自己的独立站。据《中国跨境出口电商发展报告（2022）》所示，中国拥有的独立站数量在2022年已接近20万个，这表明独立站已成为卖家拓展海外市场的…...

编程日记 2024/7/27 21:02:27

减轻幻觉新SOTA，7B模型自迭代训练效果超越GPT-4，上海AI lab发布

LLMs在回答各种复杂问题时，有时会“胡言乱语”，产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以帮助检测、缓解幻觉。但现有的幻觉标注数据集，因为领域窄、数量少，加上制作成本高、标注人员水平不一…...

编程日记 2024/7/27 20:59:24

53.最大子数组和，动态规划+贪心解法！！！

力扣53最大子数组和题目动态规划贪心题目给你一个整数数组 nums ，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例 1： 输入：nums…...

编程日记 2024/7/27 20:58:22

python+vue3+onlyoffice在线文档系统实战20240723笔记，项目界面设计和初步开发

经过之前的学习，已经能够正常打开文档了。目前为止，我们的代码能够实现：打开文档编辑文档手动保存自动保存虽然功能依然比较少，但是我们已经基本实现了文档管理最核心的功能，而且我们有个非常大的优势，就是支持多人同时在线协同编辑。现在我们要开发项目，我们得做基…...

编程日记 2024/7/27 20:56:18

谷粒商城实战笔记-72-商品服务-API-属性分组-获取分类属性分组

文章目录一，后端接口开发Controller层修改接口接口测试二，前端开发这一节的内容是开发获取分类属性分组的接口。一，后端接口开发 Controller层修改接口修改AttrGroupController接口。 RequestMapping("/list/{catelogId}")p…...

编程日记 2024/7/27 20:54:15

Vue 自定义指令

文章目录注册局部注册全局注册钩子钩子参数应用1、按钮权限验证2、自定义用户行为收集指令3、按钮点击防抖4、输入框自动获取焦点5、输入框自动去空字符串6、文字展示不下时展示提示框注册局部注册 export default {setup() {/*...*/},directives: {// 在模板中启用 v-fo…...

编程日记 2024/7/27 20:53:14

【python】python图书管理系统_普通用户+管理员菜单（源码+论文）【独一无二】

👉博__主👈：米码收割机 👉技__能👈：C/Python语言 👉公众号👈：测试开发自动化【获取源码商业合作】 👉荣__誉👈：阿里云博客专家博主、5…...

编程日记 2024/7/27 20:52:12

智能路面裂缝检测：基于YOLO和深度学习的全流程实现

引言路面裂缝检测是维护道路质量和延长道路寿命的重要手段。传统的检测方法往往费时费力且易受人为因素影响。为了提高检测效率和准确性，本文介绍了一种基于深度学习的路面裂缝检测系统。该系统包括用户界面，利用YOLO（You Only Look Once&a…...

编程日记 2024/7/27 20:47:05

C++ unordered_map

1. unordered系列关联式容器在C98 中， STL 提供了底层为红黑树结构的一系列关联式容器，在查询时效率可达到 ，即最差情况下需要比较红黑树的高度次，当树中的节点非常多时，查询效率也不理想。最好的查询是&#xff0c…...

编程日记 2024/7/27 20:46:03

梯度下降算法，gradient descent algorithm

使用梯度下降算法计算最简单的线性模型

相关文章：

梯度下降算法，gradient descent algorithm

Spring boot 2.0 升级到 3.3.1 的相关问题（六）

C++模版基础知识与STL基本介绍

Android 防止重复点击

使用阿里云云主机通过nginx搭建文件服务器

微信Android一面凉经(2024)

VMware、Docker - 让虚拟机走主机代理，解决镜像封禁问题

版本管理｜为什么不推荐使用Git Rebase

Https post 请求时绕过证书验证方案

C# 数组常用遍历方式

【JavaScript】详解Day.js：轻量级日期处理库的全面指南

AI算法与图像处理 | 吴恩达团队新作！多模态方向

云服务器Ubuntu18.04进行Nginx配置

SQL labs-SQL注入（四，sqlmap对于post传参方式的注入）

R包：plot1cell单细胞可视化包

Tent混沌人工蜂群与粒子群混合算法遇到问题，具体问题及解决方案如文。

Python文献调研（一）环境搭建

URL重写

git配置环境变量

vue3编程-import.meta.glob实现动态路由（菜单）

富唯智能转运机器人：高效、智能、未来的选择

跨境电商独立站：Shopify/Wordpress/店匠选哪个？

减轻幻觉新SOTA，7B模型自迭代训练效果超越GPT-4，上海AI lab发布

53.最大子数组和，动态规划+贪心解法！！！

python+vue3+onlyoffice在线文档系统实战20240723笔记，项目界面设计和初步开发

谷粒商城实战笔记-72-商品服务-API-属性分组-获取分类属性分组

Vue 自定义指令

【python】python图书管理系统_普通用户+管理员菜单（源码+论文）【独一无二】

智能路面裂缝检测：基于YOLO和深度学习的全流程实现

C++ unordered_map