当前位置：首页 > news >正文

机器学习——boosting之GBDT

news 2026/2/8 19:33:33

现在要开始重点关注名字了，名字透漏了很多信息！名字暗藏线索！

GBDT，Gradient Boosting Decision Tree: 梯度提升决策树

果然信息很丰富

梯度：意味着计算有迭代递进关系，但还不明确是怎么迭代递进的
提升：意味着前向分布式+加法模型，并且分类器之间是有相关提升的
决策树：CART决策树、C4.5、忘记名字了…

em…还是要再深挖深挖，小小的boosting，挖呀挖呀挖呀挖。。。
经过推导。。。发现，我的GBDT回归，实际就是上一篇提升树的二叉回归树…
看来可以省点儿功夫，不写代码，但可以稍微推导一下

首先，明确回归问题采用平方损失函数: $Loss(y,f(x)) =(y-f(x))^2$

其中，f(x) 是强分类器，且当前强分类器 $f_m = f_{m-1}+T_m(x,θ_m)$

问题来了，我们现在要求Loss最小，原本是可以直接使Loss对x求导，进而求出θ，得到强分类器的

但书上说了，有时候Loss对x求导，是无法实现的，说实话，我不知道为什么

不过，不妨碍我对GBDT进行推导

首先，梯度，是想要Loss成梯度逐步下降，那就采用让Loss在 $f(x)=f_{m-1}(x)$ 处进行一阶泰勒展开

则有 $Loss(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f(x)-f_{m-1}(x)]$

令 $f(x) = f_m(x)$ ，则有

$L(y,f_m(x)) = L(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)]$

$L(y,f_m(x)) - L(y,f_{m-1}(x))=\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)]$

其中 $f_m(x)-f_{m-1}(x)] = T(x,θ_m)$

要使下一次迭代时，Loss降低，则需要ΔLoss<0，那么对应的 $\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m)$ <0

那么，当 $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}$ 时，就可以保证 $\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m)$ <0

因此， $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}}$

为了求解简洁美观，可以 $令Loss为\frac{1}{2}(y-f(x))^2$

这样 $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{\frac{1}{2}ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}}=y-f_{m-1}(x)$

哦！这不就是残差嘛 $r = y-f_{m-1}(x)$ ,相当于每个新的弱分类器（准确来说，应该是基函数）都应该尽可能地去拟合残差

所以啊！！！！实际上一轮的提升树，本质上就是GBDT

不管，就先这么确定，以后打脸再说…好困

机器学习——boosting之GBDT

现在要开始重点关注名字了，名字透漏了很多信息！名字暗藏线索！ GBDT，Gradient Boosting Decision Tree: 梯度提升决策树果然信息很丰富梯度：意味着计算有迭代递进关系，但还不明确是怎么迭代递进的提升&…...

编程日记 2023/9/8 12:22:08

如何选择报修管理系统？报修工单管理系统有哪些功能和优势？

报修管理系统是一种能够帮助企业快速反应设备故障和异常情况，并将问题及时通知到相关人员，并对问题进行统计和分析的系统。它能够有效提高企业的工作效率，并减少人员成本的支出。那么,报修工单管理系统有哪些功能和优势呢？下面以“…...

编程日记 2023/9/8 12:21:08

Matlab图像处理-

有些时候，直接利用图像的灰度直方图选择阈值不是非常直观，这时，可以利用图像三个通道的直方图来进行图像分割，操作步骤如上文所示，下图为原始图片。下图为三通道直方图。下图将三个通道的直方图会绘制到一个图表上&a…...

编程日记 2023/9/8 12:20:07

数据接口工程对接BI可视化大屏(二)创建BI空间

第2章创建BI空间 2.1 SugarBI介绍网站地址:https://cloud.baidu.com/product/sugar.html SugarBI是百度推出的自助BI报表分析和制作可视化数据大屏的强大工具。基于百度Echarts提供丰富的图表组件，开箱即用、零代码操作、无需SQL，5分钟即可完成数…...

编程日记 2023/9/8 12:19:05

Struts.xml 配置文件说明

<?xml version"1.0" encoding"UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts-2.3.dtd"> <struts> <!--…...

编程日记 2023/9/8 12:18:03

阿里巴巴API接口解析，实现获得商品详情

要解析阿里巴巴API接口并实现获取商品详情，你需要按照以下步骤进行操作： 了解阿里巴巴开放平台：访问阿里巴巴开放平台，并了解相关的API文档、开发者指南和规定。注册开发者账号：在阿里巴巴开放平台上注册一个开发者账…...

编程日记 2023/9/8 12:17:02

9.（Python数模）（分类模型一）K-means聚类

Python实现K-means聚类 K-means原理 K-means均值聚类算法作为最经典也是最基础的无标签分类学习算法。其实质就是根据两个数据点的距离去判断他们是否属于一类，对于一群点，就是类似用几个圆去框定这些点（簇），然后圆心…...

编程日记 2023/9/8 12:16:01

MinIO集群模式信息泄露漏洞（CVE-2023-28432）

前言：MinIO是一个用Golang开发的基于Apache License v2.0开源协议的对象存储服务。虽然轻量，却拥有着不错的性能。它兼容亚马逊S3云存储服务接口，非常适合于存储大容量非结构化的数据。该漏洞会在前台泄露用户的账户和密码。 0x00 环境配置 …...

编程日记 2023/9/8 12:15:00

【从零单排Golang】第十五话：用sync.Once实现懒加载的用法和坑点

在使用Golang做后端开发的工程中，我们通常需要声明一些一些配置类或服务单例等在业务逻辑层面较为底层的实例。为了节省内存或是冷启动开销，我们通常采用lazy-load懒加载的方式去初始化这些实例。初始化单例这个行为是一个非常经典的并发处理的案例&…...

编程日记 2023/9/8 12:13:59

常见注意力机制

注意力机制 （具有自适应性） 18年提出的一种新的卷积注意力模块 ；对前馈卷积神经网络是一个简单而有效的注意力模块 ； 因为它的轻量级和通用性 ，可以无缝集成到任何CNN网络当中， 对我们来讲&…...

编程日记 2023/9/8 12:12:58

解决报错之org.aspectj.lang不存在

一、IDEA在使用时，可能会遇到maven依赖包明明存在，但是build或者启动时，报找不存在。解决办法：第一时间检查Setting->Maven-Runner红圈中的√有没有选上。二、有时候，明明依赖包存在，但是Maven页签中…...

编程日记 2023/9/8 12:11:57

java之SpringBoot基础篇、前后端项目、MyBatisPlus、MySQL、vue、elementUi

文章目录前言JC-1.快速上手SpringBootJC-1-1.SpringBoot入门程序制作（一）JC-1-2.SpringBoot入门程序制作（二）JC-1-3.SpringBoot入门程序制作（三）JC-1-4.SpringBoot入门程序制作（四）…...

编程日记 2023/9/8 12:10:56

golang中如何判断字符串是否包含另一字符串

golang中如何判断字符串是否包含另一字符串在Go语言中，可以使用strings.Contains()函数来判断一个字符串是否包含另一个字符串。该函数接受两个参数：要搜索的字符串和要查找的子字符串，如果子字符串存在于要搜索的字符串中，则返…...

编程日记 2023/9/8 12:09:53

ONNX OpenVino TensorRT MediaPipe NCNN Diffusers ComfyUI

框架和Java生成的中间文件可以在JVM上运行一样，AI技术在具体落地应用方面，和其他软件技术一样，也需要具体的部署和实施的。既然要做部署，那就会有不同平台设备上的各种不同的部署方法和相关的部署架构工具 onnx 在训练模型时可以…...

编程日记 2023/9/8 12:08:52

java中使用 Integer 和 int 的含义、使用方法及之间的区别

学习目标： 学习目标如下： 明确 Integer 和 int 的含义、使用方法及之间的区别学习内容： 一、区别： 1.Integer是int的包装类，int则是java的一种基本的数据类型； 2.Integer变量必须实例化之后才能使用&a…...

编程日记 2023/9/8 12:07:51

点云从入门到精通技术详解100篇-点云的特征检测

目录前言点云配准的研究背景多元时间序列的相似性分析研究背景及意义国内外研究现状...

编程日记 2023/9/8 12:06:49

DOM破坏绕过XSSfilter例题

目录一、什么是DOM破坏二、例题1 编辑三、多层关系 1.Collection集合方式 2.标签关系四、例题2 一、什么是DOM破坏 DOM破坏（DOM Clobbering）指的是对网页上的DOM结构进行不当的修改，导致页面行为异常、性能问题、安全风险或其他不…...

编程日记 2023/9/8 12:05:47

代码随想录Day_56打卡

①、两个字符串的删除操作给定两个单词 word1 和 word2 ，返回使得 word1 和 word2 相同所需的最小步数。每步可以删除任意一个字符串中的一个字符。事例： 输入: word1 "sea", word2 "eat" 输出: 2 解释: 第一步将 "sea&…...

编程日记 2023/9/8 12:04:46

高忆管理：六连板捷荣技术或难扛“华为概念股”大旗

在本钱商场上名不见经传的捷荣技术（002855.SZ）正扛起“华为概念股”大旗。 9月6日，捷荣技术已拿下第六个连续涨停板，短短七个生意日，股价累积涨幅逾越90%。公司已连发两份股票生意异动公告。是炒作，还是…...

编程日记 2023/9/8 12:03:45

「解析」YOLOv5 classify分类模板

学习深度学习有些时间了，相信很多小伙伴都已经接触图像分类、目标检测甚至图像分割(语义分割)等算法了，相信大部分小伙伴都是从分类入门，接触各式各样的 Backbone算法开启自己的炼丹之路。但是炼丹并非全是 Backbone，更多的是各…...

编程日记 2023/9/8 12:02:42

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/8/19 23:46:57

PPT|230页| 制造集团企业供应链端到端的数字化解决方案：从需求到结算的全链路业务闭环构建

制造业采购供应链管理是企业运营的核心环节，供应链协同管理在供应链上下游企业之间建立紧密的合作关系，通过信息共享、资源整合、业务协同等方式，实现供应链的全面管理和优化，提高供应链的效率和透明度，降低供应链的成…...

编程新知 2026/1/30 22:07:56

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架，支持"一次开发，多端部署"，可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务，为旅游应用带来&#xf…...

编程新知 2026/2/5 20:33:43

基于数字孪生的水厂可视化平台建设：架构与实践

分享大纲： 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效近几年，数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段，基于数字孪生的水厂可视化平台的…...

编程新知 2025/12/23 17:14:55

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

Neo4j 集群管理：原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档，本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石，用于构建高可用、可扩展且一致的图数据库服务…...

编程新知 2025/12/27 16:43:24

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2026/1/31 15:09:31

HTML前端开发：JavaScript 常用事件详解

作为前端开发的核心，JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例： 1. onclick - 点击事件当元素被单击时触发（左键点击） button.onclick function() {alert("按钮被点击了！&…...

编程新知 2025/11/10 10:45:11

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2026/2/2 2:49:11

分布式增量爬虫实现方案

之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面，避免重复抓取，以节省资源和时间。在分布式环境下，增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。另一种思路：将增量判…...

编程新知 2026/2/6 1:18:56

相关文章：