当前位置：首页 > news >正文

吃瓜教程3|决策树

news 2026/2/8 6:50:54

ID3算法

假定当前样本集合D中第k类样本所占比例为pk，则样本集合D的信息熵定义为

信息增益

C4.5算法

ID3算法存在一个问题，就是偏向于取值数目较多的属性，因此C4.5算法使用了“增益率”（gain ratio）来选择划分属性

CART算法

使用属性α划分后的基尼指数为

剪枝处理

* 预剪枝（prepruning）：在构造的过程中先评估，再考虑是否分支。  
* 后剪枝（post-pruning）：在构造好一颗完整的决策树后，自底向上，评估分支的必要性。

评估指的是性能度量，即决策树的泛化性能。

连续值与缺失值处理

连续值

* 首先将α的所有取值按升序排列，所有相邻属性的均值作为候选划分点（n-1个，n为α所有的取值数目）。  
* 计算每一个划分点划分集合D（即划分为两个分支）后的信息增益。  
* 选择最大信息增益的划分点作为最优划分点。

缺失值

假定为样本集中的每一个样本都赋予一个权重，根节点中的权重初始化为1，则定义：

通过在样本集D中选取在属性α上没有缺失值的样本子集，计算在该样本子集上的信息增益，最终的信息增益等于该样本子集划分后信息增益乘以样本子集占样本集的比重。即：

对于（2）：若该样本子集在属性α上的值缺失，则将该样本以不同的权重（即每个分支所含样本比例）划入到所有分支节点中。该样本在分支节点中的权重变为：

多变量决策树

对于高维数据空间，决策树形成的分类边界有一个特点：轴平行，引入多变量决策树实现斜划分，分裂节点变为k1*x1+k2*x2+...

吃瓜教程3|决策树

ID3算法假定当前样本集合D中第k类样本所占比例为pk，则样本集合D的信息熵定义为信息增益 C4.5算法 ID3算法存在一个问题，就是偏向于取值数目较多的属性，因此C4.5算法使用了“增益率”（gain ratio）来选择划分属性 CA…...

编程日记 2023/10/30 21:29:29

springboot动态数据源【非伪数据源】

说明：本文章的数据源不是在配置文件中配置两个或多个数据源，在业务方面对这些数据源来回切换，本文章中的数据源是可以动态添加，修改，切换的，废话不多说。先看工程图： 1.pom.xml文件 <?x…...

编程日记 2023/10/30 21:27:25

如何改善设备综合效率（OEE）并提高工厂的生产力

在现代制造业中，提高设备综合效率（Overall Equipment Efficiency，OEE）是企业追求高效生产和优化生产能力的重要目标之一。OEE是一个关键的绩效指标，可以帮助企业评估设备的利用效率、生产效率和质量水平。本文将从三个…...

编程日记 2023/10/30 21:26:24

一文接入Android阿里Sophix热更新

最近公司项目渐趋成熟，已经不需要经常更新版本，并且更新版本对客户的影响特别大，但是日常维护难免需要更新代码，因此热修复的技术，就比较迫切了。经过一段时间的对比，我们最终决定使用阿里的Sophix方案&am…...

编程日记 2023/10/30 21:25:23

【高阶数据结构】并查集和图

目录 1.数据结构--并查集 2.数据结构--图 1.图的基础概念 2.图的简单实现 2.1.邻接矩阵的图实现 2.2.邻接表的图实现 2.3.图的DFS和BFS 2.4.最小生成树 2.4.1.Kruskal(克鲁斯卡尔算法) 2.4.2.Prim（普里姆算法） 2.5.最短路径 2.5.1.Dijkstra(…...

编程日记 2023/10/30 21:24:22

Git 提交时提示 GPG 签名错误

本来应该一切都是正常的，但今天提交的时候提示 GPG 签名错误。错误的信息就是 GPG 签名失败。 gpg: skipped "942395299055675C": No secret key gpg: signing failed: No secret key error: gpg failed to sign the data fatal: failed to write commi…...

编程日记 2023/10/30 21:22:18

vite+vue3实现 tomcat 的本地部署

背景： 很多开发小伙伴在本地开发完前端项目后，碍于服务端环境配置麻烦，想先试试在本地部署，已开发好的前端项目，由于很多文章都是文字性描述，不太直观，为了给大多数新手提供一个教程&#xff0c…...

编程日记 2023/10/30 21:21:18

windows10 docker playwright 难点在于windows下docker的安装，以及官方hub被墙的困难。 wsl2 wsl2 ubuntu docker git clone https://gitee.com/lineuman/lcs_playwright.git npm install npx playwright test docker端口怎么映射到主机上面？ 设置重…...

编程日记 2023/10/30 21:20:16

php框架路由实现

在PHP中也有很多框架（如Laravel、CodeIgniter）提供了路由功能。下面是一个简单的PHP路由实现原理和示例代码： 路由实现原理： 客户端发起请求，请求的URL会被传递给Web服务器。Web服务器将请求传递给PHP解释器&#xff…...

编程日记 2023/10/30 21:18:15

在CentOS 7中手工打造和运行xml文件配置的Servlet，然后使用curl、浏览器、telnet等三种工具各自测试

下载Openjdk并配置环境变量 https://jdk.java.net/java-se-ri/11-MR2是官网下载Openjdk 11的地方。 sudo wget https://download.java.net/openjdk/jdk11.0.0.1/ri/openjdk-11.0.0.1_linux-x64_bin.tar.gz下载openjdk 11。 sudo mkdir -p /usr/openjdk11创建目录&#xff…...

编程日记 2023/10/30 21:17:14

单例模式.

目录 ♫什么是单例模式 ♫饿汉式单例模式 ♫懒汉式单例模式 ♫单例模式的线程安全问题 ♪原子性 ♪内存可见性与指令重排序 ♫什么是单例模式单例模式是一种设计模式，通过巧用Java的现有语法，实现一个只能被创建一个实例的类，并提供一个全…...

编程日记 2023/10/30 21:16:13

2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析

比赛时长为期7天的妈杯大数据挑战赛如期开赛，为了帮助大家更好的选题，首先给大家带来赛题浅析，为了方便大家更好的选题。赛道 A：基于计算机视觉的坑洼道路检测和识别 A题，图像处理类题目。这种题目的难度数模独一档…...

编程日记 2023/10/30 21:14:11

c++小惊喜——stringstream

当需要读取一行字符串时，我们通常会有将这个字符串分开的想法 #include<iostream> #include<sstream> using namespace std;int main() {string str;getline(cin, str);stringstream ssin(str);string s[10];int cnt 0;while (ssin >> s[cnt]) …...

编程日记 2023/10/30 21:12:08

ubuntu 18.04 编译安装flexpart 10.4（2023年） —— 筑梦之路

2023年10月29日环境说明操作系统版本：ubuntu 18.04 python版本：3.6.9 gcc版本：7.5.0 编译安装路径：/usr/local cmake: 3.10.2 所需要的源码包我已经打包放到我的资源。 2021年1月份已经写过一篇Ubuntu 编译安装的帖子F…...

编程日记 2023/10/30 21:11:07

深度学习（生成式模型）——DDIM：Denoising Diffusion Implicit Models

文章目录前言为什么DDPM的反向过程与前向过程步数绑定DDIM如何减少DDPM反向过程步数DDIM的优化目标DDIM的训练与测试前言上一篇博文介绍了DDIM的前身DDPM。DDPM的反向过程与前向过程步数一一对应，例如前向过程有1000步，那么反向过程也需要有1000步&a…...

编程日记 2023/10/30 21:10:05

HashMap的遍历方式 -- 好几次差点记不起来总结了一下

public class HashMapDemo {public static void main(String[] args) {// 创建一个HashMap并添加一些键值对Map<String, Integer> hashMap new HashMap<>();hashMap.put("Alice", 25);hashMap.put("Bob", 30);hashMap.put("Charlie"…...

编程日记 2023/10/30 21:09:04

PostgreSQL 两表关联更新sql

PostgreSQL两表关联更新SQL如下： UPDATE user SET username ft.name, age ft.age FROM userinfo WHERE user.id ft.id; user 要更新的表 userinfo数据来源表...

编程日记 2023/10/30 21:08:03

R2R 的一些小tip

批次间控制器(Run-to-run Controller)，以应对高混合生产的挑战。将最优配方参数与各种工业特征相关联的模型是根据历史数据离线训练的。预测的最优配方参数在线用于调整工艺条件。批次控制(R2R control)是一种先进的工艺控制技术，可在运行(如批次或晶圆…...

编程日记 2023/10/30 21:07:01

UML中类之间的六种主要关系

UML中类之间的六种主要关系: 继承（泛化）（Inheritance、Generalization）, 实现（Realization），关联（Association)，聚合（Aggregation），组…...

编程日记 2023/10/30 21:06:00

机器学习-朴素贝叶斯之多项式模型

多项式模型： 记住一定用于离散的对象，不能是连续的于高斯分布相反，多项式模型主要适用于离散特征的概率计算，切sklearn的多项式模型不接受输入负值因为多项式不接受负值的输入，所以样本数据的特征为数值型数据&…...

编程日记 2023/10/30 21:05:00

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性，不同版本的Docker对内核版本有不同要求。例如，Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本，Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

编程新知 2026/2/7 6:10:30

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2026/1/27 18:11:42

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

强化学习（Reinforcement Learning, RL）是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程，然后使用强化学习的Actor-Critic机制（中文译作“知行互动”机制），逐步迭代求解…...

编程新知 2026/2/5 4:17:42

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件： 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

编程新知 2026/2/7 19:53:11

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

JVM暂停（Stop-The-World，STW）的完整原因分类及对应排查方案，结合JVM运行机制和常见故障场景整理而成：一、GC相关暂停 1. 安全点（Safepoint）阻塞现象：JVM暂停但无GC日志，日志显示No GCs detected。原因：JVM等待所有线程进入安全点（如…...

编程新知 2026/2/7 11:25:15

mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包

文章目录现象：mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时，可能是因为以下几个原因：1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

编程新知 2026/2/4 16:17:25

零基础在实践中学习网络安全-皮卡丘靶场（第九期-Unsafe Fileupload模块）（yakit方式）

本期内容并不是很难，相信大家会学的很愉快，当然对于有后端基础的朋友来说，本期内容更加容易了解，当然没有基础的也别担心，本期内容会详细解释有关内容本期用到的软件：yakit（因为经过之前好多期…...

编程新知 2026/1/21 12:29:04

九天毕昇深度学习平台 | 如何安装库？

pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子： 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

编程新知 2026/1/31 2:13:57

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

编程新知 2025/9/26 12:26:35

吃瓜教程3|决策树

ID3算法

C4.5算法

CART算法

剪枝处理

连续值与缺失值处理

多变量决策树

相关文章：

吃瓜教程3|决策树

springboot动态数据源【非伪数据源】

如何改善设备综合效率（OEE）并提高工厂的生产力

一文接入Android阿里Sophix热更新

【高阶数据结构】并查集和图

Git 提交时提示 GPG 签名错误

vite+vue3实现 tomcat 的本地部署

docker+playwright

php框架路由实现

在CentOS 7中手工打造和运行xml文件配置的Servlet，然后使用curl、浏览器、telnet等三种工具各自测试

单例模式.

2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析

c++小惊喜——stringstream

ubuntu 18.04 编译安装flexpart 10.4（2023年） —— 筑梦之路

深度学习（生成式模型）——DDIM：Denoising Diffusion Implicit Models

HashMap的遍历方式 -- 好几次差点记不起来总结了一下

PostgreSQL 两表关联更新sql

R2R 的一些小tip

UML中类之间的六种主要关系

机器学习-朴素贝叶斯之多项式模型

Docker 离线安装指南

7.4.分块查找

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

shell脚本--常见案例

最新SpringBoot+SpringCloud+Nacos微服务框架分享

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包

零基础在实践中学习网络安全-皮卡丘靶场（第九期-Unsafe Fileupload模块）（yakit方式）

九天毕昇深度学习平台 | 如何安装库？

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join