当前位置：首页 > news >正文

条件熵公式详细解释、举例说明计算步骤

news 2026/3/14 13:41:31

公式 7-4 是条件熵的表达式：
$\sum_{i=1}^m p(X = x_i) E(Y | X = x_i)$

这个公式表示的是条件熵，它是衡量在已知某一特征 $X$ 的情况下，随机变量 $Y$ 的不确定性（熵）。条件熵 $E (Y ∣ X)$ 的含义是：在已知 $X$ 的值的情况下， $Y$ 的不确定性有多大。它通过对所有可能的 $X$ 的取值的熵进行加权平均来计算。

公式的详细解释：

$E (Y ∣ X)$ ：这是条件熵，表示在给定 $X$ 的条件下， $Y$ 的不确定性。它衡量了已知 $X$ 的值后， $Y$ 仍然有多少不确定性。如果 $X$ 对 $Y$ 的影响很大，那么条件熵会很低；如果 $X$ 无法有效区分 $Y$ 的类别，那么条件熵会较高。
$\sum_{i=1}^m$ ：这个符号表示对 $X$ 的所有可能取值进行求和。即我们对 $X$ 的每一个取值 $x_i$ 都要计算相应的条件熵并加权平均。 $m$ 是随机变量 $X$ 的可能取值数量。
$p(X = x_i)$ ：这是边缘概率，表示 $X$ 取某个值 $x_i$ 的概率。它表示了在数据集中 $X$ 取值为 $x_i$ 的样本所占比例。
$E(Y|X = x_i)$ ：这是在 $X$ 已知为 $x_i$ 的条件下， $Y$ 的熵，即条件熵。它衡量了在 $X = x_i$ 的条件下， $Y$ 的不确定性。通常，条件熵使用公式 $x_i) = - \sum_{j=1}^n p(Y = y_j | X = x_i) \log p(Y = y_j | X = x_i)$ 来计算，其中 $p(Y = y_j | X = x_i)$ 是条件概率，表示在 $X = x_i$ 时 $Y$ 为 $y_j$ 的概率。

直观理解条件熵：

条件熵 $E (Y ∣ X)$ 表示在已知 $X$ 的情况下， $Y$ 还有多少不确定性。如果 $X$ 能完全决定 $Y$ 的取值，那么条件熵 $E (Y ∣ X)$ 为 0，表示没有不确定性（即 $X$ 和 $Y$ 完全相关）。如果 $X$ 和 $Y$ 完全无关，则条件熵 $E (Y ∣ X)$ 等于 $Y$ 的熵 $E (Y)$ ，即条件熵没有帮助减少不确定性。
条件熵是信息增益的基础：当我们使用某个特征 $X$ 来划分数据时，条件熵表示在这个划分下，目标变量 $Y$ 的不确定性。如果某个划分显著减少了不确定性（即条件熵小），说明这个特征 $X$ 是一个很好的分类依据。

举例说明：

假设我们有一个简单的二元分类问题， $Y$ 表示分类标签， $X$ 表示一个特征。我们有以下数据集：

数据集包含 10 个样本，其中 6 个是类别 1，4 个是类别 2。
特征 $X$ 可以取 2 个值： $x_1$ 和 $x_2$ 。
- 当 $X = x_1$ 时，有 4 个样本，其中 3 个是类别 1，1 个是类别 2。
- 当 $X = x_2$ 时，有 6 个样本，其中 3 个是类别 1，3 个是类别 2。

1. 计算边缘概率：

$x_1) = \frac{4}{10} = 0.4$
$x_2) = \frac{6}{10} = 0.6$

2. 计算条件熵 $E(Y|X = x_1)$ 和 $E(Y|X = x_2)$ ：

条件熵的计算公式为：
$x_i) = - \sum_{j=1}^n p(Y = y_j | X = x_i) \log p(Y = y_j | X = x_i)$

当 $X = x_1$ 时：
- 类别 1 的条件概率： $x_1) = \frac{3}{4} = 0.75$
- 类别 2 的条件概率： $x_1) = \frac{1}{4} = 0.25$
条件熵为：
$E(Y|X = x_1) = - (0.75 \log_2 0.75 + 0.25 \log_2 0.25)$

我们计算各项的对数值：
$\log_2 0.75 \approx -0.415, \quad \log_2 0.25 = -2$

代入公式：
$x_1) = - (0.75 \times -0.415 + 0.25 \times -2) = 0.31125 + 0.5 = 0.81125$
当 $X = x_2$ 时：
- 类别 1 的条件概率： $x_2) = \frac{3}{6} = 0.5$
- 类别 2 的条件概率： $x_2) = \frac{3}{6} = 0.5$
条件熵为：
$E(Y|X = x_2) = - (0.5 \log_2 0.5 + 0.5 \log_2 0.5)$

因为 $log_2 0.5 = -1$ ，所以：
$x_2) = - (0.5 \times -1 + 0.5 \times -1) = 1$

3. 计算条件熵 $E (Y ∣ X)$ ：

现在我们将两个条件熵按边缘概率加权求和：
$E(Y|X) = p(X = x_1) E(Y|X = x_1) + p(X = x_2) E(Y|X = x_2)$

代入已知数值：
$\times 0.81125 + 0.6 \times 1 = 0.3245 + 0.6 = 0.9245$

结论：

条件熵 $E (Y ∣ X) = 0.9245$ 表示，在已知特征 $X$ 的情况下，目标变量 $Y$ 仍然具有约 0.9245 的不确定性。
条件熵帮助我们理解特征 $X$ 对目标变量 $Y$ 的解释能力。如果某个特征的条件熵很低，说明这个特征可以很好地帮助分类决策。如果条件熵很高，则说明该特征对目标变量的区分能力有限。

总结：

公式 7-4 计算了条件熵，它衡量了在已知特征 $X$ 的情况下，目标变量 $Y$ 的不确定性。
条件熵是决策树中进行特征选择的重要指标，通过最小化条件熵，我们可以选择出能够最好地分类数据的特征。
条件熵越小，表示特征 $X$ 能很好地解释目标变量 $Y$ 的分类。

条件熵公式详细解释、举例说明计算步骤

公式 7-4 是条件熵的表达式： E ( Y ∣ X ) ∑ i 1 m p ( X x i ) E ( Y ∣ X x i ) E(Y|X) \sum_{i1}^m p(X x_i) E(Y | X x_i) E(Y∣X)i1∑mp(Xxi)E(Y∣Xxi) 这个公式表示的是条件熵，它是衡量在已知某一特征 X X X 的情况下&#xff0c…...

编程日记 2024/10/1 0:16:10

颍川陈氏始祖陈寔逆势崛起的原由（一）不屈的努力

园子说颍川按陈寔的出身，与当官是风马牛不相及的。东汉末年的社会，朝中外戚、宦官当道，地方则由世家大族把持，郡县的政治经济资源都由他们掌控分配，平民以及中小地主很难有出头之日，弄不好就被兼并了。…...

编程日记 2024/10/1 0:14:09

golang小项目1-家庭收支记账系统

项目地址：golang小项目参考资料：尚硅谷golang教程P229 家庭收支记账系统 1. 系统简介 1.1 项目背景在现代社会中，家庭的财务管理显得尤为重要。随着生活成本的不断上升，家庭需要有效地记录和分析收支情况，以确保…...

编程日记 2024/10/1 0:10:06

Visual Studio Code下载安装及汉化

官网：https://code.visualstudio.com/ 按照指示一步步操作即可： 汉化：...

编程日记 2024/10/1 0:09:05

MySQL—触发器详解

基本介绍触发器是与表有关的数据库对象，在 INSERT、UPDATE、DELETE 操作之前或之后触发并执行触发器中定义的 SQL 语句。触发器的这种特性可以协助应用在数据库端确保数据的完整性、日志记录、数据校验等操作。使用别名 NEW 和 OLD 来引用触发器中发生变化的记…...

编程日记 2024/10/1 0:08:04

钉钉H5微应用Springboot+Vue开发分享

文章目录说明技术路线注意操作步骤思路图一、创建钉钉应用二、创建java项目三、创建vue项目（或uniapp项目），npm引入sdk的依赖四、拥有公网域名端口。开发环境可以使用（贝锐花生壳等工具）五、打开钉钉开发者平台&…...

编程日记 2024/10/1 0:07:03

项目:微服务即时通讯系统客户端(基于C++QT)]四，中间界面搭建和逻辑准备

四，中间界面搭建前言:当项目越来越复杂的时候，或许画草图是非常好的选择一，初始化中间窗口initMidWindow void mainWidget::initMidWindow() {//使用网格布局进行管理QGridLayout* layout new QGridLayout();//距离上方 20px 的距离&…...

编程日记 2024/10/1 0:05:01

【C语言】指针详解（一）

个人主页 ： zxctscl 如有转载请先通知文章目录 1.内存与地址2.指针变量与地址2.1 取地址操作符&2.2 指针变量2.3 指针类型2.4 解引用操作符2.5 指针变量的大小 3. 指针变量类型的意义3.1 指针的解引用 4. const修饰指针4.1 const修饰变量4.2 const修饰指针变量…...

编程日记 2024/10/1 0:04:00

unity3D雨雪等粒子特效不穿透房屋效果实现（粒子不穿透模型）

做项目有时候会做天气模拟，模拟雨雪天气等等。但是容易忽略一个问题，就是房屋内不应该下雨或者下雪，这样不就穿帮了嘛。下面就粒子穿透物体问题做一个demo。正常下雨下雪在室内的话，你可以看到，粒子是穿透建筑的。那要怎么模拟真实的雨雪天气，不让粒子穿透房屋建筑呢…...

编程日记 2024/10/1 0:00:57

ROS2安装cartographer

2. 安装Cartographer和Cartographer ROS 使用apt安装（推荐）： bash sudo apt install ros-humble-cartographer-ros或者，从源代码安装： bash sudo apt-get update sudo apt-get install -y python3-wstool python3…...

编程日记 2024/9/30 23:59:57

kafka测试

1】确认 ZooKeeper 服务状态为了进一步确认 ZooKeeper 服务的状态，你可以执行以下操作： 检查 ZooKeeper 服务状态： docker ps 确保 ZooKeeper 容器正在运行。检查 ZooKeeper 日志： docker logs zookeeper 查看最新的日志条目&…...

编程日记 2024/9/30 23:58:55

总结C/C++中内存区域划分

目录 1.C/C程序内存分配主要的几个区域： 2.内存分布图 1.C/C程序内存分配主要的几个区域： 1、栈区 2、堆区 3、数据段（静态区） 4.代码段 2.内存分布图如图： static修饰静态变量成员——放在静态区 int globalVar 是…...

编程日记 2024/9/30 23:57:54

第168天：应急响应-ELK 日志分析系统Yara规则样本识别特征提取规则编写

目录案例一：ELK 搭建使用-导入文件&监控日志&语法筛选案例二：Yara 规则使用-规则检测&分析特征&自写规则案例一：ELK 搭建使用-导入文件&监控日志&语法筛选该软件是专业分析日志的工具，但是不支持安…...

编程日记 2024/9/30 23:55:52

MySQL 面试题及答案

MySQL 面试题及答案： 一、基础问题什么是数据库索引？有哪些类型？ 答：数据库索引是一种数据结构，用于提高数据库查询的效率。它就像一本书的目录，可以快速定位到特定的数据行。类型主要有： …...

编程日记 2024/9/30 23:52:49

vue仿chatGpt的AI聊天功能--大模型通义千问（阿里云）

vue仿chatGpt的AI聊天功能–大模型通义千问（阿里云） 通义千问是由阿里云自主研发的大语言模型，用于理解和分析用户输入的自然语言。 1. 创建API-KEY并配置环境变量打开通义千问网站进行登录，登陆之后创建api-key，右…...

编程日记 2024/9/30 23:50:46

养老院管理系统（含源码+sql+视频导入教程+文档）

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述养老院管理系统拥有两种角色：管理员和护工管理员：用户管理、老人信息管理、事故记录管理、入住费用管理、护工薪资管理、护工请假管理、床位管理、请假管理等护…...

编程日记 2024/9/30 23:49:45

大数据的挑战是小文件

小文件可能会给存储平台及其支持的应用程序带来大问题。在 Google 上搜索 “small files performance” 会产生 2M 的结果。这篇博文将更深入地研究小文件问题，深入研究其根源并总结解决方案。问题陈述出于本讨论的目的，小文件通常被视为小于 64 KB …...

编程日记 2024/9/30 23:47:44

迁移学习案例-python代码

大白话迁移学习就是用不太相同但又有一些联系的A和B数据，训练同一个网络。比如，先用A数据训练一下网络，然后再用B数据训练一下网络，那么就说最后的模型是从A迁移到B的。迁移学习的具体形式是多种多样的，比如先用A训练…...

编程日记 2024/9/30 23:46:43

MCUboot 和 U-Boot区别

MCUboot 和 U-Boot 都是用于嵌入式系统的引导加载程序，但它们在一些方面存在区别： 功能特性安全特性侧重不同 MCUboot ：更专注于安全引导方面，强调安全启动、固件完整性验证和加密等安全功能。它提供了强大的安全机制来防止恶意…...

编程日记 2024/9/30 23:45:42

Apache OFBiz SSRF漏洞CVE-2024-45507分析

Apache OFBiz介绍 Apache OFBiz 是一个功能丰富的开源电子商务平台，包含完整的商业解决方案，适用于多种行业。它提供了一套全面的服务，包括客户关系管理（CRM）、企业资源规划（ERP）、订单管理、产…...

编程日记 2024/9/30 23:40:37

OpenClaw 是什么

如果你用过ChatGPT，你会知道它本质上是一个问答系统：你问，它答。OpenClaw不一样。它是一个AI Agent平台，能连接20消息渠道（WhatsApp、Telegram、飞书、钉钉、Discord等），主动执行任务、管理你的…...

编程新知 2026/3/14 12:39:27

ONLYOFFICE连接器(Connector)实战指南：从基础API到业务系统深度集成

1. 为什么你需要关注ONLYOFFICE连接器？ 如果你正在开发OA、CRM或者知识库这类需要处理文档的业务系统，那你肯定遇到过这样的头疼事：用户想在系统里直接编辑个Word、Excel或者PPT，你得想办法集成一个在线编辑器。市面上选择不少&am…...

编程新知 2026/3/14 11:34:45

新手必看：李慕婉-仙逆-造相Z-Turbo提示词怎么写？3个技巧出好图

新手必看：李慕婉-仙逆-造相Z-Turbo提示词怎么写？3个技巧出好图第一次打开李慕婉-仙逆-造相Z-Turbo的Web界面，看着那个空白的提示词输入框，你是不是有点懵？输入“李慕婉”三个字，出来的图总感觉差了点意思…...

编程新知 2026/3/14 9:57:55

eVTOL/无人机动力测试：是该选用六分量天平还是普通力传感器？（从原理、优劣势、应用场景一文讲清楚）

随着低空经济加速落地，eVTOL（电动垂直起降飞行器）作为核心载体，正从实验室走向商业化落地。而动力系统作为eVTOL的“心脏”，其性能直接决定飞行器的续航、载荷、安全性与适航合规性——从旋翼拉力的动态波动到机身姿态…...

编程新知 2026/3/14 9:43:49

设备参数智能提取系统技术方案

1. 方案概述本方案旨在构建一套基于 .NET 8 后端框架，利用 Semantic Kernel 进行 AI 编排，结合 Qdrant 向量数据库与阿里云通义千问 (Qwen) 大模型能力的设备参数自动化提取系统。方案核心在于通过“智能切片父子索引检索”机制，实现低成…...

编程新知 2026/3/14 9:25:40

Gogs大文件上传避坑指南：如何避免RPC failed和HTTP 413错误（含Nginx配置技巧）

Gogs大文件上传避坑指南：如何避免RPC failed和HTTP 413错误（含Nginx配置技巧） 你是否曾经在向自己的Gogs代码仓库推送一个包含大型二进制文件（比如数据集、编译产物或者设计稿）的提交时，满怀期待地敲下git …...

编程新知 2026/3/14 6:54:04

VisionPro中CogPMAlignTool图像匹配工具的高级应用与实战技巧

1. 从新手到高手：理解CogPMAlignTool的核心价值如果你正在用康耐视的VisionPro做视觉项目，尤其是涉及到定位、对位或者识别，那你肯定绕不开CogPMAlignTool这个工具。很多新手朋友第一次用的时候，可能会觉得它就是个“找图”的工具…...

编程新知 2026/3/14 4:08:26

【ROS2】MOMO的鱼香ROS2（二）Ubuntu系统精讲——从命令行操作到软件管理实战

1. 从“黑框框”到“老朋友”：为什么命令行是ROS2开发的基石大家好，我是MOMO。上一期我们聊了聊ROS2的入门，算是开了个头。今天，咱们得沉下心来，好好打磨一下我们最重要的“兵器”——Ubuntu系统，特别是那…...

编程新知 2026/3/14 3:56:17

3步永久保存QQ空间历史记录，让青春记忆永不褪色

3步永久保存QQ空间历史记录，让青春记忆永不褪色【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 痛点场景：那些正在消失的青春足迹你是否曾在深夜翻找多年前的Q…...

编程新知 2026/3/14 2:33:12

使用Typora编写Qwen-Image-Edit-F2P技术文档

使用Typora编写Qwen-Image-Edit-F2P技术文档 1. 为什么选择Typora编写技术文档技术文档的编写是每个开发者都需要面对的任务，而选择合适的工具能让这个过程事半功倍。Typora作为一款轻量级的Markdown编辑器，以其简洁的界面和流畅的写作体验&#xff0…...

编程新知 2026/3/14 1:50:36

公式的详细解释：

直观理解条件熵：

举例说明：

1. 计算边缘概率：

2. 计算条件熵 E ( Y ∣ X = x 1 ) E(Y|X = x_1) E(Y∣X=x1​) 和 E ( Y ∣ X = x 2 ) E(Y|X = x_2) E(Y∣X=x2​)：

3. 计算条件熵 E ( Y ∣ X ) E(Y|X) E(Y∣X)：

结论：

总结：

相关文章：

2. 计算条件熵 $E(Y|X = x_1)$ 和 $E(Y|X = x_2)$ ：

3. 计算条件熵 $E (Y ∣ X)$ ：