当前位置：首页 > news >正文

【人工智能】— 逻辑回归分类、对数几率、决策边界、似然估计、梯度下降

news 2025/7/6 6:16:24

【人工智能】— 逻辑回归分类、对数几率、决策边界、似然估计、梯度下降

逻辑回归分类
Logistic Regression Classification
Logistic Regression: Log Odds
Logistic Regression: Decision Boundary
Likelihood under the Logistic Model
Training the Logistic Model
Gradient Descent

逻辑回归分类

考虑二分类问题，其中每个样本由一个特征向量表示。

直观理解：将特征向量 $\text{x}$ 映射到一个实数 $\text{w}^T\text{x}$

一个正的值 $\text{w}^T\text{x}$ 表示 $\text{x}$ 属于正类的可能性较高。
一个负的值 $\text{w}^T\text{x}$ 表示 $\text{x}$ 属于负类的可能性较高。

概率解释：在这里插入图片描述

对映射值应用一个变换函数，将其范围压缩在0和1之间。
变换后的值表示属于正类的概率。
变换后的值 $\text{w}^T\text{x}\in(-∞，+∞)$ 的范围是 $[0, 1]$ 。

注意：在逻辑回归中通常使用的变换函数是sigmoid函数。

Logistic Regression Classification

条件概率：

条件概率在分类任务中很重要。
使用逻辑函数（也称为sigmoid函数）计算条件概率。

逻辑函数 / sigmoid函数：

当 z 趋近正无穷时，逻辑函数趋近于1。
当 z 趋近负无穷时，逻辑函数趋近于0。
当 z = 0 时，逻辑函数等于0.5，表示两个类别的概率相等。
给定输入 x，正类的概率表示为：
$\,|\, x) =\sigma(w^Tx) = \cfrac{1}{1 + e^{-w^T x}} = \cfrac{e^{w^T x}}{1 + e^{w^T x}}$
给定输入 x，负类的概率表示为：
$\,|\, x) = 1 - p(y = 1 \,|\, x) = \cfrac{1}{1 + e^{w^T x}}$

Logistic Regression: Log Odds

在逻辑回归中，我们使用log odds（对数几率）来建模。
一个事件的几率(odds)：该事件发生的概率与不发生的概率的比值， $\cfrac{p}{1-p}$ 。
log odds / logit function: $\log\left(\cfrac{p}{1-p}\right)$ 。
Log odds for logistic regression: $\log\left(\cfrac{p(y=1|x)}{1-p(y=1|x)}\right) = w^Tx$ 。

在逻辑回归中，我们通过学习适当的权重 $w$ 来建立一个线性模型，该模型可以将输入特征 $x$ 映射到对数几率(log odds)上。然后，通过对对数几率应用逻辑函数（sigmoid函数）来得到分类概率。

Logistic Regression: Decision Boundary

决策边界：在这里插入图片描述

在逻辑回归中，决策边界是指分类模型对于输入特征的判断边界。
对于线性逻辑回归模型，决策边界是线性的。

决策规则：

如果 $\hat{p}(y=1|x) \geq 0.5$ ，则预测为正类。
如果 $\hat{p}(y=1|x) < 0.5$ ，则预测为负类。

对于线性逻辑回归，决策边界是一个线性函数，用于将特征空间划分为两个不同的类别区域。

Likelihood under the Logistic Model

在逻辑回归中，我们观察标签并测量它们在模型下的概率。在这里插入图片描述

给定参数 $w$ ，样本的条件对数似然函数为：
在这里插入图片描述

对数似然函数的表达式为：
在这里插入图片描述

其中， $N$ 是样本数量， $x_i$ 是第 $i$ 个样本的特征向量， $y_i$ 是第 $i$ 个样本的标签。

通过最大化对数似然函数来估计参数 $w$ ，可以找到最佳的参数值，使得模型的概率预测与观察到的标签尽可能一致。

Training the Logistic Model

训练逻辑回归模型（即找到参数 $w$ ）可以通过最大化训练数据的条件对数似然函数或最小化损失函数来完成。在这里插入图片描述

最大化条件对数似然函数 or 最小化损失函数：
在这里插入图片描述

其中， $N$ 是训练数据的样本数量， $x_i$ 是第 $i$ 个样本的特征向量， $y_i$ 是第 $i$ 个样本的标签。

通过最大化条件对数似然函数或最小化损失函数，我们可以找到最优的参数 $w$ ，使得模型能够最好地拟合训练数据，并能够准确地预测新的样本标签。常用的优化算法，如梯度下降法或牛顿法，可以用于求解最优参数。

Gradient Descent

梯度下降是一种常用的优化算法，用于求解最小化损失函数的问题。
在这里插入图片描述

梯度下降的步骤如下：

初始化参数 $w$ 的值。
重复以下步骤直到满足停止条件：
- 计算损失函数 $J (w)$ 对参数 $w$ 的梯度，即 $\cfrac{\partial J(w)}{\partial w}$ 。
- 根据学习率 $\alpha$ ，更新参数 $w$ 的值： $w_j := w_j - \alpha \cfrac{\partial J(w)}{\partial w_j}$ ，对所有参数 $w_j$ 同时进行更新。

梯度下降的目标是通过迭代更新参数，逐渐减小损失函数的值，直到达到局部最小值或收敛。

在逻辑回归中，我们可以使用梯度下降算法来最小化损失函数 $J (w)$ ，从而找到最优的参数 $w$ ，使得模型能够最好地拟合训练数据。通过计算损失函数对参数的梯度，然后根据梯度和学习率更新参数，我们可以逐步调整参数的值，使得损失函数逐渐减小，从而达到最优参数的目标。
在这里插入图片描述

【人工智能】— 逻辑回归分类、对数几率、决策边界、似然估计、梯度下降

【人工智能】— 逻辑回归分类、对数几率、决策边界、似然估计、梯度下降

逻辑回归分类

Logistic Regression Classification

Logistic Regression: Log Odds

Logistic Regression: Decision Boundary

Likelihood under the Logistic Model

Training the Logistic Model

Gradient Descent

相关文章：

【人工智能】— 逻辑回归分类、对数几率、决策边界、似然估计、梯度下降

k8s pod “cpu和内存“ 资源限制

datagrip 连接 phoenix

黑客入侵的常法

VB报警管理系统设计(源代码+系统)

Redis入门 - Redis Stream

微服务中常见问题

更新删除清理购物车

基于Intel NUC平台的字符设备陀螺仪GX5-25驱动程序

建立小型医学数据库（总结）

Git学习笔记

vue面试题1. 请说下封装 vue 组件的过程？2. Vue组件如何进行传值的？3. Vue 组件 data 为什么必须是函数？4. 讲一下组件的命名规范

Docker使用记录

OpenCV(图像处理)-基于Python-形态学处理-开运算、闭运算、顶帽、黑帽运算

chatgpt赋能python：Python支持跨平台软件开发

哈工大计算机网络课程网络层协议详解之：CIDR与路由聚集

C++ 教程（19）——日期时间

React 应用 Effect Hook 函数式中操作生命周期

C代码程序实现扫雷游戏纯代码版本

ai代写---怎么在ubutnu服务器中安装mqtt

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

使用VSCode开发Django指南

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

线程同步：确保多线程程序的安全与高效！

React Native在HarmonyOS 5.0阅读类应用开发中的实践

dedecms 织梦自定义表单留言增加ajax验证码功能

深入理解Optional：处理空指针异常

【Linux手册】探秘系统世界：从用户交互到硬件底层的全链路工作之旅

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《二》

boost::filesystem::path文件路径使用详解和示例