当前位置: 首页 > news >正文

机器学习算法原理——逻辑斯谛回归

文章目录

      • 逻辑斯谛回归
      • 二项逻辑斯谛回归模型
      • 极大似然估计
      • 多项逻辑斯谛回归模型
      • 总结归纳

逻辑斯谛回归

写在前面:逻辑斯谛回归最初是数学家 Verhulst 用来研究人口增长是所发现的,是一个非常有趣的发现过程, b 站有更详细的背景及过程推导,在此不再赘述:https://www.bilibili.com/video/BV1No4y1o7ac/?p=59

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k9DMmgs6-1677676936475)(逻辑斯谛回归.assets/image-20230301153119470.png)]

逻辑斯谛分布的标准形式:
F(x)=11+e−xF(x) = \frac{1}{1 + e^{-x}} F(x)=1+ex1

f(x)=e−x(1+e−x)2f(x) = \frac{e^{-x}}{(1 + e^{-x})^2} f(x)=(1+ex)2ex

  • 分布函数是一条 SSS 形曲线,该曲线也被称为 sigmoid 曲线,关于点 (0,12)(0,\frac{1}{2})(0,21) 中心对称。
  • 概率密度函数一条钟型曲线,中间高两端低,关于 x=0x = 0x=0 对称,在此处取得最大值 (人口增速最大时刻)。

逻辑斯谛回归的一般形式:

X\rm XX 是连续随机变量, X\rm XX 服从逻辑斯谛分布是指 X\rm XX 具有下列分布函数和概率密度:
F(x)=P(X⩽x)=11+e−(x−μ)/γF(x)=P(X\leqslant x)={\frac{1}{1+\mathrm{{e}}^{-(x-\mu)/\gamma}}}\\ F(x)=P(Xx)=1+e(xμ)/γ1

f(x)=F′(x)=e−(x−μ)/γγ(1+e−(x−μ)/γ)2f(x)=F^{\prime}(x)={\frac{\mathrm{e}^{-(x-\mu)/\gamma}}{\gamma(1+\mathrm{e}^{-(x-\mu)/\gamma})^{2}}} f(x)=F(x)=γ(1+e(xμ)/γ)2e(xμ)/γ

式中, μ\muμ 为位置参数, γ>0\gamma > 0γ>0 为形式参数。

  • 分布函数是一条 SSS 形曲线,该曲线也被称为 sigmoid 曲线,关于点 (μ,12)(\mu,\frac{1}{2})(μ,21) 中心对称。
  • 概率密度函数一条钟型曲线,中间高两端低,关于 x=μx = \mux=μ 对称,在此处取得最大值 14γ\frac{1}{4 \gamma}4γ1 (人口增速最大时刻)。

二项逻辑斯谛回归模型

P(Y=1∣x)=exp⁡(w⋅x+b)1+exp⁡(w⋅x+b)P(Y=1 \mid x)=\frac{\exp (w \cdot x+b)}{1+\exp (w \cdot x+b)} P(Y=1x)=1+exp(wx+b)exp(wx+b)

P(Y=0∣x)=11+exp⁡(w⋅x+b)P(Y=0 \mid x)=\frac{1}{1+\exp (w \cdot x+b)} P(Y=0x)=1+exp(wx+b)1

其中,x∈Rnx \in {\bf R^n}xRn 是输入,Y∈0,1Y \in {0,1}Y0,1 是输出,w∈Rnw \in {\bf R^n}wRnb∈Rnb \in {\bf R^n}bRn 是参数,www 称为权值向量,bbb 称为偏置,w⋅xw \cdot xwxxxxxxx 的内积。

为了方便,将权重向量和输入向量加以扩充,仍记为 wwwxxx ,则有:
ω=(ω(1),ω(2),⋯,ω(n),b)T,x=(x(1),x(2),⋯,x(n),1)T,\omega=\left(\omega^{(1)}, \omega^{(2)}, \cdots, \omega^{(n)}, b\right)^T, \quad \quad x=\left(x^{(1)}, x^{(2)}, \cdots, x^{(n)}, 1\right)^T, ω=(ω(1),ω(2),,ω(n),b)T,x=(x(1),x(2),,x(n),1)T,
逻辑分布函数重写为:
P(Y=1∣x)=ew⋅x1+ew⋅xP(Y=1 \mid x)=\frac{e^{w \cdot x}}{1 + e^{w \cdot x}} P(Y=1x)=1+ewxewx

P(Y=0∣x)=11+ew⋅xP(Y=0 \mid x)=\frac{1}{1 + e^{w \cdot x}} P(Y=0x)=1+ewx1

极大似然估计

二项分布:
P(Y)={1−p,Y=0p,Y=1=(1−p)1−YpYP(Y)=\left\{\begin{array}{ll} 1-p, & Y=0 \\ p, & Y=1 \end{array}=(1-p)^{1-Y} p^Y\right. P(Y)={1p,p,Y=0Y=1=(1p)1YpY
对于 (xi,yi)(x_i, y_i)(xi,yi) ,有:
P(Y=yi∣xi)=(1−pi)1−yipiyiP(Y = y_i | x_i) = (1 - p_i)^{1 - y_i} p_i^{y_i} P(Y=yixi)=(1pi)1yipiyi
其中:
pi=ew⋅xi1+ew⋅xi1−pi=11+ew⋅xi\begin{align} p_i = \frac{e^{w \cdot x_i}}{1 + e^{w \cdot x_i}}\\ 1 - p_i = \frac{1}{1 +e^{w \cdot x_i}} \end{align} pi=1+ewxiewxi1pi=1+ewxi1
对于数据集 T=(X1,y1),(x2,y2),⋯,(xN,yN)T = {(X_1, y_1), (x_2, y_2), \cdots, (x_N, y_N)}T=(X1,y1),(x2,y2),,(xN,yN) 出现的概率:
∏i=1N(1−pi)1−yipiyi\prod_{i = 1}^N (1 - p_i)^{1 - y_i} p_i^{y_i} i=1N(1pi)1yipiyi
该概率只与 www 有关,即可得关于 www 的似然函数:
L(w)=∏i=1N(1−pi)1−yipiyiL(w) = \prod_{i = 1}^N (1 - p_i)^{1 - y_i} p_i^{y_i} L(w)=i=1N(1pi)1yipiyi
对数似然函数:
log⁡∏i=1Npiyi(1−pi)1−yi=∑i=1N[yilog⁡pi+(1−yi)log⁡(1−pi)]=∑i=1N[yilog⁡pi1−pi+log⁡(1−pi)]\begin{align} \log \prod_{i = 1}^{N} p_i^{y_i} (1 - p_i)^{1 - y_i} &= \sum_{i = 1}^{N}[y_i \log p_i + (1 - y_i) \log(1-p_i)]\\ &= \sum_{i = 1}^{N}[y_i \log \frac{p_i}{1 - p_i} + \log(1 - p_i)] \end{align} logi=1Npiyi(1pi)1yi=i=1N[yilogpi+(1yi)log(1pi)]=i=1N[yilog1pipi+log(1pi)]
代入(12)(13)式:
L(w)=∑i=1N[yiw⋅xi−log⁡(1+ew⋅xi)]L(w) = \sum_{i = 1}^{N}[y_i \ w \cdot x_i - \log(1 + e^{w \cdot x_i})] L(w)=i=1N[yi wxilog(1+ewxi)]
这样,问题就变成了以对数似然函数为目标函数的最优化问题,可以应用极大似然估计法估计模型参数,从而得到逻辑斯谛回归模型。逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法

多项逻辑斯谛回归模型

二项逻辑斯谛回归模型可将其推广到多项逻辑斯谛回归模型(multi-nominal logistic regression model),用于多类分类。假设离散型随机变量 YYY 的取值集合是 1,2,⋯,K{1,2,\cdots, K}1,2,,K ,那么多项逻辑斯谛回归模型是:
P(Y=k∣x)=exp⁡(wk⋅x)1+∑k=1K−1exp⁡(wk⋅x),k=1,2,⋯,K−1P(Y=K∣x)=11+∑k=1K−1exp⁡(wk⋅x)\begin{align} P(Y&=k \mid x)=\frac{\exp \left(w_k \cdot x\right)}{1+\sum_{k=1}^{K-1} \exp \left(w_k \cdot x\right)}, \quad k=1,2, \cdots, K-1 \\ P(Y&=K \mid x)=\frac{1}{1+\sum_{k=1}^{K-1} \exp \left(w_k \cdot x\right)} \end{align} P(YP(Y=kx)=1+k=1K1exp(wkx)exp(wkx),k=1,2,,K1=Kx)=1+k=1K1exp(wkx)1
这里,x∈Rn+1x \in {\bf R^{n+1}}xRn+1wk∈Rn+1w_k \in {\bf R^{n+1}}wkRn+1

总结归纳

  • 逻辑斯谛回归归根结底是将分类问题用回归模型来解决。
  • 正态分布是在给定均值和方差的情况下具有最大熵的分布,这样的假设可以使得数据携带的信息量最大。通常在没有任何假设的情况下,连续型数据常被假设为正态分布,离散型数据常被假设为等概率分布。
  • P(Y=1∣x)+P(Y=0∣x)=1P(Y=1 \mid x) + P(Y=0 \mid x) = 1P(Y=1x)+P(Y=0x)=1
  • 逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法
  • 逻辑回归模型不局限于输入变量和输出变量之间是否存在线性关系,可以通过 sigmoid 函数代替非连续型函数,当 sigmoid 函数大于等于 0.5时即可判断类别。
  • 逻辑回归的输入变量可以是连续变量,也可以是离散变量
  • 参数估计:说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。
  • 极大似然估计:极大似然估计就是建立在参数估计的思想上,已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
  • sigmoid 激活函数在深度学习中应用广泛,逻辑斯谛回归更是在分类问题中被大量使用。

相关文章:

机器学习算法原理——逻辑斯谛回归

文章目录逻辑斯谛回归二项逻辑斯谛回归模型极大似然估计多项逻辑斯谛回归模型总结归纳逻辑斯谛回归 写在前面:逻辑斯谛回归最初是数学家 Verhulst 用来研究人口增长是所发现的,是一个非常有趣的发现过程, b 站有更详细的背景及过程推导&…...

【华为OD机试 】最优资源分配/芯片资源占用(C++ Java JavaScript Python)

文章目录 题目描述输入描述输出描述备注用例题目解析C++JavaScriptJavaPython题目描述 某块业务芯片最小容量单位为1.25G,总容量为M*1.25G,对该芯片资源编号为1,2,…,M。该芯片支持3种不同的配置,分别为A、B、C。 配置A:占用容量为 1.25 * 1 = 1.25G配置B:占用容量为 …...

600 条最强 Linux 命令总结

1、基本命令 uname -m 显示机器的处理器架构 uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作系统信息 arch 显示机器…...

python自学之《21天学通Python》(15)——第18章 数据结构基础

数据结构是用来描述一种或多种数据元素之间的特定关系,算法是程序设计中对数据操作的描述,数据结构和算法组成了程序。对于简单的任务,只要使用编程语言提供的基本数据类型就足够了。而对于较复杂的任务,就需要使用比基本的数据类…...

从功能到自动化,熬夜3天整理出这一份2000字学习指南~

学习自动化这个想法,其实自己在心里已经琢磨了很久,就是一直没付诸实践,觉得现在手工测试已经能满足当前的工作需要,不想浪费时间去学习新的东西,有点时间还不如刷刷视频、看看小说等。 第一次有学习Selenium的冲动是…...

客户端攻击(溯源攻击,获取客户端信息)

目录 背景 为什么 示例 探索HTML应用程序 HTA攻击行为(Powershell代码) 背景 如果创建的文件扩展名为.hta而不是.html,Internet Explorer将自动将其解释为html应用程序,并提供使...

visual studio 2022 社区版 c# 环境搭建及安装使用【图文解析-小白版】

visual studio 2022 社区版 c# 环境搭建及安装使用【图文解析-小白版】visual studio 安装 C# 环境安装流程创建c#窗体应用程序visual studio 安装 C# 环境 首先,进入其官网下载对应的visual studio社区版本,官网链接: https://visualstudio.microsoft…...

21- 神经网络模型_超参数搜索 (TensorFlow系列) (深度学习)

知识要点 fetch_california_housing:加利福尼亚的房价数据,总计20640个样本,每个样本8个属性表示,以及房价作为target 超参数搜索的方式: 网格搜索, 随机搜索, 遗传算法搜索, 启发式搜索 超参数训练后用: gv.estimat…...

《NFL橄榄球》:芝加哥熊·橄榄1号位

芝加哥熊(英语:Chicago Bears)是一支职业美式橄榄球球队。位于伊利诺伊州的芝加哥。现时为全国橄榄球联盟的国家联盟北区的球队。他们曾经赢出九次美式橄榄球比赛的冠军,分别为八次旧制全国橄榄球联盟和一次超级碗冠军&#xff08…...

【ES】Elasticsearch核心基础概念:文档与索引

es的核心概念主要是:index(索引)、Document(文档)、Clusters(集群)、Node(节点)与实例,下面我们先来了解一下Document与Index。 RESTful APIs 在讲解Document与Index概念之前,我们先来了解一下RESTful APIs,因为下面讲解Documen…...

实时手势识别(C++与python都可实现)

一、前提配置: Windows,visual studio 2019,opencv,python10,opencv-python,numpy,tensorflow,mediapipe,math 1.安装python环境 这里我个人使用的安装python10&#…...

15个Spring扩展点,一般人知道的不超过5个!

Spring的核心思想就是容器,当容器refresh的时候,外部看上去风平浪静,其实内部则是一片惊涛骇浪,汪洋一片。Spring Boot更是封装了Spring,遵循约定大于配置,加上自动装配的机制。很多时候我们只要引用了一个…...

Elasticsearch:以 “Painless” 方式保护你的映射

Elasticsearch 是一个很棒的工具,可以从各种来源收集日志和指标。 它为我们提供了许多默认处理,以便提供最佳用户体验。 但是,在某些情况下,默认处理可能不是最佳的(尤其是在生产环境中); 因此&…...

js几种对象创建方式

适用于不确定对象内部数据方式一:var p new Object(); p.name TOM; p.age 12 p.setName function(name) {this.name name; }// 测试 p.setName(jack) console.log(p.name,p.age)方式二: 对象字面量模式套路:使用{}创建对象,同…...

阿里云服务器ECS适用于哪些应用场景?

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现云计算带来的技术红利。 阿…...

Ajax学习笔记01

引入 翻译成中文就是“异步的Javascript和XML”。即使用Javascript语言与服务器进行异步交互,传输的数据为XML(当然,传输的数据不只是XML)。 AJAX 不是新的编程语言,而是一种使用现有标准的新方法。 AJAX 最大的优点…...

Jinja2----------过滤器的使用、控制语句

目录 1.过滤器的使用 1.过滤器和测试器 2.过滤器 templates/filter.html app.py 效果 3.自定义过滤器 app.py templates/filter.html 效果 2.控制语句 1.if app.py templates/control.html 2.for app.py templates/control.htm 1.过滤器的使用 1.过滤器和测…...

面试了1个自动化测试,开口40W年薪,只能说痴人做梦...

公司前段缺人,也面了不少测试,结果竟然没有一个合适的。一开始瞄准的就是中级的水准,也没指望来大牛,提供的薪资在10-20k,面试的人很多,但平均水平很让人失望。看简历很多都是3年工作经验,但面试…...

冲鸭!33% 程序员月薪达到 5 万元以上~

2023年,随着互联网产业的蓬勃发展,程序员作为一个自带“高薪多金”标签的热门群体,被越来越多的人所关注。在过去充满未知的一年中,他们的职场现状发生了一定的改变。那么,程序员岗位的整体薪资水平、婚恋现状、职业方…...

【RSA】HTTPS中SSL/TLS握手时RSA前后端加密流程

SSL/TLS层的位置 SSL/TLS层在网络模型的位置,它属于应用层协议。接管应用层的数据加解密,并通过网络层发送给对方。 SSL/TLS协议分握手协议和记录协议,握手协议用来协商会话参数(比如会话密钥、应用层协议等等)&…...

clion在linux设置桌面启动图标(jetbrains全家桶均适用)

clion在linux设置桌面启动图标(jetbrains全家桶均适用) 网上大部分步骤都只是pycharm的教程,其实对于jetbrains全家桶都适合,vs code编辑器也可以这样。 刚开始是使用pycharm在linux设置的教程,参照:http…...

Java数据结构LinkedList单链表和双链表模拟实现及相关OJ题秒AC总结知识点

本篇文章主要讲述LinkedList链表中从初识到深入相关总结,常见OJ题秒AC,望各位大佬喜欢 一、单链表 1.1链表的概念及结构 1.2无头单向非循环链表模拟实现 1.3测试模拟代码 1.4链表相关面试OJ题 1.4.1 删除链表中等于给定值 val 的所有节点 1.4.2 反转…...

立创EDA 学习 day01 应用下载安装,基本使用的操作

1.下载网站 1.链接:立创EDA下载-立创EDA官方版-PC下载网 (pcsoft.com.cn) 2.安装立创EDA 1.直接 next (简单的操作) 3.注册账号 1. 最好注册一个账号,等下在原理图转PCB 板的时候要登录,才可以。 4.新建工程 1.新…...

华为OD机试真题Python实现【火星文计算】真题+解题思路+代码(20222023)

火星文计算 题目 已经火星人使用的运算符号为# $ 其与地球人的等价公式如下 x#y=2*x+3*y+4 x$y=3*x+y+2 x y是无符号整数 地球人公式按照 c 语言规则进行计算 火星人公式中$符优先级高于#相同的运算符按从左到右的顺序运算 🔥🔥🔥🔥🔥👉👉👉👉👉👉 华…...

yolov8 修改类别 自定义数据集

yolov8 加载yolo网络模型 yolov8n.yaml nc: 80 # number of classes 分类数量 depth_multiple: 0.33 # scales module repeats 重复规模 width_multiple: 0.25 # scales convolution channels 缩放卷积通道 backbone head 指定配置 coco128.yaml path: ../datasets/coco128 # d…...

Linux环境下验证python项目

公司大佬开发的python rpa跑数项目,Windows运行没问题后,需要搭建一个linux环境进行验证,NOW START! Install VMware官网 下载好之后打开按步骤安装 最后一步会让填许可证(密钥),这里自行百…...

MAC开发使用技巧

1. 查看所有安装的程序 您可以通过以下步骤在 macOS 中查看所有已安装的程序: 点击屏幕左上角的苹果图标,选择“关于本机”。 在打开的窗口中,选择“系统报告”。 在系统报告窗口中,选择“软件”选项卡,然后选择“安…...

第三章-OpenCV基础-7-形态学

前置 形态学主要是从图像中提取分量信息,该分量信息通常是图像理解时所使用的最本质的形状特征,对于表达和描绘图像的形状有重要意义。 大体就是通过一系列操作让图像信息中的关键信息更加凸出。同时,形态学的操作都是基于灰度图进行。 相关操作最主要…...

DeepFaceLab 中Ubuntu(docker gpu) 部署

DeepFaceLab 在windows图形界面部署比较多,下面用ubuntu 部署在服务器上。部署过程中python版本,或者protobuf版本可能有问题,所以建议用docker 代码下载 cd /trainssdgit clone --depth 1 https://github.com/nagadit/DeepFaceLab_Linux.g…...

分析帆软填报报表点提交的逻辑

1 点提交这里首先会校验数据,校验成功后就去入库数据,这里不分析校验,分析下校验成功后数据是怎么入库的。 2 我们知道当点提交时,发送的请求中的参数为 op=fr_write,cmd=submit_w_report. 在帆软报表中op表示服务,cmd表示服务中的一个动作处理。比如op=fr_write这个服务…...

辽宁平台网站建设平台/百度网盘资源搜索引擎

题目:原题链接(困难) 标签:SQL 解法时间复杂度空间复杂度执行用时Ans 1 (Python)450ms (5.06%)Ans 2 (Python)Ans 3 (Python) 解法一: SELECT T.product_id,P.product_name,T.report_year,T.total_amount FROM (SEL…...

青海网站建设价格低/seo工资水平

背景 一些软件系统需要根据组织做数据查看权限限制,比如可以设置张三能查看或管理1个或多个组织的数据。在对张三进行配置后,张三这个账号查询对应的业务数据表时需要带上数据权限有关的where条件。 一、主要表介绍 组织表的主要字段:ID、CODE、NAME、上级CODE、CODE全路…...

建设婚恋网站/北京seo外包 靠谱

这是一个简单的jQuery代码段,每次加载时都会在您的网页上显示随机引用。 这对于在每次加载网页时显示不同的推荐信很有用,每次都会显示一个新的推荐信。 var a Math.random() "" var rand1 a.charAt(5) quotes new Array quotes[1] "…...

有什么网站是做投资的/关键词的选取原则有

基本概念 在组成原理以及体系结构中经常遇到 CPU Cycle(CPU 周期)、Instruction Cycle(指令周期)、Clock Cycle(时钟周期)这些概念,这篇文章详细拆解一下他们之间联系与区别。废话不多说,直接开门见山给出对应的概念。 CPU Cycle:CPU 内部的…...

wordpress教程阿里云/优化师培训机构

虽然人工智能威胁论层出不穷,但这并不能阻止AI逐渐渗透进我们生活的各个方面,通过算法交易的股票市场、进入最终测试阶段的无人驾驶汽车、启用FaceID的iPhoneX… 广告行业自然也不例外,在过去的几年中,我们已经看到了被程序化交易…...

简单网站搭建/搜索引擎优化心得体会

Python的三大神器:装饰器.迭代器与生成器!这就是Python的三大神器,好了废话不多说。直接来上干货吧! 生成器 仅仅拥有生成某种东西的能力,如果不用__next__方法是获取不到值得。 创建一个生成器函数 >>> def …...