当前位置: 首页 > news >正文

【机器学习第十二章——计算学习理论】

机器学习第十二章——计算学习理论

  • 12.计算学习理论
    • 12.1 基础知识
    • 12.1 可能学习近似正确假设(PAC)
    • 12.3 有限假设空间
    • 12.4 VC维

12.计算学习理论

12.1 基础知识

  • 从理论上刻画了若干类型的机器学习问题中的困难和若干类型的机器学习算法的能力

  • 这个理论要回答的问题是:

    • 在什么样的条件下成功的学习是可能的?
    • 在什么条件下某个特定的学习算法可保证成功运行?
  • 机器学习理论的一些问题:

    • 是否可能独立于学习算法确定学习问题中固有的难度?
    • 能否知道为保证成功的学习有多少训练样例是必要的或充足的?
    • 如果学习器被允许向施加者提出查询,而不是观察训练集的随机样本,会对所需样例数目有怎样的影响?
    • 能否刻画出学习器在学到目标函数前会有多少次出错?
    • 能否刻画出一类学习问题中固有的计算复杂度?
  • 主要解决的问题是:

    • 需要多少训练样例才足以成功地学习到目标函数
    • 学习器在达到目标前会出多少次错

12.1 可能学习近似正确假设(PAC)

  • 可能近似正确学习模型(PAC)
    • 指定PAC学习模型适用的问题
    • 在此模型下,学习不同类别的目标函数需要多少训练样例和多大的计算量

X表示所有实例的集合,C代表学习器要学习的目标概念集合,C中每个目标概念c对应于X的某个子集或一个等效的布尔函数c:
X → { 0 , 1 } X→\{0,1\} X{0,1}

假定实例按照某概率分布D从X中随机产生

学习器L在学习目标概念时考虑可能假设的集合H。在观察了一系列关于目标概念c的训练样例后,L必须从H中输出某假设h,它是对c的估计

我们通过h在从X中抽取的新实例上的性能来评估L是否成功。新实例与训练数据具有相同的概率分布

我们要求L足够一般,以至可以从C中学到任何目标概念而不管训练样例的分布如何,因此,我们会对C中所有可能的目标概念和所有可能的实例分布D进行最差情况的分析

12.3 有限假设空间

  • PAC可学习性很大程度上由所需的训练样例数确定
  • 随着问题规模的增长所带来的所需训练样例的增长称为该学习问题的样本复杂度
  • 我们把样本复杂度的讨论限定于一致学习器(输出完美拟合训练数据的学习器)
  • 能够独立于特定算法,推导出任意一致学习器所需训练样例数的界限
  • 变型空间:能正确分类训练样例D的所有假设的集合。

V S H , D = { h ∈ H ∣ ( ∀ < x , c ( x ) > ∈ D ( h ( x ) = c ( x ) ) ) } VS_{H,D}=\{h\in H|(\forall\quad <x,c(x)>\quad\in D(h(x)=c(x)))\} VSH,D={hH(<x,c(x)>D(h(x)=c(x)))}

  • 变型空间的重要意义是:每个一致学习器都输出一个属于变型空间的假设

  • 因此界定任意一个一致学习器所需的样例数量,只需要界定为保证变型中没有不可接受假设所需的样例数量

  • 定义:考虑一假设空间H,目标概念c,实例分布D以及c的一组训练样例S。当
    V S H , D VS_{H,D} VSH,D
    中每个假设h关于c和D错误率小于ε时,变型空间被称为c和D是ε-详尽的。

( ∀ h ∈ V S H , D ) e r r o r D ( h ) < ε (\forall h\in VS_{H,D})error_D(h)<ε (hVSH,D)errorD(h)<ε

  • 详尽的变型空间表示与训练样例一致的所有假设的真实错误率都小于ε

  • 从学习器的角度看,所能知道的只是这些假设能同等地拟合训练数据,它们都有零训练错误率

  • 只有知道目标概念的观察者才能确定变型空间是否为ε-详尽的

  • 但是,即使不知道确切的目标概念或训练样例抽取的分布,一种概率方法可在给定数目的训练样例之后界定变型空间为ε-详尽的

  • 定理7.1(变型空间的ε-详尽化)

    • 若假设空间H有限,且D为目标概念c的一系列m>=1个独立随机抽取的样例,那么对于任意0=<ε<=1,变型空间不是ε-详尽的概率小于或等于:
      ∣ H ∣ e − ε m |H|e^{-εm} Heεm

    • 证明:


      • h 1 , . . . , h k h_1,...,h_k h1,...,hk
        为H中关于c的真实错误率大于ε的所有假设。当且仅当k个假设中至少有一个恰好与所有m个独立随机抽取样例一致时,不能使变型空间ε-详尽化。

      • 任一假设真实错误率大于ε,且与一个随机抽取样例一致的可能性最多为1-ε,因此,该假设与m个独立抽取样例一致的概率最多为
        ( 1 − ε ) m (1-ε)^m (1ε)m

      • 由于已知有k个假设错误率大于ε,那么至少有一个与所有m个训练样例都不一致的概率最多为
        当 0 ≤ ε ≤ 1 , 则 1 − ε ≤ e ε k ( 1 − ε ) m ≤ ∣ H ∣ ( 1 − ε ) m ≤ ∣ H ∣ e − ε m ( 7.2 ) 当0\leqε\leq1,则1-ε\leq e^ε\\ k(1-ε)^m\leq|H|(1-ε)^m\leq|H|e^{-εm}\quad\quad(7.2) 0ε1,1εeεk(1ε)mH(1ε)mHeεm(7.2)

  • 定理7.1基于训练样例的数目m、允许的错误率ε和H的大小,给出了变型空间不是ε-详尽的概率的上界

  • 即它对于使用假设空间H的任意学习器界定了m个训练样例未能将所有“坏”的假设(错误率大于ε的假设)剔除出去的概率

  • 利用上面的结论来确定为了减少此“未剔除”概率到一希望程度ε所需的训练样例数
    由 ∣ H ∣ e − ε m ≤ δ → m ≥ 1 ε ( ln ⁡ ∣ H ∣ + ln ⁡ ( 1 / δ ) ) 由|H|e^{-εm}\leq\delta→m\geq\frac{1}{ε}(\ln|H|+\ln(1/\delta)) Heεmδmε1(lnH+ln(1/δ))

  • 式子7.2提供了训练样例数目的一般边界,该数目的样例足以在所期望的值εδ程度下,使任何一致学习器成功地学习到H中的任意目标概念

  • 训练样例的数目m足以保证任意一致假设是可能(可能性为1-δ)近似(错误率为ε)正确的

  • m随着1/ε线性增长,随着1/δ和假设空间的规模对数增长

  • 上面的界限可能是过高的估计,主要来源于|H|项,它产生于证明过程中在所有可能假设上计算那些不可接受的假设的概率和

12.4 VC维

  • 分层有向无环图的特点:

    • 节点可划分成层,即所有第1层出来的有向边进入到第l+1层节点
    • 没有有向环,即有向弧形成的回路
  • 这样网络的VC维的界定可以基于其图的结构和构造该图的基本单元的VC维

  • 定义一些术语

    • G表示神经网络

    • n是G的输入数目

    • G只有1个输出节点

    • G的每个内部单元Ni最多有r个输入,并实现布尔函数
      c i : R r → { 0 , 1 } c_i:R^r→\{0,1\} ci:Rr{0,1}
      形成函数类C

    • 定义C的G-合成:网络G能实现的所有函数的类,即网络G表示的假设空间,表示成
      C G C_G CG

  • 定理7.4分层有向无环网络的VC维

    • 令G为一分层有向无环图,有n个输入节点和s>=2个内部节点,每个至少有r个输入,令C为VC维为d的
      R r R^r Rr
      上的概念类,对应于可由每个内部节点s描述的函数集合,令
      C G C_G CG
      为C的G合成,对应于可由G表示的函数集合,则
      V C ( C G ) < = 2 d s log ⁡ ( e s ) VC(C_G)<=2ds\log(es) VC(CG)<=2dslog(es)
  • 假定要考虑的分层有向无环网络中单个节点都是感知器,由于单独的r输入感知器VC维为r+1,代入定理7.4和式子7.7,得到
    V C ( C G p e r c e p t i o n s ) ≤ 2 ( r + 1 ) s log ⁡ ( e s ) VC(C_G^{perceptions})\leq2(r+1)s\log(es) VC(CGperceptions)2(r+1)slog(es)

    m ≥ 1 ε ( 4 log ⁡ ( 2 / δ ) + 16 ( r + 1 ) s log ⁡ ( e s ) log ⁡ ( 13 / ε ) ) m\geq\frac{1}{\varepsilon}(4\log(2/\delta)+16(r+1)s\log(es)\log(13/\varepsilon)) mε1(4log(2/δ)+16(r+1)slog(es)log(13/ε))

  • 上面的结果不能直接应用于反向传播的网络,原因有两个:

    • 此结果应用于感知器网络,而不是sigmoid单元网络
    • 不能处理反向传播中的训练过程

相关文章:

【机器学习第十二章——计算学习理论】

机器学习第十二章——计算学习理论 12.计算学习理论12.1 基础知识12.1 可能学习近似正确假设&#xff08;PAC&#xff09;12.3 有限假设空间12.4 VC维 12.计算学习理论 12.1 基础知识 从理论上刻画了若干类型的机器学习问题中的困难和若干类型的机器学习算法的能力 这个理论要…...

Docker私人学习笔记

俗话说“好记性不如烂笔头”&#xff0c;编程的海洋如此的浩大&#xff0c;养成做笔记的习惯是成功的一步&#xff01; 此笔记主要是antlr4.13版本的笔记&#xff0c;并且笔记都是博主自己一字一字编写和记录&#xff0c;有错误的地方欢迎大家指正。 一、基础概念&#xff1a;…...

谷粒商城实战笔记-233~235-商城业务-认证服务-单点登录流程-原理

文章目录 一&#xff0c;场景二&#xff0c;单点登录流程 一&#xff0c;场景 包含以下三节的内容&#xff1a; 一&#xff0c;233-商城业务-认证服务-单点登录流程-1二&#xff0c;233-商城业务-认证服务-单点登录流程-2三&#xff0c;233-商城业务-认证服务-单点登录流程-3…...

机器学习在旅游业的革新之旅

机器学习在旅游业的革新之旅 随着科技的飞速发展&#xff0c;尤其是人工智能&#xff08;AI&#xff09;技术的广泛应用&#xff0c;各个行业都迎来了前所未有的变革。其中&#xff0c;旅游业作为全球经济的重要支柱之一&#xff0c;更是受益匪浅。机器学习&#xff08;Machin…...

OpenCTI:开源网络威胁情报平台

OpenCTI 是一个开源平台&#xff0c;旨在帮助组织管理其网络威胁情报 (CTI) 数据和可观察数据。 该平台由 Filigran 开发&#xff0c;使用基于 STIX2 标准的知识模式构建数据。 它采用现代 Web 应用程序架构&#xff0c;配备 GraphQL API 和用户友好的前端。 OpenCTI 与 MIS…...

linux shell 脚本 let 数学计算

linux shell 脚本 let 数学计算 http://www.codebaoku.com/it-shell/ let命令中的算术表达式必须用双引号括起来&#xff0c;以避免解释器对特殊字符进行处理。 在变量的计算中&#xff0c;不需要使用$符号来表示变量&#xff0c; #!/bin/shweek_daydate %u echo $week_day…...

mp3和mp4的区别是什么?怎么把mp3转成mp4?(全)

在生活中我们或多或少会听到“mp3”和“mp4”&#xff0c;那么什么是mp3和mp4呢&#xff1f;mp3和mp4的区别是什么&#xff1f;mp3是一种音频压缩技术&#xff0c;旨在在不显著牺牲音质的前提下减小音频文件的体积&#xff0c;使其适用于音乐和其他音频内容的存储与传输。相比之…...

合并params和query参数

场景&#xff1a;三级分类只有query参数&#xff0c;搜索框使用params参数。为了解决这个问题&#xff0c;文中在typeNav的index.vue和Head/index.vue分别进行了判断和处理&#xff0c;确保在不同的路径下合并params和query参数能正确合并并传递。 如何当点击联动框时跳转到se…...

[数据集][目标检测]工程机械车辆检测数据集VOC+YOLO格式3189张10类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;3189 标注数量(xml文件个数)&#xff1a;3189 标注数量(txt文件个数)&#xff1a;3189 标注…...

构建域名服务器-BIND:Linux端的安装过程及配置文件详解

文章目录 构建域名服务器工具-BINDBIND的安装BIND配置文件详解1. /etc/named.conf&#xff1a;2. /etc/named.rfc1912.zones&#xff1a;3. /var/named/named.localhost&#xff1a;4./etc/logrotate.d/named5./etc/named.iscdlv.key6./etc/named.root.key7./etc/rndc.conf8./e…...

linux查询目录文件基础操作

基础命令 展示所有目录 ls 长格式列出&#xff08;显示文件权限、所有者、大小和最后修改时间&#xff09;&#xff1a; ls -l 忽略大小写查询 ls | grep -i name 查找特定名称的文件&#xff1a; find /path/to/search -name "filename" 忽略大小写查找文件&#…...

搭建TestBench,收藏这几条基本框架就够了

Verilog功能模块HDL设计完成后&#xff0c;并不代表设计工作的结束&#xff0c;还需要对设计进行进一步的仿真验证。掌握验证的方法&#xff0c;即如何调试自己的程序非常重要。在RTL逻辑设计中&#xff0c;要学会根据硬件逻辑来写测试程序即写Testbench。Verilog测试平台是一个…...

怎么利用住宅代理提高数据抓取效率

在大数据时代&#xff0c;数据抓取已经是从互联网收集数据的关键手段&#xff0c;得到了广泛的应用。不论是网络营销、电商平台、或者是新闻网站&#xff0c;数据抓取都可以帮助企业或者是个人收集到大量的数据。但是随着反爬虫技术的不断发展&#xff0c;传统的爬虫方法已经不…...

c#中的ManuaResetEvent

在C#中&#xff0c;ManualResetEvent 是一个同步事件&#xff0c;用于线程间通信。它允许一个或多个等待的线程等待某个事件的发生。当事件被设置为已发生&#xff08;或称为“信号”&#xff09;状态时&#xff0c;所有等待的线程都会被释放&#xff0c;并且可以继续执行。 以…...

EE trade:黄金投资的利弊与要点

黄金投资作为一种相对传统的投资途径&#xff0c;存在着特定的优势与风险。接下来详细剖析一下黄金投资的优缺点。 1、黄金投资的优点 有效对抗通货膨胀 在通货膨胀时期&#xff0c;黄金往往能有出色的表现&#xff0c;其价值通常会上升&#xff0c;如此一来便能够为投资者提…...

数据仓库模型评估的标准

面试中&#xff0c;肯定有数仓同学被问到&#xff1a;数据模型如何去评估、如何优化&#xff0c;那今天就聊一聊这个话题。 基本概念 模型&#xff1a;表达的是某一个主题、某一个业务过程&#xff0c;赋值业务价值&#xff0c;最终落地还是一个建表的过程 数仓模型&#xf…...

121231

实打实大苏打...

【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)

目录 &#x1f354; 逻辑回归应用场景 &#x1f354; 极大似然估计 2.1 为什么要有极大似然估计&#xff1f; 2.2 极大似然估计步骤 2.3 极大似然估计的例子 &#x1f354; Sigmod函数模型 3.1 逻辑斯特函数的由来 3.2 Sigmod函数绘图 3.3 进一步探究-加入线性回归 3…...

网络热门编程项目导学:黑马点评

本文作者&#xff1a;程序员鱼皮 免费编程学习 - 编程导航网&#xff1a;https://www.code-nav.cn 大家好&#xff0c;我是鱼皮。 之前已经给大家分享了三个全栈项目&#xff0c;比如瑞吉外卖什么的&#xff0c;这几个项目都是侧重于带大家学习框架的运用、以及一些简单的业务…...

如何在本地和远程删除 Git 分支?

如何在本地和远程删除 Git 分支&#xff1f; 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页&#xff0c;我是博主英杰&#xff0c;211科班出身&#xff0c;就职于医疗科技公司&#xff0c;热衷分享知识&#xff0c;武汉城市开发者社区主理人 擅长.n…...

08 STM32 DMA

DMA 协助CPU&#xff0c;完成数据转运工作。 两个程序&#xff1a; DMA数据转运&#xff0c;DMAAD多通道 DMA数据转运&#xff0c;将使用DMA&#xff0c;进行存储器到存储器的数据转运&#xff0c;也就是把一个数组里面的数据&#xff0c;复制到另一个数组里。 定义一个数组D…...

LLM之基于llama-index部署本地embedding与GLM-4模型并初步搭建RAG(其他大模型也可,附上ollma方式运行)

前言 日常没空&#xff0c;留着以后写 llama-index简介 官网&#xff1a;https://docs.llamaindex.ai/en/stable/ 简介也没空&#xff0c;以后再写 注&#xff1a;先说明&#xff0c;随着官方的变动&#xff0c;代码也可能变动&#xff0c;大家运行不起来&#xff0c;可以进…...

Python 异步爬虫:高效数据抓取的现代武器

标题&#xff1a;“Python 异步爬虫&#xff1a;高效数据抓取的现代武器” 在当今信息爆炸的时代&#xff0c;网络爬虫已成为数据采集的重要工具。然而&#xff0c;传统的同步爬虫在处理大规模数据时往往效率低下。本文将深入探讨如何使用 Python 实现异步爬虫&#xff0c;以提…...

【数据结构算法经典题目刨析(c语言)】使用数组实现循环队列(图文详解)

&#x1f493; 博客主页&#xff1a;C-SDN花园GGbond ⏩ 文章专栏&#xff1a;数据结构经典题目刨析(c语言) 目录 一.题目描述 二.解题思路 1.循环队列的结构定义 2.队列初始化 3.判空 4.判满 5.入队列 6.出队列 7.取队首元素 8.取队尾元素 三.完整代码实…...

PTA L1-005 考试座位号

L1-005 考试座位号&#xff08;15分&#xff09; 每个 PAT 考生在参加考试时都会被分配两个座位号&#xff0c;一个是试机座位&#xff0c;一个是考试座位。正常情况下&#xff0c;考生在入场时先得到试机座位号码&#xff0c;入座进入试机状态后&#xff0c;系统会显示该考生…...

软件测试3333

禅道&#xff1f; 学习正则表达式 目标&#xff1a; 能说出软件测试缺陷判定标准 能说出项目中缺陷的管理系统 能使用Excel对于缺陷进行管理 能使用工具管理缺陷 一、用例执行 说明&#xff1a;用例执行不通过&#xff0c;执行结果与用例的期望结果不一致&#xff08;含义&…...

JJJ:结构体定义中常加的后缀:attribute ((packed))

__attribute__ ((packed))&#xff1a; 的作用就是告诉编译器取消结构体在编译过程中的优化对齐,按照实际占用字节数进行对齐&#xff0c;是GCC特有的语法。这个功能是跟操作系统没关系&#xff0c;跟编译器有关 在GCC下&#xff1a;struct my{ char ch; int a;} sizeof(int)4…...

【HTML】DOCTYPE作用

<!DOCTYPE html> DOCTYPE是document type&#xff08;文档类型&#xff09;的缩写。是HTML5中一种标准通用标记语言的文档类型声明&#xff0c;告诉浏览器文档的类型&#xff0c;便于解析文档。不同渲染模式会影响浏览器对CSS代码甚至JS脚本的解析。它必须声明在第一行。…...

STM32学习记录-04-EXTI外部中断

1 中断系统 &#xff08;1&#xff09;中断&#xff1a;在主程序运行过程中&#xff0c;出现了特定的中断触发条件&#xff08;中断源&#xff09;&#xff0c;使得CPU暂停当前正在运行的程序&#xff0c;转而去处理中断程序&#xff0c;处理完成后又返回原来被暂停的位置继续…...

Android Studio 动态表格显示效果

最终效果 一、先定义明细的样式 table_row.xml <?xml version"1.0" encoding"utf-8"?> <RelativeLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_h…...

企业网站开发实训报告/百度网站的网址是什么

在本文中&#xff0c;我将介绍MySQL执行GROUP BY的四种方法。In this blog post, I’ll look into four ways MySQL executes GROUP BY.在我的上一篇文章中&#xff0c;我们知道了通过索引或者其他的方式获取数据可能不是语句执行最耗时的操作。比如&#xff0c;MySQL 的GROUP …...

建设信用卡在网站挂失几步/seo海外推广

一、申请免费的域名 1、链接&#xff1a;http://www.ngrok.cc/login.html 2、注册账号及登录 3、开通隧道 注&#xff1a;隧道名称&#xff1a;brightbright属于自定义的 二、下载客户端 1、客户端下载地址&#xff1a;http://www.ngrok.cc 2、选择Ngrok客户端 3、根据实…...

南京营销型网站/百度指数分析平台

解决org.apache.commons.lang.xwork.StringUtils异常今夜&#xff0c;晴&#xff0c;时间&#xff0c;凌晨两点本码农在敲代码时遇到一个问题&#xff0c;就是页面用Ajax传输json数据到后台时&#xff0c;Struts框架使用json-default&#xff0c;在调用模型后返回到页面时&…...

网站的百度推广怎么做/公关服务

参考&#xff1a;https://blog.csdn.net/zl544434558/article/details/47857343 在一个eclipse启动多个tomcat&#xff0c;修改tomcat的端口是不可以的&#xff0c;需要修改tomcat的shutdown端口、tomcat访问端口、jvm启动端口 修改步骤&#xff1a; 1 双击tomcat server 在每个…...

网站开发项目需求/贵州二级站seo整站优化排名

介绍&#xff1a; 借助ruoyi这个平台开发一套资源平台。直接采用了RuoYi-Vue前后端分离基础平台。打造一款开源的电频平台。集成了奇文网盘。后台用的是vuespringboot&#xff0c;门户采用nuxtjsspringboot。 技术要点 前端采用Vue、Element UI、nuxt 基础平台采用的是RuoYi-…...

wordpress 关闭摘要/百度浏览器官网下载并安装

CAD看图王(CAD手机看图专业版)集快速看图、DWG画图、CAD批注、制图于一身的CAD看图软件&#xff0c;全球累计免费用户超过5000万。支持AutoCAD、浩辰CAD、天正建筑、酷家乐等国内外CAD图纸格式&#xff0c;图纸原生显示CAD图纸不失真。专业的fonts字体解析告别文字乱码&#xf…...