当前位置: 首页 > news >正文

【学习笔记】理解深度学习的基础:机器学习

1. 机器学习基础

1.1 机器学习的定义与重要性

  • 定义:深度学习是机器学习的一种特定形式。为了深入理解深度学习,必须牢固掌握机器学习的基本原理。机器学习算法是一种能够从数据中学习的算法,通过经验E在任务T上提高性能度量P(Mitchell, 1997)。
  • 重要性:对于解决那些对人类来说过于复杂、难以通过固定程序编写和设计的任务,机器学习提供了一种强大的工具。它广泛应用于各个领域,如图像识别、语音识别、自然语言处理等。

1.2 机器学习的任务类型

  • 分类任务:计算机程序需要指定输入属于k个类别中的哪一个。例如,图像识别中,输入是图像,输出是识别出的物体类别。
  • 回归任务:计算机程序需要预测给定输入的数值。例如,预测保险索赔金额或未来证券价格。
  • 转录任务:观察某种数据的相对非结构化表示,并将其转录成离散文本形式。例如,光学字符识别和语音识别。
  • 机器翻译任务:将一种语言的符号序列转换为另一种语言的符号序列。例如,英语到法语的翻译。
  • 结构化输出任务:输出是一个向量(或其他包含多个值的数据结构),元素之间具有重要关系。例如,图像分割和图像标注。
  • 异常检测任务:在一组事件或对象中标记出那些不寻常或典型的。例如,信用卡欺诈检测。
  • 合成与采样任务:自动生成纹理、声音等。例如,语音合成。
  • 缺失值填充:预测输入中缺失的值。
  • 去噪:从损坏的输入中预测干净的示例。
  • 密度估计:学习输入数据的概率分布。

1.3 性能度量

  • 准确率:对于分类、分类与缺失输入、转录等任务,常用准确率来衡量模型性能。准确率是正确分类的示例比例。
  • 对数概率:对于密度估计等任务,常用平均对数概率来衡量模型性能。
  • 测试集:为了评估模型在未见过的数据上的性能,通常使用与训练集分开的测试集。

2. 监督学习与无监督学习

2.1 监督学习

  • 定义:监督学习算法观察一组包含特征和标签的示例,学习从特征预测标签。例如,使用标注了物种的鸢尾花数据集来训练分类算法。
  • 目标:估计条件概率分布p(y|x),即给定输入x时输出y的概率。

2.2 无监督学习

  • 定义:无监督学习算法只观察特征,不观察监督信号(标签)。目标通常是发现数据中的某些结构。
  • 任务:包括密度估计、聚类、降维等。例如,主成分分析(PCA)是一种无监督学习算法,用于数据降维。

2.3 半监督学习与多实例学习

  • 半监督学习:部分示例有监督目标,部分没有。
  • 多实例学习:整个示例集合被标注为包含或不包含某个类别的示例,但集合中的单个成员未被标注。

3. 学习算法的基本组件

3.1 数据集

  • 设计矩阵:一种常见的数据集描述方式,其中每行是一个示例,每列是一个特征。例如,鸢尾花数据集可以用一个150行4列的设计矩阵表示。
  • 异构数据:当示例不能用相同大小的向量表示时,数据集可以描述为一组元素。

3.2 成本函数

  • 定义:成本函数衡量模型在训练集上的性能。例如,线性回归中常用的均方误差(MSE)成本函数。
  • 优化:学习算法的目标是找到使成本函数最小化的参数。

3.3 模型

  • 定义:模型是算法学习的假设空间中的函数。例如,线性回归模型是输入x的线性函数。
  • 容量:模型的容量是指其拟合各种函数的能力。容量过低可能导致欠拟合,过高可能导致过拟合。

3.4 优化算法

  • 定义:优化算法用于找到使成本函数最小化的模型参数。例如,梯度下降算法。
  • 随机梯度下降(SGD):一种常用于大规模数据集的优化算法,通过在每个步骤中估计梯度来更新参数。

4. 线性回归示例

4.1 定义与输出

  • 定义:线性回归是一种解决回归问题的算法,输出是输入的线性函数。
  • 输出:ˆy = wx,其中w是参数向量,x是输入向量。

4.2 性能度量与成本函数

  • 均方误差(MSE):常用作线性回归的性能度量,定义为预测值与真实值之差的平方的平均值。
  • 成本函数:在训练过程中,算法的目标是最小化MSE成本函数。

4.3 正规方程

  • 定义:正规方程提供了一种直接求解线性回归参数的方法,而不需要迭代优化。
  • :w = (X^TX)^(-1)X^Ty,其中X是设计矩阵,y是目标向量。

5. 欠拟合与过拟合

5.1 定义

  • 欠拟合:模型在训练集上的误差较大,无法很好地拟合数据。
  • 过拟合:模型在训练集上表现很好,但在未见过的数据上表现很差。

5.2 容量与泛化能力

  • 容量:模型的容量决定了其拟合复杂函数的能力。容量过低导致欠拟合,过高导致过拟合。
  • 泛化能力:模型在未见过的数据上的性能称为泛化能力。

5.3 控制容量

  • 方法:通过选择假设空间(即模型类型)和调整模型参数的数量来控制容量。例如,增加多项式回归的度数可以增加容量。
  • 正则化:一种通过向成本函数添加惩罚项来控制容量的方法。例如,权重衰减(L2正则化)。

6. 交叉验证与模型选择

6.1 交叉验证

  • 定义:一种评估模型性能的方法,通过将数据集分成多个子集,轮流使用其中一部分作为测试集,其余部分作为训练集。
  • k折交叉验证:将数据集分成k个子集,进行k次训练和测试,每次使用不同的子集作为测试集。

6.2 验证集

  • 定义:一部分从训练集中分离出来的数据,用于调整模型参数(如正则化强度)。
  • 用途:帮助选择模型参数,避免直接使用测试集导致乐观估计。

7. 估计器、偏差与方差

7.1 点估计

  • 定义:提供单个“最佳”预测的估计方法。例如,线性回归中的权重估计。
  • 偏差:估计器的偏差是其期望值与真实值之差。无偏估计器的偏差为零。

7.2 方差

  • 定义:估计器的方差衡量其输出随数据集变化而变化的程度。
  • 标准误差:方差的平方根,用于估计真实期望值落在某个区间内的概率。

7.3 偏差-方差权衡

  • 定义:在偏差和方差之间进行权衡以最小化均方误差(MSE)。
  • U形曲线:随着模型容量的增加,偏差减小,方差增大,导致泛化误差呈现U形曲线。

8. 最大似然估计

8.1 定义

  • 最大似然估计(MLE):一种通过最大化观测数据似然来估计参数的方法。
  • 对数似然:为了方便计算,通常使用对数似然函数。

8.2 性质

  • 一致性:在适当条件下,最大似然估计量随着样本量的增加收敛到真实参数值。
  • 效率:在固定样本量下,最大似然估计量通常比其他估计量具有更低的均方误差。

8.3 线性回归与最大似然

  • 线性回归:可以解释为最大似然估计的一个特例,其中假设输出服从高斯分布。
  • 条件对数似然:在监督学习中,通常最大化条件对数似然。

9. 贝叶斯统计

9.1 定义

  • 贝叶斯统计:一种使用概率来反映知识状态的统计方法。与频率派统计不同,贝叶斯统计将参数视为随机变量。
  • 先验分布:在观察数据之前对参数的信念分布。

9.2 后验分布

  • 定义:通过贝叶斯定理结合先验分布和似然函数得到的后验分布。
  • 预测:使用后验分布进行预测,而不是单一的点估计。

9.3 最大后验估计(MAP)

  • 定义:一种结合先验信息和数据似然来找到单个点估计的方法。
  • 示例:线性回归中的权重衰减可以解释为最大后验估计。

10. 监督学习算法

10.1 概率监督学习

  • 定义:大多数监督学习算法基于估计条件概率分布p(y|x)。
  • 示例:线性回归和逻辑回归都是概率监督学习算法。

10.2 支持向量机(SVM)

  • 定义:一种用于分类和回归的监督学习模型。
  • 核技巧:通过将输入映射到高维空间来允许非线性决策边界。

10.3 k近邻算法

  • 定义:一种简单的非参数监督学习算法,通过查找训练集中最近的k个邻居来进行分类或回归。
  • 优点:能够处理高容量,但在小训练集上可能泛化能力差。

10.4 决策树

  • 定义:一种将输入空间分成多个区域的监督学习算法,每个区域有一个单独的参数。
  • 优点:易于理解和解释,但可能难以处理非线性决策边界。

11. 无监督学习算法

11.1 主成分分析(PCA)

  • 定义:一种用于数据降维和特征提取的无监督学习算法。
  • 目标:找到一个低维表示,尽可能保留原始数据的信息。

11.2 k均值聚类

  • 定义:一种将数据集分成k个簇的无监督学习算法。
  • 目标:最小化簇内点到簇中心的距离之和。

12. 深度学习与机器学习的关系

12.1 深度学习的动机

  • 传统机器学习的局限性:在高维空间中学习复杂函数时,传统机器学习算法面临泛化能力差和计算成本高的挑战。
  • 深度学习的优势:通过引入深度分布式表示,深度学习能够克服这些挑战,并在许多AI任务中取得显著效果。

12.2 深度学习的基本原理

  • 表示学习:深度学习算法能够自动学习数据的层次化表示,这些表示对于解决复杂任务非常有用。
  • 深层网络:通过堆叠多个非线性层,深度学习算法能够构建非常复杂的函数,从而捕捉数据中的复杂模式。

12.3 深度学习的应用

  • 图像识别:深度学习在图像识别领域取得了巨大成功,如卷积神经网络(CNN)在ImageNet竞赛中的表现。
  • 语音识别:深度学习在语音识别中的应用也取得了显著进展,如循环神经网络(RNN)和长短时记忆网络(LSTM)的应用。
  • 自然语言处理:深度学习在自然语言处理任务中表现出色,如机器翻译、文本生成等。

总结

本文详细介绍了机器学习的基础知识,包括机器学习的定义、任务类型、性能度量、监督学习与无监督学习、学习算法的基本组件等。通过线性回归示例,阐述了学习算法如何最小化成本函数以找到最佳参数。同时,讨论了欠拟合与过拟合的问题,以及如何通过控制模型容量和正则化来避免这些问题。此外,还介绍了交叉验证、模型选择、估计器、偏差与方差等概念,为读者提供了全面的机器学习知识框架。

在监督学习算法部分,本文介绍了概率监督学习、支持向量机、k近邻算法和决策树等常见算法。在无监督学习算法部分,介绍了主成分分析和k均值聚类等算法。这些算法为读者提供了解决不同类型问题的工具。

本文探讨了深度学习与机器学习的关系,阐述了深度学习的动机、基本原理和应用。通过与传统机器学习算法的比较,展示了深度学习在处理复杂任务时的优势。深度学习通过自动学习数据的层次化表示和构建复杂函数,能够在许多AI任务中取得显著效果。

相关文章:

【学习笔记】理解深度学习的基础:机器学习

1. 机器学习基础 1.1 机器学习的定义与重要性 定义:深度学习是机器学习的一种特定形式。为了深入理解深度学习,必须牢固掌握机器学习的基本原理。机器学习算法是一种能够从数据中学习的算法,通过经验E在任务T上提高性能度量P(Mi…...

提升租赁效率的租赁小程序全解析

内容概要 在如今快节奏的生活中,租赁小程序俨然成为了提升租赁效率的一把利器。无论是个人还是企业,都会因其便捷的功能而受益。简单来说,租赁小程序能让繁琐的租赁流程变得轻松、高效。在这里,我们将带您畅游租赁小程序的海洋&a…...

Windows自动化Python pyautogui RPA操作

依赖包 import time import pyautogui import pyperclip import os import psutil from pywinauto.application import Application睡眠: pyautogui.sleep(1)鼠标事件: pyautogui.moveTo(100, 100, duration0.25) pyautogui.click(100, 100, duration0.…...

蓝桥杯_B组_省赛_2022(用作博主自己学习)

题目链接算法11.九进制转十进制 - 蓝桥云课 进制转换 21.顺子日期 - 蓝桥云课 时间与日期 31.刷题统计 - 蓝桥云课 时间与日期 41.修剪灌木 - 蓝桥云课 思维 51.X 进制减法 - 蓝桥云课 贪心 61.统计子矩阵 - 蓝桥云课 二维前缀和 71.积木画 - 蓝桥云课 动态规划 82.扫雷 - 蓝桥…...

RK3568 Android 13 内置搜狗输入法小计

问:为什么写? 答:网上搜出来的都试过了,不行!下面直接上代码和注意事项! 首先到这个目录(/RK3568/Rockchip_Android13_SDK_Release/device/rockchip/rk356x/tl3568_evm/preinstall&#xff09…...

单片机Day1

目录 一.什么是单片机? 二.单片机的组成 三.封装形式 四.优势 五.分类 通用型: 专用型: 按处理的二进制位可以分为: 六.应用: 七.发展趋势 1.增加CPU的数据总线宽度。 2.存储器的发展。 3.片内1/0的改进 …...

《机器学习》之贝叶斯(Bayes)算法

目录 一、前言 二、贝叶斯算法原理解析 1、贝叶斯公式 2、朴素贝叶斯算法 3、计算步骤 4、例题: (1)、 计算先验概率 (2)、计算条件概率 (3)、计算后验概率 (4)…...

Redis实现高效的负载均衡算法

1. Redis存储设计 我们需要在 Redis 中存储以下信息&#xff1a; 配置列表&#xff08;List<Config>&#xff09;&#xff1a;存储所有配置项。总权重&#xff1a;存储所有配置的总权重。当前轮询状态&#xff1a;存储当前的轮询状态&#xff08;如当前随机值或索引&am…...

虚拟文件系统 VFS

目录 虚拟文件系统 VFS 文件系统挂载过程 虚拟文件系统 VFS 统一标准的系统调用接口&#xff1a; VFS定义了一组标准的文件操作API&#xff0c;如open(), read(), write(), close()等&#xff0c;使得用户空间的应用程序无需关心底层文件系统的具体类型。 下层文件系统必须实现…...

基于Android的民宿租赁系统的设计与实现

博主介绍&#xff1a;java高级开发&#xff0c;从事互联网行业多年&#xff0c;熟悉各种主流语言&#xff0c;精通java、python、php、爬虫、web开发&#xff0c;已经做了多年的设计程序开发&#xff0c;开发过上千套设计程序&#xff0c;没有什么华丽的语言&#xff0c;只有实…...

数据链路层-STP

生成树协议STP&#xff08;Spanning Tree Protocol&#xff09; 它的实现目标是&#xff1a;在包含有物理环路的网络中&#xff0c;构建出一个能够连通全网各节点的树型无环逻辑拓扑。 选举根交换机&#xff1a; 选举根端口&#xff1a; 选举指定端口&#xff1a; 端口名字&…...

OceanBase环境搭建与熟悉全攻略:开启分布式数据库探索之旅

《OceanBase环境搭建与熟悉全攻略&#xff1a;开启分布式数据库探索之旅》 在当今数字化浪潮汹涌澎湃的时代&#xff0c;数据量呈爆炸式增长&#xff0c;业务对数据库的性能、可靠性和扩展性提出了前所未有的要求。OceanBase作为一款极具创新性的分布式数据库&#xff0c;正逐…...

tensor core实现flash_attn_mma_share_kv源码分析

一 源码分析 1.1 函数入口 void flash_attn_mma_stages_split_q_shared_kv(torch::Tensor Q, torch::Tensor K, torch::Tensor V, torch::Tensor O, int stages) {CHECK_TORCH_TENSOR_DTYPE(Q, torch::kHalf) // Q [B,H,N,D]CHECK_TORCH_TENSOR_DTYPE(K, torch::kHalf) // K …...

【源码解析】Java NIO 包中的 MappedByteBuffer

文章目录 1. 前言2. MappedByteBuffer3. 例子4. 属性5. 构造器6. mappingOffset、mappingAddress、mappingLength7. isLoaded 判断内存是否还在内存中8. load 方法将 ByteBuffer 加载到 Page Cache 中9. force 刷盘 1. 前言 上一篇文章我们介绍了 HeapByteBuffer 的源码&#…...

【Docker系列】容器内目录显示异常的解决之道

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

echarts:dataZoom属性横向滚动条拖拽不生效

问&#xff1a; 拖拽的过程中&#xff0c;第一次向右拖拽正常&#xff0c;然后就报错&#xff1a; echarts报错&#xff1a; var pointerOption pointerShapeBuilder[axisPointerType](axis,pixeValue,otherExtent),(axis,pixeValue,otherExtent)下划线红色报错&#xff1a;…...

25/1/12 算法笔记 剖析Yolov8底层逻辑

YOLOv8 是一种基于深度学习的目标检测和图像分割模型&#xff0c;属于 YOLO&#xff08;You Only Look Once&#xff09;系列的最新版本。YOLO 系列模型以其高效的实时目标检测能力而闻名&#xff0c;YOLOv8 在此基础上进行了一些优化和改进。 Yolov8的主要特点&#xff1a; …...

Python双指针

双指针 双指针&#xff1a;在区间操作时&#xff0c;利用两个下标同时遍历&#xff0c;进行高效操作 双指针利用区间性质可以把 O ( n 2 ) O(n^2) O(n2) 时间降低到 O ( n ) O(n) O(n) 反向扫描 反向扫描&#xff1a; l e f t left left 起点&#xff0c;不断往右走&…...

1、docker概念和基本使用命令

docker概念 微服务&#xff1a;不再是以完整的物理机为基础的服务软件&#xff0c;而是借助于宿主机的性能。以小量的形式&#xff0c;单独部署的应用。 docker&#xff1a;是一个开源的应用容器引擎&#xff0c;基于go语言开发的&#xff0c;使用时apache2.0的协议。docker是…...

数据结构与算法之链表: LeetCode 92. 反转链表 II (Ts版)

反转链表 II https://leetcode.cn/problems/reverse-linked-list-ii/description/ 描述 给你单链表的头指针 head 和两个整数 left 和 right &#xff0c;其中 left < right请你反转从位置 left 到位置 right 的链表节点&#xff0c;返回 反转后的链表 示例 1 输入&…...

【PPTist】插入形状、插入图片、插入图表

一、插入形状 插入形状有两种情况&#xff0c;一种是插入固定的形状&#xff0c; 一种是插入自定义的形状。 插入固定的形状时&#xff0c;跟上一篇文章 绘制文本框 是一样一样的&#xff0c;都是调用的 mainStore.setCreatingElement() 方法&#xff0c;只不多传的类型不一…...

三台Centos7.9中Docker部署Redis集群

Docker部署Redis集群 1. 安装 Docker 和 Docker Compose安装 Docker&#xff1a;安装 Docker Compose&#xff1a; 2. 配置 Redis 容器和网络3. 启动 Redis 容器4. 设置 Redis 集群4.1 集群创建异常处理 5. 验证和测试总结 如果 CentOS 服务器上还没有安装 Docker 和 Docker Co…...

Entity 的材质(棋盘、条纹、网格)

Entity 的材质 普通物体的材质 import { nextTick, onMounted, ref } from vue import * as Cesium from cesium // console.log(Cesium, Cesium)const viewer ref<any>(null)onMounted(() > { ... })let material Cesium.Color.YELLOW.withAlpha(0.5)Cesium.Colo…...

MACPA:fMRI连接性分析的新工具

摘要 不同脑区的共同激活为它们之间的功能交互或连接提供了一个有价值的衡量指标。元分析连接模型(MACM)是一种经过充分验证的研究某一特定区域共激活模式的方法&#xff0c;该方法对基于任务的功能磁共振成像(task-fMRI)数据进行种子点(seed-based)元分析。虽然MACM是一种强大…...

JavaScript-一份你的前端入门说明书(计算机专业)

一.简介 1.起源 JavaScript 起源于 1995 年,当时它主要是为了满足网页交互的需求而被创建。它最初的设计目的是为了让网页开发者能够在网页中添加一些简单的交互效果和动态内容。在那个时期,网页大多是静态的,而 JavaScript 的出现为网页带来了新的活力。Netscape 公司的 B…...

STM32供电参考设计

STM32供电参考设计 ​ 在图中有VDD&#xff0c;VSS和VDDA&#xff0c;VSSA两种类型的供电引脚&#xff0c;其数据手册解释如下&#xff1a; ​ 令我不解的是&#xff1a;VDDA和VSSA必须分别连接到VDD和VSS&#xff0c;这是什么意思&#xff1f;有大佬能够解答一下吗&#xff1f…...

python+fpdf:创建pdf并实现表格数据写入

目录 创建pdf文件对象 新增页 添加自定义字体 设置字体 设置文字颜色和背景色 插入内容 换行 插入图片 保存pdf 完整代码 安装&#xff1a;pip install fpdf 创建pdf文件对象 from fpdf import FPDF, Alignpdf FPDF() # 创建pdf文件对象 获取边距 print(pdf.l_…...

亚远景-ASPICE评估:汽车软件项目的过程能力评价

ASPICE&#xff08;Automotive SPICE&#xff09;的评估对象主要是汽车软件研发过程。 这个评估过程不仅仅关注最终的软件产品&#xff0c;而是深入到软件开发的全生命周期中&#xff0c;从需求分析、设计、编码、测试到发布和维护等各个环节。 具体来说&#xff0c;ASPICE评…...

电脑提示directx错误导致玩不了游戏怎么办?dx出错的解决方法

想必大家都有过这样的崩溃瞬间&#xff1a;满心欢喜打开心仪的游戏&#xff0c;准备在虚拟世界里大杀四方或者畅游冒险&#xff0c;结果屏幕上突然弹出个 DirectX 错误的提示框&#xff0c;紧接着游戏闪退&#xff0c;一切美好戛然而止。DirectX 作为 Windows 系统下游戏运行的…...

【13】制作镜像以及重启实例

制作镜像 k8s集群 有两个镜像需要制作&#xff0c;一个是master节点&#xff0c;一个是node节点。 在master节点上成功部署了k8s的控制平面&#xff0c;在node节点上部署了worker节点的配置&#xff0c;不知道打包镜像重启之后集群的状态是什么样的。 确认集群在运行&#…...

高端建站价格/俄罗斯搜索引擎yandex推广入口

经过你自己的学习&#xff0c;相信你们你对vue与react已经有了一些了解&#xff0c;也觉得这两大框架有一些相同之处。那咱们就来谈一下你觉得这两大框架有什么地方是不太一样的&#xff1f; 我觉得最大的相同点就是虚拟DOM节点&#xff0c;react与vue只有框架的骨架&#xff…...

广告创意设计培训/seo推广人员

使用C#进行网络编程时&#xff0c;通常要用到&#xff1a; System. Net 命名空间、 System. Net. Sockets 命名空间、 System. Net. Mail 命名空间。 24.2.1 System. Net 命名空间及相关类的使用 System. Net 命名空间为当前网络上使用的多种协议提供了简单的编程接口。 它所…...

手机制作网站的软件有哪些/网络营销服务公司

一、数据描述基本统计描述可以用来识别数据的性质&#xff0c;凸显哪些数据值应该视为噪声或离群点。中心趋势度量 &#xff1a;均值、中位数、众数&#xff1b;度量数据散步&#xff1a;极差、四分位数、方差、标准差和四分位数极差、变异系数&#xff1b;数据的基本统计描述的…...

做网站如何容易被百度抓取/wordpress自助建站

一般来说&#xff0c;素材自身的 Alpha 通道定义着图层的透明度信息。单击查看器面板下方的“显示通道及色彩管理设置”按钮&#xff0c;可选择查看当前图层的 Alpha 通道。单击“切换透明网格”按钮&#xff0c;可以查看图层的透明区域。蒙版与遮罩&#xff0c;都是通过定义图…...

网站建设 服务器/网页设计模板免费网站

为什么80%的码农都做不了架构师&#xff1f;>>> ‍ Viktor Grebenyuk是一名质量保证专家和测试经理&#xff0c;在测试复杂的&#xff08;主要是金融领域的&#xff09;系统和应用程序方面有八年以上的经验。他丰富的经验让他可以&#xff1a;比较不同的测试工具和…...

wordpress优势/如何推广一个产品

报名时间未定 080720 软件工程 [独立本科段] 考试时间2018-04-14上午 09:00-11:3003708 中国近现代史纲要07163 高级数据库技术 //报07167 多媒体计算机技术下午 14:30-17:0003709 马克思主义基本原理概论07169 软件开发工具与环境 //报2018-04-15上午 09:00-11:3002141 计算机…...