人工智能基础--AI作业1-ML基础
1.监督学习和无监督学习都是机器学习中常用的方法。
监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习,从而预测未知的数据。
无监督学习则是一种机器学习方法,其中机器学习算法使用没有标签的输入数据进行训练,以学习数据的隐藏结构和模式。简单来说,无监督学习就是对未知的数据进行学习,从中找到其内在的规律和关系。
2.分类和回归都是机器学习中的基本概念。
分类是指将数据分成不同的类别或标签。例如,将电子邮件分类为“垃圾邮件”或“非垃圾邮件”,将数字图像分类为“狗”或“猫”。分类问题的目标是通过训练一个模型,使其能够自动地将新的输入数据分到正确的类别中。
回归是指对数据进行预测,以输出一个连续的数值。例如,预测房价、销售额等。回归问题的目标是通过训练一个模型,使其能够自动地预测给定输入的输出值。回归问题通常涉及到连续的输出值和输入值之间的关系建模,如线性回归、多项式回归等。
总的来说,分类和回归是机器学习中最常用的两种基本问题类型,两者的主要区别在于输出值的类型。
3.聚类和降维都是机器学习中的基本概念。
聚类是指将数据分成不同的组,每组中的数据都具有相似的特征。例如,将客户根据他们的购买行为分为不同的群组,将文本数据中的相似文章分为一组。聚类问题的目标是将相似的数据聚集在一起,使得组内的数据相似度尽可能高,组间的数据相似度尽可能低。
降维是指将数据的维度从高维度空间降低到低维度空间,同时保留数据的重要信息。例如,将图片从RGB颜色空间转换为灰度颜色空间,将高维度的文本数据转换为低维度的向量表示。降维问题的目标是减少数据的冗余信息和计算成本,同时保留数据的主要特征,以便更好地理解和处理数据。
总的来说,聚类和降维是机器学习中常用的两种数据分析方法,两者都是为了更好地理解和处理数据。
4.损失函数是用来衡量机器学习模型预测结果与真实结果之间差距的一种函数。
在机器学习中,我们通过训练模型来使其能够自动地从数据中学习到模式和规律。而损失函数则是衡量模型预测结果与真实结果之间的差距的一种方法。通常来说,损失函数越小,模型的预测结果就越接近真实结果。
例如,在分类问题中,常用的损失函数是交叉熵损失函数,它可以衡量模型的预测结果与真实结果之间的差异。在回归问题中,常用的损失函数是均方误差损失函数,它可以衡量模型的预测结果与真实结果之间的平均差距。
总的来说,损失函数在机器学习中扮演着非常重要的角色,它帮助我们评估模型的性能,并且优化模型的参数,以使得模型能够更好地适应数据。
5.在机器学习中,我们通常会将数据集分成训练集、测试集和验证集三部分。
训练集是用来训练模型的数据集,模型通过学习训练集中的数据来建立模式和规律。通常来说,训练集占总数据集的比例很高,通常为 60% - 80%。
测试集是用来评估模型性能的数据集,模型在测试集上进行测试,以评估其对未见过的数据的泛化能力。通常来说,测试集占总数据集的比例较小,通常为 10% - 20%。
验证集是用来调整模型参数的数据集,通过验证集上的评估结果来选择模型最佳参数,以避免模型在测试集上出现过拟合或欠拟合的情况。通常来说,验证集占总数据集的比例也比较小,通常为 10% - 20%。
总的来说,训练集、测试集和验证集都是机器学习中非常重要的数据集,它们帮助我们训练出更加准确和泛化能力更强的模型。同时,需要注意的是,训练集、测试集和验证集的划分应该是随机的,并且要保证数据集的代表性和平衡性。
6.过拟合和欠拟合都是机器学习中模型性能不佳的情况。
过拟合指的是模型在训练集上表现非常好,但在测试集上表现很差的情况。这是因为模型在训练过程中过于关注训练集中的细节和噪声,导致其无法泛化到新数据上。过拟合的解决方法包括增加数据量、减小模型复杂度、添加正则化等。
欠拟合指的是模型在训练集和测试集上的表现都很差,这意味着模型无法很好地捕捉数据中的规律和模式。这可能是因为模型太过简单,或者数据中存在着复杂的模式和规律。欠拟合的解决方法包括增加模型复杂度、增加特征数量、改进数据预处理等。
总的来说,过拟合和欠拟合都是机器学习中需要解决的问题,我们需要通过合适的方法和技术来避免或解决它们,以获得更好的模型性能。
7.经验风险和期望风险是机器学习中用来衡量模型性能的两个概念。
经验风险指的是模型在训练集上的表现,也就是模型对于已经见过的数据的预测能力。通常来说,经验风险越小,表示模型在训练集上的表现越好。
期望风险指的是模型在所有可能出现的情况下的表现,也就是模型对于未见过的数据的预测能力。通常来说,期望风险越小,表示模型的泛化能力越强,即能够更好地适应新数据。
在机器学习中,我们的目标是使模型的期望风险最小化,也就是让模型在未见过的数据上的表现最好。为了达到这个目标,我们需要通过训练集来优化模型的参数,以使得模型在训练集上的经验风险尽可能地小,从而提高其泛化能力。
总的来说,经验风险和期望风险都是机器学习中非常重要的概念,它们帮助我们评估和优化模型的性能,从而提高模型的泛化能力。
相关文章:

人工智能基础--AI作业1-ML基础
1.监督学习和无监督学习都是机器学习中常用的方法。监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习&#…...

关于JS中this对象指向问题总结
一、前言 关于JS中this对象指向问题,相信做过项目的小伙伴多多少少都会遇到过,明明感觉代码写的没问题,可是运行的时候,就会报错,比如报错 xxx is not a function。 我最近也遇到了,百度学习了不少前辈对于…...

Codeforces Round 855 (Div. 3) A-E2
比赛链接:Dashboard - Codeforces Round 855 (Div. 3) - Codeforces A:模拟 题意:给定一个字符串,问这个字符串是不是猫叫。定义是猫叫得字符串: 1:必须由大写或小写得M(m),E&…...

Spark Yarn 运行环境搭建
文章目录Spark Yarn 运行环境搭建1、解压缩文件2、修改配置环境文件3、配置历史服务器Spark Yarn 运行环境搭建 1、解压缩文件 将spark3.2.3的压缩包上传到 linux /opt/software 目录下 输入命令: tar -zxvf spark-3.2.3-bin-hadoop3.2-scala2.13.tgz -C /opt/ 解…...

SpringMVC 页面跳转指南:转发和重定向的实现与比较
SpringMVC 是一款非常流行的 Java Web 框架,它提供了丰富的特性和功能,使得开发者可以轻松地开发 Web 应用程序。其中,转发和重定向是 SpringMVC 中非常常见的两个操作,它们可以用于控制请求的流转和页面的跳转。本文将深入探讨 S…...

ModStartCMS v5.9.0 后台浅色模式,系统样式升级
ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…...

2020蓝桥杯真题反倍数 C语言/C++
题目描述 给定三个整数 a,b,c,如果一个整数既不是 a 的整数倍也不是 b 的整数倍还不是 c 的整数倍,则这个数称为反倍数。 请问在 1 至 n 中有多少个反倍数。 输入描述 输入的第一行包含一个整数 n。 第二行包含三个整数a,b,c,相邻两个数之…...

PTA:L1-025 正整数A+B、L1-026 I Love GPLT、L1-027 出租(C++)
目录 L1-025 正整数AB 问题描述: 实现代码: L1-026 I Love GPLT 问题描述: 实现代码: L1-027 出租 问题描述: 实现代码: 原理思路: 出租那道题有点意思哈 L1-025 正整数AB 问题描述…...

状态机的Go语言实现版本
一、状态机 1. 定义 有限状态机(Finite-state machine, FSM),简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。 2. 组成要素 现态(src state):事务当前所处的状…...

第2章 线程安全与共享资源竞争
第2章 线程安全与共享资源竞争 2.1 synchronized同步介绍 synchronized要解决的是共享资源冲突的问题。当共享资源被任务使用时,要对资源提前加锁。所有任务都采用抢占模式,即某个任务会抢先对共享资源加上第一把锁。如果这是一个排他锁,…...

77. writerows写入多行
文章目录1. 目标任务2. 准备工作3. writerow单行写入4. writerows多行写入5. a以追加的模式写入值6. 总结1. 目标任务 新建【各班级成绩】文件夹; 在该文件夹下新建一个【1班成绩单.csv】文件; 在该文件中写入下面的内容: 成绩 姓名 刘一…...

STM32MP157-Linux输入设备应用编程-多点触摸屏编程
文章目录前言多点触摸屏tslib库简介tslib库移植tslib库函数使用打开触摸屏设备配置触摸屏设备打开并配置触摸屏设备读取触摸屏设备多点触摸屏程序编写触点数据结构体定义事件定义计算触点数量判断单击、双击判断长按、移动判断放大、缩小外部调用代码流程图(草图&am…...

mybatis-plus的一般实现过程(超详细)
MyBatis-Plus 是 MyBatis 的增强工具,在 MyBatis 的基础上提供了许多实用的功能,如分页查询、条件构造器、自动填充等。下面是 MyBatis-Plus 的完整代码实现流程: ①、引入 MyBatis-Plus 依赖 在 Maven 中,可以通过以下方式引入 …...

Spark(5):RDD概述
目录 0. 相关文章链接 1. 什么是RDD 2. RDD核心属性 3. 执行原理 0. 相关文章链接 Spark文章汇总 1. 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据处理模型。代码中是一个抽象类&#x…...

面向对象 - 继承
Hello , 各位同学朋友大家好啊, 今天给大家分享的技术呢, 是面向对象三大特征之一的继承,我们今天主要按照以下几个点, 展开继承的讲解。目录 :* 继承的介绍* 继承的好处和弊端* 继承中成员访问特点 - 成员变量* 继承中成员访问特点 - 成员方法* 方法重写* 继承中成…...

计算机网络的166个概念你知道几个 第十二部分
计算机网络安全安全通信的四大要素:机密性、保温完整性、端点鉴别和运行安全性。机密性:报文需要在一定程度上进行加密,用来防止窃听者截取报文。报文完整性:在报文传输过程中,需要确保报文的内容不会发生改变。端点鉴…...

【RabbitMQ】RabbitMQ各版本的兼容性与技术支持时限
今天在研究RabbitMQ的监控时,发现这个消息队列软件的版本真的很令人崩溃,版本众多,且组件之间还存在版本的兼容性,此外各个组件还对操作系统存在兼容性关系。为了帮大家节省一些查阅官方文档的时间,我把官方文档里面涉…...

【Git】P5 Git 远程仓库(3)pull 发生冲突
pull 发生冲突冲突在什么场景下发生?为什么要先 pull 再 push构建一个冲突场景初始开始操作:程序员2:程序员1:程序员2:发生冲突:查看冲突:解决冲突:冲突在什么场景下发生?…...

关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解
关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解前言一、各坐标系的含义二、坐标系转换1.世界坐标系与相机坐标系(旋转与平移)2.相机坐标系与图像坐标系(透视)3.图像坐标系与像素坐…...

企业防护ddos的注意事项,你知道吗?
DDoS,分布式拒绝服务攻击,是指处于不同位置的多个攻击者同时向一个或数个目标发动攻击,或者一个攻击者控制了位于不同位置的多台机器并利用这些机器对受害者同时实施攻击。在当下,DDoS 攻击是非常常见的一种攻击方式,大…...

RocketMQ如何测试
RocketMQ如何测试MQ简介RocketMQRocketMQ测试点MQ简介 MQ:Message Queue,即消息队列,是一种应用程序之间的消息通信,简单理解就是A服务不断的往队列里发布信息,另一服务B从队列中读取消息并执行处理,消息发…...

SpringBoot中的bean注入方式和原理介绍
Spring Boot是一个非常流行的Java框架,它可以帮助开发者快速地构建高效、健壮的应用程序。其中一个重要的功能就是依赖注入,也就是将一个对象注入到另一个对象中,以便它们可以相互协作。在Spring Boot中,依赖注入是通过bean实现的…...

ESP32设备驱动-RFID-RC522模块驱动
RFID-RC522模块驱动 文章目录 RFID-RC522模块驱动1、RFID-RC522介绍2、硬件准备3、软件准备4、驱动实现1、RFID-RC522介绍 基于 NXP 的 MFRC522 IC 的 RC522 RFID 模块通常带有一个 RFID 卡标签和具有 1KB 内存的密钥卡标签。 最重要的是,它可以写一个标签,这样你就可以在里…...

SMETA认证有些客户是需要做窗口期的
【SMETA认证有些客户是需要做窗口期的】SMETA审核是常见的社会责任审核标准之一,中文全称为“Sedex 会员道德贸易审核”,英文为“Sedex Members Ethical Trade Audit”. SEDEX 官网:网页链接Sedex 作为目前市场流行的CSR审核标准,…...

面向对象设计模式:创建型模式之原型模式
文章目录一、引入二、代理模式,Prototype Pattern2.1 Intent 意图2.2 Applicability 适用性2.3 类图2.4 应用实例:使用下划线或消息框展示字符串2.4 应用实例:JDK java.lang.Object java.lang.Cloneable一、引入 二、代理模式,Pr…...

三维重建(单目、双目、多目、点云、SFM、SLAM)
1 相机几何与标定1.1 相机模型中的坐标系1.2 四种坐标系之间的转换1.3 相机内参1.4 相机标定2 单目三维重建2.1 NeuralRecon三维重建定义 在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识. 而…...

Java中的final和权限修饰符
目录 final 常量 细节: 权限修饰符 Java权限修饰符用于控制类、方法、变量的访问范围。Java中有四种权限修饰符: 权限修饰符的使用场景: final 方法 表明该方法是最终方法,不能被重写。类 表明该类是最终类,不能被继…...

MySQL的基本语句(SELECT型)
基本MySQL语句SELECTSELECT FROM 列的别名去除重复行空值着重号算术运算符加法( )减法( - )乘法( * )除法( / 或DIV)求模( % 或MOD)比较运算符等于( )安全等于( <> )不等于( ! 或 <…...

日志服务搭建-ES-FileBeat-Kibana
1次订单量突增问题,导致了有几个数据没有录库,但是确有支付的记录,啥玩意,还能有这个操作,组内安排问题定位,解决,一看打出来的日志,只有支付有,生成订单这边没有&#x…...

大数据架构设计与数据计算流程
大数据架构设计Hadoop有3个核心组件:分布式文件系统HDFS;分布式运算编程框架MapReduce;分布式资源调度平台YARN。HBase,Hadoop dataBase,基于HDFS的NoSQL数据库,面向列式的内存存储,定期将内存数…...