当前位置: 首页 > news >正文

人工智能基础--AI作业1-ML基础

1.监督学习和无监督学习都是机器学习中常用的方法。

监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习,从而预测未知的数据。

无监督学习则是一种机器学习方法,其中机器学习算法使用没有标签的输入数据进行训练,以学习数据的隐藏结构和模式。简单来说,无监督学习就是对未知的数据进行学习,从中找到其内在的规律和关系。

2.分类和回归都是机器学习中的基本概念。

分类是指将数据分成不同的类别或标签。例如,将电子邮件分类为“垃圾邮件”或“非垃圾邮件”,将数字图像分类为“狗”或“猫”。分类问题的目标是通过训练一个模型,使其能够自动地将新的输入数据分到正确的类别中。

回归是指对数据进行预测,以输出一个连续的数值。例如,预测房价、销售额等。回归问题的目标是通过训练一个模型,使其能够自动地预测给定输入的输出值。回归问题通常涉及到连续的输出值和输入值之间的关系建模,如线性回归、多项式回归等。

总的来说,分类和回归是机器学习中最常用的两种基本问题类型,两者的主要区别在于输出值的类型。

3.聚类和降维都是机器学习中的基本概念。

聚类是指将数据分成不同的组,每组中的数据都具有相似的特征。例如,将客户根据他们的购买行为分为不同的群组,将文本数据中的相似文章分为一组。聚类问题的目标是将相似的数据聚集在一起,使得组内的数据相似度尽可能高,组间的数据相似度尽可能低。

降维是指将数据的维度从高维度空间降低到低维度空间,同时保留数据的重要信息。例如,将图片从RGB颜色空间转换为灰度颜色空间,将高维度的文本数据转换为低维度的向量表示。降维问题的目标是减少数据的冗余信息和计算成本,同时保留数据的主要特征,以便更好地理解和处理数据。

总的来说,聚类和降维是机器学习中常用的两种数据分析方法,两者都是为了更好地理解和处理数据。

4.损失函数是用来衡量机器学习模型预测结果与真实结果之间差距的一种函数。

在机器学习中,我们通过训练模型来使其能够自动地从数据中学习到模式和规律。而损失函数则是衡量模型预测结果与真实结果之间的差距的一种方法。通常来说,损失函数越小,模型的预测结果就越接近真实结果。

例如,在分类问题中,常用的损失函数是交叉熵损失函数,它可以衡量模型的预测结果与真实结果之间的差异。在回归问题中,常用的损失函数是均方误差损失函数,它可以衡量模型的预测结果与真实结果之间的平均差距。

总的来说,损失函数在机器学习中扮演着非常重要的角色,它帮助我们评估模型的性能,并且优化模型的参数,以使得模型能够更好地适应数据。

5.在机器学习中,我们通常会将数据集分成训练集、测试集和验证集三部分。

训练集是用来训练模型的数据集,模型通过学习训练集中的数据来建立模式和规律。通常来说,训练集占总数据集的比例很高,通常为 60% - 80%。

测试集是用来评估模型性能的数据集,模型在测试集上进行测试,以评估其对未见过的数据的泛化能力。通常来说,测试集占总数据集的比例较小,通常为 10% - 20%。

验证集是用来调整模型参数的数据集,通过验证集上的评估结果来选择模型最佳参数,以避免模型在测试集上出现过拟合或欠拟合的情况。通常来说,验证集占总数据集的比例也比较小,通常为 10% - 20%。

总的来说,训练集、测试集和验证集都是机器学习中非常重要的数据集,它们帮助我们训练出更加准确和泛化能力更强的模型。同时,需要注意的是,训练集、测试集和验证集的划分应该是随机的,并且要保证数据集的代表性和平衡性。

6.过拟合和欠拟合都是机器学习中模型性能不佳的情况。

过拟合指的是模型在训练集上表现非常好,但在测试集上表现很差的情况。这是因为模型在训练过程中过于关注训练集中的细节和噪声,导致其无法泛化到新数据上。过拟合的解决方法包括增加数据量、减小模型复杂度、添加正则化等。

欠拟合指的是模型在训练集和测试集上的表现都很差,这意味着模型无法很好地捕捉数据中的规律和模式。这可能是因为模型太过简单,或者数据中存在着复杂的模式和规律。欠拟合的解决方法包括增加模型复杂度、增加特征数量、改进数据预处理等。

总的来说,过拟合和欠拟合都是机器学习中需要解决的问题,我们需要通过合适的方法和技术来避免或解决它们,以获得更好的模型性能。

7.经验风险和期望风险是机器学习中用来衡量模型性能的两个概念。

经验风险指的是模型在训练集上的表现,也就是模型对于已经见过的数据的预测能力。通常来说,经验风险越小,表示模型在训练集上的表现越好。

期望风险指的是模型在所有可能出现的情况下的表现,也就是模型对于未见过的数据的预测能力。通常来说,期望风险越小,表示模型的泛化能力越强,即能够更好地适应新数据。

在机器学习中,我们的目标是使模型的期望风险最小化,也就是让模型在未见过的数据上的表现最好。为了达到这个目标,我们需要通过训练集来优化模型的参数,以使得模型在训练集上的经验风险尽可能地小,从而提高其泛化能力。

总的来说,经验风险和期望风险都是机器学习中非常重要的概念,它们帮助我们评估和优化模型的性能,从而提高模型的泛化能力。

相关文章:

人工智能基础--AI作业1-ML基础

1.监督学习和无监督学习都是机器学习中常用的方法。监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习&#…...

关于JS中this对象指向问题总结

一、前言 关于JS中this对象指向问题,相信做过项目的小伙伴多多少少都会遇到过,明明感觉代码写的没问题,可是运行的时候,就会报错,比如报错 xxx is not a function。 我最近也遇到了,百度学习了不少前辈对于…...

Codeforces Round 855 (Div. 3) A-E2

比赛链接:Dashboard - Codeforces Round 855 (Div. 3) - Codeforces A:模拟 题意:给定一个字符串,问这个字符串是不是猫叫。定义是猫叫得字符串: 1:必须由大写或小写得M(m),E&…...

Spark Yarn 运行环境搭建

文章目录Spark Yarn 运行环境搭建1、解压缩文件2、修改配置环境文件3、配置历史服务器Spark Yarn 运行环境搭建 1、解压缩文件 将spark3.2.3的压缩包上传到 linux /opt/software 目录下 输入命令: tar -zxvf spark-3.2.3-bin-hadoop3.2-scala2.13.tgz -C /opt/ 解…...

SpringMVC 页面跳转指南:转发和重定向的实现与比较

SpringMVC 是一款非常流行的 Java Web 框架,它提供了丰富的特性和功能,使得开发者可以轻松地开发 Web 应用程序。其中,转发和重定向是 SpringMVC 中非常常见的两个操作,它们可以用于控制请求的流转和页面的跳转。本文将深入探讨 S…...

ModStartCMS v5.9.0 后台浅色模式,系统样式升级

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…...

2020蓝桥杯真题反倍数 C语言/C++

题目描述 给定三个整数 a,b,c,如果一个整数既不是 a 的整数倍也不是 b 的整数倍还不是 c 的整数倍,则这个数称为反倍数。 请问在 1 至 n 中有多少个反倍数。 输入描述 输入的第一行包含一个整数 n。 第二行包含三个整数a,b,c,相邻两个数之…...

PTA:L1-025 正整数A+B、L1-026 I Love GPLT、L1-027 出租(C++)

目录 L1-025 正整数AB 问题描述: 实现代码: L1-026 I Love GPLT 问题描述: 实现代码: L1-027 出租 问题描述: 实现代码: 原理思路: 出租那道题有点意思哈 L1-025 正整数AB 问题描述…...

状态机的Go语言实现版本

一、状态机 1. 定义 有限状态机(Finite-state machine, FSM),简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。 2. 组成要素 现态(src state):事务当前所处的状…...

第2章 线程安全与共享资源竞争

第2章 线程安全与共享资源竞争 2.1 synchronized同步介绍 synchronized要解决的是共享资源冲突的问题。当共享资源被任务使用时,要对资源提前加锁。所有任务都采用抢占模式,即某个任务会抢先对共享资源加上第一把锁。如果这是一个排他锁,…...

77. writerows写入多行

文章目录1. 目标任务2. 准备工作3. writerow单行写入4. writerows多行写入5. a以追加的模式写入值6. 总结1. 目标任务 新建【各班级成绩】文件夹; 在该文件夹下新建一个【1班成绩单.csv】文件; 在该文件中写入下面的内容: 成绩 姓名 刘一…...

STM32MP157-Linux输入设备应用编程-多点触摸屏编程

文章目录前言多点触摸屏tslib库简介tslib库移植tslib库函数使用打开触摸屏设备配置触摸屏设备打开并配置触摸屏设备读取触摸屏设备多点触摸屏程序编写触点数据结构体定义事件定义计算触点数量判断单击、双击判断长按、移动判断放大、缩小外部调用代码流程图(草图&am…...

mybatis-plus的一般实现过程(超详细)

MyBatis-Plus 是 MyBatis 的增强工具,在 MyBatis 的基础上提供了许多实用的功能,如分页查询、条件构造器、自动填充等。下面是 MyBatis-Plus 的完整代码实现流程: ①、引入 MyBatis-Plus 依赖 在 Maven 中,可以通过以下方式引入 …...

Spark(5):RDD概述

目录 0. 相关文章链接 1. 什么是RDD 2. RDD核心属性 3. 执行原理 0. 相关文章链接 Spark文章汇总 1. 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据处理模型。代码中是一个抽象类&#x…...

面向对象 - 继承

Hello , 各位同学朋友大家好啊, 今天给大家分享的技术呢, 是面向对象三大特征之一的继承,我们今天主要按照以下几个点, 展开继承的讲解。目录 :* 继承的介绍* 继承的好处和弊端* 继承中成员访问特点 - 成员变量* 继承中成员访问特点 - 成员方法* 方法重写* 继承中成…...

计算机网络的166个概念你知道几个 第十二部分

计算机网络安全安全通信的四大要素:机密性、保温完整性、端点鉴别和运行安全性。机密性:报文需要在一定程度上进行加密,用来防止窃听者截取报文。报文完整性:在报文传输过程中,需要确保报文的内容不会发生改变。端点鉴…...

【RabbitMQ】RabbitMQ各版本的兼容性与技术支持时限

今天在研究RabbitMQ的监控时,发现这个消息队列软件的版本真的很令人崩溃,版本众多,且组件之间还存在版本的兼容性,此外各个组件还对操作系统存在兼容性关系。为了帮大家节省一些查阅官方文档的时间,我把官方文档里面涉…...

【Git】P5 Git 远程仓库(3)pull 发生冲突

pull 发生冲突冲突在什么场景下发生?为什么要先 pull 再 push构建一个冲突场景初始开始操作:程序员2:程序员1:程序员2:发生冲突:查看冲突:解决冲突:冲突在什么场景下发生&#xff1f…...

关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解

关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解前言一、各坐标系的含义二、坐标系转换1.世界坐标系与相机坐标系(旋转与平移)2.相机坐标系与图像坐标系(透视)3.图像坐标系与像素坐…...

企业防护ddos的注意事项,你知道吗?

DDoS,分布式拒绝服务攻击,是指处于不同位置的多个攻击者同时向一个或数个目标发动攻击,或者一个攻击者控制了位于不同位置的多台机器并利用这些机器对受害者同时实施攻击。在当下,DDoS 攻击是非常常见的一种攻击方式,大…...

挑战杯推荐项目

“人工智能”创意赛 - 智能艺术创作助手:借助大模型技术,开发能根据用户输入的主题、风格等要求,生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用,帮助艺术家和创意爱好者激发创意、提高创作效率。 ​ - 个性化梦境…...

K8S认证|CKS题库+答案| 11. AppArmor

目录 11. AppArmor 免费获取并激活 CKA_v1.31_模拟系统 题目 开始操作: 1)、切换集群 2)、切换节点 3)、切换到 apparmor 的目录 4)、执行 apparmor 策略模块 5)、修改 pod 文件 6)、…...

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度(创建索引的主要原因)。3. 可以加速表和表之间的连接,实现数据的参考完整性。4. 可以在查询过程中,…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...

可靠性+灵活性:电力载波技术在楼宇自控中的核心价值

可靠性灵活性:电力载波技术在楼宇自控中的核心价值 在智能楼宇的自动化控制中,电力载波技术(PLC)凭借其独特的优势,正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据,无需额外布…...

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

问题描述:iview使用table 中type: "index",分页之后 ,索引还是从1开始,试过绑定后台返回数据的id, 这种方法可行,就是后台返回数据的每个页面id都不完全是按照从1开始的升序,因此百度了下,找到了…...

智能在线客服平台:数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展,消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁,不仅优化了客户体验,还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用,并…...

WordPress插件:AI多语言写作与智能配图、免费AI模型、SEO文章生成

厌倦手动写WordPress文章?AI自动生成,效率提升10倍! 支持多语言、自动配图、定时发布,让内容创作更轻松! AI内容生成 → 不想每天写文章?AI一键生成高质量内容!多语言支持 → 跨境电商必备&am…...

C++ 求圆面积的程序(Program to find area of a circle)

给定半径r,求圆的面积。圆的面积应精确到小数点后5位。 例子: 输入:r 5 输出:78.53982 解释:由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982,因为我们只保留小数点后 5 位数字。 输…...

自然语言处理——Transformer

自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,但是它有一个很大的缺陷——很难并行化。 我们可以考虑用CNN来替代RNN,但是…...