机器学习课后习题 --- 朴素贝叶斯
(一)单选题
1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少?
A:80%
B:16.6%
C:23%
D:15%
2.下列关于朴素贝叶斯的特点说法错误的是()
A:朴素贝叶斯模型发源于古典数学理论,数学基础坚实
B:朴素贝叶斯模型无需假设特征条件独立
C:朴素贝叶斯处理过程简单,分类速度快
D:朴素贝叶斯对小规模数据表现较好
3.以下算法不属于生成模型 ( )
A:朴素贝叶斯模型
B:混合高斯模型
C:隐马尔科夫模型
D:支持向量机
4.关于拉普拉斯平滑说法正确的是()
A:避免了出现概率为0的情况
B:加上拉普拉斯平滑有助于提高学习性能
C:会使得最终结果可能大于1
D:以上说法都不对
5.假设X和Y都服从正态分布,那么P(X<5,Y<0)就是一个( ),表示X<5,Y<0两个条件同时成立的概率,即两个事件共同发生的概率。
A:先验概率
B:后验概率
C:联合概率
D:以上说法都不对
6.以下算法属于判别模型的是( )
A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归
7.以下算法属于判别模型的是()
A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归
8. 朴素贝叶斯的优点不包括( )
A:算法逻辑简单,易于实现
B:分类过程中时空开销小
C:对缺失数据不太敏感,算法也比较简单,常用于文本分类
D:朴素贝叶斯模型对输入数据的表达形式很敏感
9.市场上某商品来自两个工厂,它们市场占有率分别为60%和40%,有两人各自买一件,则买到的来自不同工厂之概率为( )。
A:0.5
B:0.24
C:0.48
D:0.3
10.以A表示事件"甲种产品畅销,乙种产品滞销",则其对立事件A为( )
A:甲种产品滞销,乙种产品畅销
B:甲,乙两种产品均畅销
C:甲种产品滞销
D:甲种产品滞销或乙种产品畅销
11.关于朴素贝叶斯,下列说法错误的是:( )
A:它是一个分类算法
B:朴素的意义在于它的一个天真的假设:所有特征之间是相互独立的
C:它实际上是将多条件下的条件概率转换成了单一条件下的条件概率,简化了计算
D:朴素贝叶斯不需要使用联合概率
12.掷二枚骰子,事件A为出现的点数之和等于3的概率为( )
A:1/11
B:1/18
C:1/6
D:都不对
12、 问题:公司里有一个人穿了运动鞋,推测是男还是女?已知公司里男性30人,女性70人,男性穿运动鞋的有25人,穿拖鞋的有5人,女性穿运动鞋的有40人,穿高跟鞋的有30人。则以下哪项计算错误()?
选项:
A:p(男|运动鞋)=0.25
B:p(女|运动鞋)=0.4
C:p(运动鞋|男性)=25/30
D:p(运动鞋|女性)=0.4
(二)判断题
1.根据以往经验和分析得到的概率。在这里,我们用P(Y)来代表在没有训练数据前假设Y拥有的初始概率,因此称其为Y的后验概率,它反映了我们所拥有的关于Y的背景知识。
答案: 【错误】
2.朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性相关性较小时,朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时,分类效果不好。
答案: 【正确】
15.朴素贝叶斯对缺失数据较敏感。
答案: 【正确】
16.判别模型所学内容是决策边界。
答案: 【正确】
17.逻辑回归是生成模型,朴素贝叶斯是判别模型
答案: 【错误】
18、 问题:逻辑回归和朴素贝叶斯都有对属性特征独立的要求
答案: 【错误】
19、 问题:朴素贝叶斯法的基本假设是条件独立性。
答案: 【正确】
20、 问题:朴素贝叶斯适用于小规模数据集,逻辑回归适用于大规模数据集。
答案: 【错误】
(三)问答题
1.朴素贝叶斯与逻辑回归的区别是什么?
定义与原理
逻辑回归:是一个用于预测目标变量为二分类或多分类的概率的线性模型。
朴素贝叶斯:是基于贝叶斯定理和特定假设(特征之间相互独立)的一种分类方法。
假设与模型
逻辑回归:假设特征与输出log-odds之间存在线性关系。
朴素贝叶斯:假设特征之间是条件独立的,即给定目标值时,一个特征的存在不会影响其他特征的存在。
适用场景
逻辑回归:当特征与输出之间的关系可以近似为线性关系时,逻辑回归通常表现得较好。
朴素贝叶斯:在文本分类、垃圾邮件识别等需要特征独立性假设的场景中表现良好。
参数估计
逻辑回归:通常使用极大似然估计来确定参数。
朴素贝叶斯:使用先验概率和似然来估计后验概率。
模型表现
逻辑回归:当特征数量很大或存在多重共线性时,可能需要正则化来防止过拟合。
朴素贝叶斯:虽然其“朴素”的假设在许多实际应用中不成立,但它在许多情况下仍然表现得很好。
实际应用
逻辑回归:广泛应用于金融、医疗、社交媒体等领域的分类问题。
朴素贝叶斯:在文本处理、情感分析、垃圾邮件过滤等领域有广泛的应用。
2.朴素贝叶斯“朴素”在哪里?
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,它的名称中的“朴素”是指其一个核心假设:特征之间是条件独立的。即给定类别标签后,一个特征的出现不会影响其他特征的出现。“朴素”是假设了特征之间是同等重要、相互独立、互不影响的,但是在我们的现实社会中,属性之间并不是都是互相独立的,有些属性也会存在性,所以说朴素贝叶斯是一种很“朴素”的算法。
具体来说,在许多实际情况中,特征之间确实存在某种依赖关系或关联。例如,在文本分类中,某些词的出现可能与其他词的出现有关。然而,尽管这个假设看起来过于简化,朴素贝叶斯分类器在很多应用中都表现得相当好。
这个简化的假设带来了计算上的便利性。假设特征是条件独立的,意味着我们可以简单地将每个特征的概率相乘,而不需要担心它们之间的复杂交互。
总的来说,“朴素”在朴素贝叶斯中是指它对特征间关系的简化假设,即认为所有特征都是条件独立的。这是一个在很多实际情况下并不完全成立的假设,但这种方法经常在实际应用中得到令人满意的结果。
3.在估计条件概率P((X|Y)时出现概率为0的情况怎么办?
引入拉普拉斯平滑法
4.何为朴素贝叶斯?
朴素贝叶斯是一种简单但强大的分类算法,它基于贝叶斯定理并考虑到了特征的条件独立性。朴素贝叶斯被广泛应用于垃圾邮件检测、文本分类、情感分析等任务。
补充:
贝叶斯定理: 贝叶斯定理描述了随机事件A和B之间的概率关系。数学表示为: P(A∣B)=P(B)P(B∣A)P(A) 在分类任务中, A 通常是类别标签,而 B 是给定的数据或特征。
特征的条件独立性: 朴素贝叶斯分类器的“朴素”之处在于它假设给定类别标签后,所有特征都是条件独立的。这意味着,如果你有一个数据点的多个特征,那么这些特征之间不会相互影响。这种假设简化了计算,尽管在现实世界中,特征间可能存在关联。
模型训练: 为了训练一个朴素贝叶斯分类器,你首先需要计算每个类别的先验概率(即在没有任何其他信息的情况下某个类别出现的概率),以及给定某个类别时每个特征的概率。
预测: 对于一个新的数据点,朴素贝叶斯分类器计算它属于每个类别的后验概率,并选择概率最高的类别作为预测结果。
应用场景: 朴素贝叶斯在特定的应用中效果非常好,特别是在文本分类任务中。例如,判断一封电子邮件是不是垃圾邮件、对产品评论进行情感分析等。
总之,朴素贝叶斯是一个基于贝叶斯定理的分类方法,其“朴素”是因为它假设所有特征在给定类别标签的条件下是独立的。尽管这种假设在许多真实情境中并不完全成立,但朴素贝叶斯在很多任务上都能得到相当不错的结果。
相关文章:
![](https://www.ngui.cc/images/no-images.jpg)
机器学习课后习题 --- 朴素贝叶斯
(一)单选题 1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少? A:80%B:16.6% C:23% D:15% 2.下列关于朴素贝叶斯的特点说法错误的是…...
![](https://img-blog.csdnimg.cn/4dbc0ed65cf540cda86dac1901cd91e4.png)
【设备树笔记整理7】实践操作
1 使用设备树给DM9000网卡_触摸屏指定中断 1.1 修改方法 根据设备节点的compatible属性,在驱动程序中构造/注册 platform_driver,在 platform_driver 的 probe 函数中获得中断资源。 1.2 实验方法 以下是修改好的代码:第6课第1节_网卡_触摸…...
![](https://img-blog.csdnimg.cn/img_convert/42dfddb0e9471e8e94e0469225a3d625.png)
使用VisualStudio制作上位机(六)
文章目录 使用VisualStudio制作上位机(六)第五部分:应用程序打包第一步:勾选为Release模式第二步:生成解决方案第三步:将我们额外添加的文件放入到Release这个文件夹里 使用VisualStudio制作上位机…...
![](https://img-blog.csdnimg.cn/c509ce863fd14afb8e8fd0115abefebc.gif)
包管理工具--》npm的配置及使用(一)
目录 🌟概念 🌟背景 🌟前端包管理器 🌟包的安装 本地安装 全局安装 🌟包配置 配置文件 保存依赖关系 🌟包的使用 🌟写在最后 🌟概念 模块(module)…...
![](https://img-blog.csdnimg.cn/img_convert/167f49b5998efbbb1a118b6048f82a78.png)
期货基础知识
一、期货是什么? 期货是与现货相对应,并由现货衍生而来。期货通常指期货合约,期货与现货完全不同,现货是实实在在可以交易的货(商品),期货主要不是货,而是以某种大众产品如棉花、大…...
![](https://img-blog.csdnimg.cn/e8fd4bc1731843c1ac0977542eefc031.png)
NC后端扩展开发
前言 在日常的工作中,会遇到各种各样的需要进行扩展开发的需求,可以使用系统预留的扩展开发机制来实现,避免修改源码。因NC产品已迭代至BIP版本,所以前端扩展方式就再进行不赘述了,本文主要介绍后端扩展开发方式&…...
![](https://www.ngui.cc/images/no-images.jpg)
nginx vue2+webpack 和 vue3+vite 配置二级目录访问
我们开发中会遇到这样的需求,让我们用服务器nginx部署一个用域名的二级目录来访问项目 https:xxx/二级目录/来放访问项目 目录 思路 1、nginx配置(vue2 和 vue3配置的nginx相同) 2、vue2webpack的配置 (1࿰…...
![](https://img-blog.csdnimg.cn/img_convert/a87255810161428a9b2ee44127bcaee8.png#pic_center)
无需租云服务器,Linux本地搭建web服务,并内网穿透发布公网访问
文章目录 前言1. 本地搭建web站点2. 测试局域网访问3. 公开本地web网站3.1 安装cpolar内网穿透3.2 创建http隧道,指向本地80端口3.3 配置后台服务 4. 配置固定二级子域名5. 测试使用固定二级子域名访问本地web站点 前言 在web项目中,部署的web站点需要被外部访问,则…...
![](https://img-blog.csdnimg.cn/img_convert/9fa3e71b3c4871f1652a850f43cc736a.gif#pic_center)
算法leetcode|76. 最小覆盖子串(rust重拳出击)
文章目录 76. 最小覆盖子串:样例 1:样例 2:样例 3:提示:进阶: 分析:在这里插入图片描述 题解:rust:go:c:python:java: 76.…...
![](https://img-blog.csdnimg.cn/5807c0dac8c0400eafd3d854ae790abe.png)
如何让你的jupyter notebook 排版得像Word(Markdown和网页文件写法)
案例背景 很多时候我们在jupyter notebook里面的写代码,画图,但是文字分析什么的写在里面纯文本不好看,需要进行排版,那么就得用markdown的写法,如何还想居中或者更花里胡哨的字体,那就得要网页文件的一些…...
![](https://img-blog.csdnimg.cn/d5212eb5409541b19989134f01327ab4.png)
AndroidTV端:酒店扫码认证投屏DLNA
被老板叼了几次了,最近实在忍不了,准备离职; 但是担心离职后长时间没有办法找到工作 就想贡献一套平时琢磨出来的程序,请各位有能力的话带我熬过这凛冽的寒冬。 目前写出来的,有三个端:安卓TV端…...
![](https://img-blog.csdnimg.cn/f4cc7c5ae4c9436aaf560ad60abf43bd.png)
基于PyTorch的交通标志目标检测系统
一、开发环境 Windows 10PyCharm 2021.3.2Python 3.7PyTorch 1.7.0 二、制作交通标志数据集,如下图 三、配置好数据集的地址,然后开始训练 python train.py --data traffic_data.yaml --cfg traffic_yolov5s.yaml --weights pretrained/yolov5s.pt --e…...
![](https://www.ngui.cc/images/no-images.jpg)
feign调用失败 feign.RetryableException: xxx-service executing GET http://xxx/test
一。 问题引入 升级springcloud的版本后 突然发现 以前正常的feign调用也报错了 升级后的各组件版本如下 spring cloud 2021.0.5 spring cloud alibaba 2021.0.5.0 spring boot 2.6.13 错误日志如下 feign.RetryableException: xxx-service executing GET http://xxx-servic…...
![](https://www.ngui.cc/images/no-images.jpg)
mysql 用户管理
目录 用户 创建用户 删除用户 修改密码 权限管理 赋权 查看权限 插销权限 总结 用户 mysql 的用户都存在于系统数据库 mysql 的user 表中 mysql> show tables; --------------------------- | Tables_in_mysql | --------------------------- | column…...
![](https://img-blog.csdnimg.cn/1dfe90b1a10f452e9421f9e4ad6bf09e.png#pic_center)
pyinstaller打包exe运行闪退
这里写自定义目录标题 前言问题描述解决过程 前言 闪退原因可能有很多,这里记录下我遇到的问题,简单来说是dll调用错误导致的闪退,因为我的python用的是32位的,但是pyinstaller却是64位的,属于用conda的时候没注意。 …...
![](https://img-blog.csdnimg.cn/5b631699322c43eaa4c120774a697693.png)
ARM 汇编基础知识
1.为什么学习汇编? 我们在进行嵌入式 Linux 开发的时候是绝对要掌握基本的 ARM 汇编,因为 Cortex-A 芯片一 上电 SP 指针还没初始化, C 环境还没准备好,所以肯定不能运行 C 代码,必须先用汇编语言设置好 C 环境…...
![](https://img-blog.csdnimg.cn/c5afc7dede854bbeb69c062e00467b28.png#pic_center)
CRM 自动化如何改善销售和客户服务?
许多 B2B 和 B2C 公司都使用 CRM 系统来组织业务流程,使复杂的任务更容易完成。企业可以使用 CRM 自动化来自动化工作流程,让团队有更多的时间来执行高价值的任务,而不是陷于一堆琐碎事情中。 什么是CRM自动化? CRM 自动化是指 C…...
![](https://img-blog.csdnimg.cn/c6b619379edd49eb8d80bd38a84c545b.webp)
Bean 的六种作用域
目录 一、作用域是什么? 1、singleton(单例作用域) 2、prototype(原型作用域) 3、request(请求作用域) 4、session(回话作用域) 5、application(全局作用域&a…...
![](https://img-blog.csdnimg.cn/0ff79cb6ef54449ca33b5c7e8f5a36d2.png)
go语言--锁
锁的基础,go的锁是构建在原子操作和信号锁之上的 原子锁 原子包实现协程的对同一个数据的操作,可以实现原子操作,只能用于简单变量的简单操作,可以把多个操作变成一个操作 sema锁 也叫信号量锁/信号锁 核心是一个uint32值&#…...
![](https://www.ngui.cc/images/no-images.jpg)
再见,CSDN
从我2018年1月31日加入CSDN,到现在已经5年多的时间了。在这5年里,陆陆续续在CSDN上发布了很多论文阅读笔记、教程、技术文章等等,记录了我从大四到研究生再到工作这段时间的学习和成长轨迹。 我一直有备份个人资料的习惯,尤其是耗…...
![](https://img-blog.csdnimg.cn/f4d79833404b4897ba9b0d388482fa68.jpeg)
MySQL总复习
目录 登录 显示数据库 创建数据库 删除数据库 使用数据库 创建表 添加数据表数据 查询表 添加数据表多条数据 查询表中某数据 增insert 删delete 改update 查select where like 编辑 范围查找 order by 聚合函数 count max min sum avg g…...
![](https://img-blog.csdnimg.cn/img_convert/1e2cf1870b5af421e1c4771b268b9a87.png)
桌面平台层安全随手记录
声明 本文是学习桌面云安全技术要求. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 桌面平台层安全 桌面接入安全 用户标识 一般要求 本项要求包括: a) 系统应为用户提供唯一的身份标识,同时将用户的身份标识与该用户的所…...
![](https://img-blog.csdnimg.cn/e56a54e0554f4c64a8a05352422ba658.png)
【Docker】 08-Dockerfile
什么是Dockerfile Dockerfile可以认为是Docker镜像的描述文件,是由一系列命令和参数构成的教程,主要作用是用来构建docker镜像的构建文件。 Dockerfile解析过程 Dockerfile的保留命令 保留字作用FROM当前镜像是基于哪个镜像的 第一个指令必须是FROMMA…...
![](https://img-blog.csdnimg.cn/img_convert/f829b8021af6e6a8583c7babbcacbb92.png)
【二等奖方案】大规模金融图数据中异常风险行为模式挖掘赛题「Aries」解题思路
第十届CCF大数据与计算智能大赛(2022 CCF BDCI)已圆满结束,大赛官方竞赛平台DataFountain(简称DF平台)正在陆续释出各赛题获奖队伍的方案思路,欢迎广大数据科学家交流讨论。 本方案为【大规模金融图数据中…...
![](https://img-blog.csdnimg.cn/c257e6b266ef416888b0c8d1dbbb9967.png)
Github 下载指定文件夹(git sparse-checkout)
比如要下载这里的 data_utils 步骤 1、新建空文件夹,并进入新建的空文件夹。 2、git init 初始化 3、git remote add origin 添加远程仓库 4、git config core.sparsecheckout true 允许稀疏检出 5、git sparse-checkout set 设置需要拉取的文件夹(可…...
![](https://img-blog.csdnimg.cn/img_convert/96eb7f8fc3b5fe74c781b2d10bf730a5.png)
蚂蚁集团SQLess 开源,与内部版有何区别?
当我们使用关系型数据库时,SQL 是联系起用户和数据库的一座桥梁。 SQL 是一种高度非过程化的语言,当我们在编写SQL 时,表达的是想要什么数据,而不是怎么获取数据。因此,我们往往更关心SQL 有没有满足业务逻辑ÿ…...
![](https://www.ngui.cc/images/no-images.jpg)
An Efficient Memory-Augmented Transformer for Knowledge-Intensive NLP Tasks
本文是LLM系列文章,针对《An Efficient Memory-Augmented Transformer for Knowledge 一种用于知识密集型NLP任务的高效内存增强转换器 摘要1 引言2 相关工作3 高效内存增强Transformer4 EMAT的训练流程5 实验6 分析7 结论局限性 摘要 获取外部知识对于许多自然语言…...
![](https://www.ngui.cc/images/no-images.jpg)
Java项目中jar war pom包的区别
1、pom:用在父级工程或聚合工程中,用来做jar包的版本控制,必须指明这个聚合工程的打包方式为pom。 <project ...> <modelVersion>4.0.0</modelVersion> <groupId>com.wong.tech</groupId> <artifactI…...
![](https://img-blog.csdnimg.cn/img_convert/f127ce6ce04357360ae226ef408377fe.png#pic_center)
整理mongodb文档:分页
个人博客 整理mongodb文档:分页 个人博客,求关注,如果文章不够清晰,麻烦指出。 文章概叙 本文主要讲下在聚合以及crud的find方法中如何使用limit还有skip进行排序。 分页的情况很经常出现,这也是这篇博客诞生的理由。 数据准备…...
![](https://img-blog.csdnimg.cn/img_convert/7c320bb46c3a25851476e13bef129d5d.jpeg)
社区团购新玩法,生鲜蔬菜配货发货小程序商城
在当前的电商市场中,生鲜市场具有巨大的潜力和发展空间。为了满足消费者的需求,许多生鲜店正在寻找创新的方法来提高销售和客户满意度。其中,制作一个个性且功能强大的生鲜小程序商城是一个非常有效的策略。以下是在乔拓云平台上制作生鲜小程…...
![](/images/no-images.jpg)
东山县建设银行网站/品牌运营管理有限公司
版权声明:本文首发 http://asing1elife.com ,转载请注明出处。 https://blog.csdn.net/asing1elife/article/details/82848367 i18n是internationalization首字母i和末尾字母n以及中间18个字母的简称,意于国际化 更多精彩 更多技术博客&#…...
![](/images/no-images.jpg)
网站换空间 seo/2345浏览器下载安装
最近在尝试做一个QQ截图那样的工具,其中一个功能就是要做一个选择框,自然用到了CRectTracker 但是有一个很关键的东西就是,拖拽CRectTracker的时候,不能让CRectTracker“移出”屏幕,否则截图出来就有黑色的块 怎么办&a…...
![](https://img-blog.csdnimg.cn/948d05e730de40be8be992081eb7d018.png)
别人做的网站怎么打开吗/西安seo网络优化公司
一.描述 1.QDateTimeEdit是一个用来编辑日期和时间的单行文本框,由于大继承自QAbstractSpinBox类,可以用箭头按钮来调节文本内容,也可以用键盘输入。在用按钮修改内容时可以单独修改某个部分(年、月、日、小时、分) …...
![](/images/no-images.jpg)
网页制作公司企业愿景/北京网站优化页面
概述在网络编程中,有时我们需要判断两台机器之间的连通性,或者说是一台机器到另一台机器的网络可达性。在系统层面的测试中,我们常常用 Ping 命令来做验证。尽管 Java 提供了比较丰富的网络编程类库(包括在应用层的基于 URL 的网络…...
![](/images/no-images.jpg)
动态网站和响应式网站/yandex搜索引擎
# 软件架构风格 软件架构设计的一个核心问题是能否使用重复的架构模式,即能否达到架构级的软件重用。 也就是说,能否在不同的软件系统中,使用同一架构。 软件架构风格是描述某一特定应用领域中系统组织方式的惯用模式。 架构风格反映了领域中…...
![](/images/no-images.jpg)
如何编辑网页/郑州seo技术博客
创建(进入)VLAN10[SwitchA]vlan 102. 将E0/1加入到VLAN10[SwitchA-vlan10]port Ethernet 0/1 Ethernet 0/2 GigabitEthernet 1/13. 配置VLAN10内的端口隔离[SwitchA-vlan10]port-isolate enable4. 将连接服务器的端口配置为隔离端口的上行端口[SwitchA]i…...