当前位置: 首页 > news >正文

【小白学机器学习20】单变量分析 / 0因子分析 (只分析1个变量本身的数据)

目录

1 什么是单变量分析(就是只分析数据本身)

1.1 不同的名字

1.2 《戏说统计》这本书里很多概念和一般的书不一样

1.3 具体来说,各种概率分布都属于单变量分析

2 一维的数据分析的几个层次

2.1 数据分析的层次

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

2.2.2 具体

3 多维数据分析

3.1 一维的数据分析

3.2 二维的数据分析

3.3 3维的面

4  典型的单变量分析

4.1 正态分布

5 多变量分析

5.1 分析方法分类

5.2 自变量的个数

5.3 为什么又了单因素分析,还需要多因素分析呢?


1 什么是单变量分析(就是只分析1个变量数据本身)

  • 本质:就是只分析1个变量数据本身
  • 就是只分析一个变量的数据,就是单变量分析。
  • 如果非要,统一说成是那种回归模型/因果分析模型/相关分析的话,这个就算是0因子分析。

1.1 不同的名字

  • 单变量分析:模型里只有1个变量,只分析这一个变量的数据
  • 纯单个变量分析
  • 0因子分析 :如果一定要把所有分析都看成是因果分析,那么单变量分析,就是没有因子的因变量分析,或者是0因子的单个因变量分布

1.2 《戏说统计》这本书里很多概念和一般的书不一样

书里说的(和一般的说法不一样,但是可以对应起来)

  • 单变量分析,由点到线-------→一般书里没有这个说法
  • 双变量分析,由线到面 ------→单变量回归
  • 多变量分析,由面到体-------→多变量回归

1.3 具体来说,各种概率分布都属于单变量分析

因为这些概率分布,只分析这个概率序列的内部情况,和其他因素无关。

  • 0-1分布
  • 几何分布
  • 二项分布
  • 超几何分布
  • 正态分布
  • 泊松分布等

2 一维的数据分析的几个层次

2.1 数据分析的层次

  • 层次1:看到一群数据,散点堆在一起,注意到数据有不同差异
  1. 完全散在一群,但是堆起来并不好看
  • 层次2:看到一群数据,注意到这些数据的数值是不同的,可分类的
  1. 有序的整理起来,比如每个数值的堆在一起可以数数量,分堆分类,生活里常见,
  • 层次3:定类:进行分类:
  1. 对数据进行分类,具体相同特征的在一起分堆。
  2. 本质上,这个类别只有数据本身序列的话,这个分类一定是不同数值/数值区间出现的次数,就是频度。
  3. (而频度本质就是概率)
  • 层次4:定类且组合图形为1维:
  1. 为了连续性,分类数据,类别全部首位相接,就是统计和机器学习里,都有的数据条
  2. 有序的排起来,比如动动脑筋,把这些首尾相接起来,这就是一条直线,且按区间划分,且区间也是按从小到大排列的
  3. 一根线,数据分类条,每个类别的长度代表频度,全部首位相接,可以比较了
  4. 定距数据。可比较互相的长度。
  • 层次5:把一维的数据,展开为2维进行展示
  1. 把频度展开为直方图:把一维的数据,展开为2维进行展示。
  2. 注意,因为只有一种数据,还是一维的,
  3. 是看起来形式展开像2维一样。
  4. 更巧妙的是把这一根直线,切分,切成多根直线,并着放. 这个是什么呢?不是正态分布啊,至少不一定是.,这个其实更通用的说是频度图
  5. 频度图,算是分布图吗?现在看起来就很像整体分布曲线了,看起来像也不一定就是,如果能代表概率,才是概率分布曲线(频度约等于权重,概率)
  6. 横轴,值的区间划分
  7. 纵轴,不同值的频度(频度就是概率)

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

一维数据图:图上无论是画成1条轴,或者2条轴,实际只有1个变量的数据

二维数据图:有2条轴,且实际确实有2个变量!

2.2.2 具体

一维的线,也是可以画出2个维度的轴,比如一个变量的数据

  • 前面的数据分类条,从一根线变成一个二维表现形式的坐标轴
  • 横轴,不同的数据值(可以是离散的点,或者离散区间段,甚至连续的点组成的线)
  • 纵轴,每个数据值的发生次数/出现次数=频度
  • 频度的这个二维坐标,可以想象就是把 一根线的数据分类条,分别截断后,按左右的顺序摆在一起,且下面因为是地面,地面相当于一根起点相同的轴,X轴。

3 多维数据分析

3.1 一维的数据分析

  • 模型中只有一个变量
  • 单变量分析-----可以认为是0因素分析,只分析因变量本身,没有自变量。
  • 就是个体数据,扩展到样本数据,从1个到多个。但都还是属于同一个变量!

3.2 二维的数据分析

2维的线,直接是2个明确的轴,轴1,轴2,两个轴都有实际意义

  • 横轴:一般是自变量
  • 纵轴:一般是因变量Y

3.3 3维的面

  •    横轴:自变量1
  •    纵轴:自变量2
  •    Z轴:因变量
     

4  典型的单变量分析

4.1 正态分布

  • 1 第1层次,元素数据按频度展开,展示自然分布
  • 2 多次抽样的平均值符合
  • 3 正态分布,标准化后就是概率图,并且是100% 无限逼近两边的
     

5 多变量分析

就是至少包含了2个变量的分析

5.1 分析方法分类

  • 可能是相关性分析,不分因果
  • 可能是回归分析,有前因后果,有1个因子,2个因子等等。

5.2 自变量的个数

  • 也就是只分析1因1果,多因1果,而不直接分析1果多因的情况
  • 自变量1,因变量1
  • 自变量N,因变量1
  • 自变量1,因变量N---错误!
  • 实际上,1果多因不符合函数
  • 实际上,集合和函数的映射关系,也是这个规律
  • 单设,满射都满足才是双射
  • 而不能是一因多果,这也函数都不是,也不能有得因,果,缺乏映射关系。

5.3 为什么又了单因素分析,还需要多因素分析呢?

  • 自变量N,因变量1
  • 自变量1,因变量1
  • 已经有了自变量1,因变量1这种单变量分析了,理论上,即使有多个因素都可以拆成,多个:1个自变量--对应因变量,这样的关系,分别去分析,为什么还要搞多因素分析呢?
  • 因为虽然自变量1,因变量1,这种线性回归,有截距,斜率, 也可以列出函数表达式/方程。 但是这个是单个的。
  • 单因素分析(双变量分析),得出的公式只是一个变量的。这个无法预测结果。因为预测结果,大多数情况下是多因素的,我们已知多因素都影响因变量。所以,只知道一个因素的影响,不足于列出完整方程/建模来预测。
  • 只有多变量分析,才能出一个多自变量的综合方程,可以体现多变量一起变化的影响。虽然每个自变量系数,都是在假设其他变量不变时求出来的(也只能这么求出来),然后获得统一的包含多因子在场的表达式,这也才能求总公式

相关文章:

【小白学机器学习20】单变量分析 / 0因子分析 (只分析1个变量本身的数据)

目录 1 什么是单变量分析(就是只分析数据本身) 1.1 不同的名字 1.2 《戏说统计》这本书里很多概念和一般的书不一样 1.3 具体来说,各种概率分布都属于单变量分析 2 一维的数据分析的几个层次 2.1 数据分析的层次 2.2 一维的数据为什么…...

[软件工程]—桥接(Brige)模式与伪码推导

桥接(Brige)模式与伪码推导 1.基本概念 1.1 动机 由于某些类型的固有的实现逻辑,使它们具有两个变化的维度,乃至多个维度的变化。如何应对这种“多维度的变化”?如何利用面向对象技术是的类型可以轻松的沿着两个乃至…...

TensorFlow面试整理-TensorFlow 结构与组件

TensorFlow 的结构和组件是其功能强大、灵活性高的重要原因。掌握这些结构和组件有助于更好地理解和使用 TensorFlow 构建、训练和部署模型。以下是 TensorFlow 关键的结构与组件介绍: 1. Tensor(张量) 定义:张量是 TensorFlow 中的数据载体,类似于多维数组或矩阵。张量的…...

linux下gpio模拟spi三线时序

目录 前言一、配置内容二、驱动代码实现三、总结 前言 本笔记总结linux下使用gpio模拟spi时序的方法,基于arm64架构的一个SOC,linux内核版本为linux5.10.xxx,以驱动三线spi(时钟线sclk,片选cs,sdata数据读和写使用同一…...

makesense导出的压缩包是空的

md ,那些教程感觉都不是人写的,没说要在右边选标签,我本来就是一个标签,我以为他会自动识别打标,结果死活导出来空包 密码要在右边选标签,...

Spring Boot框架下的中小企业设备维护系统

5系统详细实现 5.1 用户信息管理 中小企业设备管理系统的系统管理员可以对用户信息添加修改删除以及查询操作。具体界面的展示如图5.1所示。 图5.1 用户信息管理界面 5.2 员工信息管理 管理员可以对员工信息进行添加修改删除操作。具体界面如图5.2所示。 图5.2 员工信息界面…...

处理文件上传和进度条的显示(进度条随文件上传进度值变化)

成品效果图&#xff1a; 解决问题&#xff1a;上传文件过大时&#xff0c;等待时间过长&#xff0c;但是进度条却不会动&#xff0c;只会在上传完成之后才会显示上传完成 上传文件的upload.component.html <nz-modal [(nzVisible)]"isVisible" [nzTitle]"文…...

【套题】大沥2019年真题——第5题

05.魔术数组 题目描述 一个 N 行 N 列的二维数组&#xff0c;如果它满足如下的特性&#xff0c;则成为“魔术数组”&#xff1a; 1、从二维数组任意选出 N 个整数。 2、选出的 N 个整数都是在不同的行且在不同的列。 3、在满足上述两个条件下&#xff0c;任意选出来的 N 个整…...

上传Gitee仓库流程图

推荐一个流程图工具 登录 | ProcessOnProcessOn是一个在线协作绘图平台&#xff0c;为用户提供强大、易用的作图工具&#xff01;支持在线创作流程图、思维导图、组织结构图、网络拓扑图、BPMN、UML图、UI界面原型设计、iOS界面原型设计等。同时依托于互联网实现了人与人之间的…...

二叉树相关OJ题 — 第一弹

目录 1. 检验两棵树是否相同 ​编辑 1. 题目解析 2. 解题步骤 2.判断一棵大树中是否包含有和一棵小树具有相同结构和节点值的子树 1. 题目解析 2. 解题步骤 3. 翻转二叉树 1. 题目解析 2.解题步骤 4. 判断一颗二叉树是否是平衡二叉树 1. 题目解析 2. 解题步骤…...

【学习笔记】RFID

RFID 1、 概述 1.1、RFID 介绍 1.2、RFID 发展史 1.3、RFID 系统的构造 1.3.1、阅读器 Reader 和 天线 Antenna 1.3.3、电子标签 tag 1.4、电子标签按吐字率分类 1.5、电子标签按能量供应的方式划分 1.6、RFID 工作流程 …...

自动化部署-01-jenkins安装

文章目录 前言一、下载安装二、启动三、问题3.1 jdk版本问题3.2 端口冲突3.3 库文件加载问题3.4 系统字体配置问题 四、再次启动五、配置jenkins5.1 解锁5.2 安装插件5.3 创建管理员用户5.4 实例配置5.5 开始使用5.6 完成 总结 前言 spingcloud微服务等每次部署到服务器上&…...

AI工具大爆发,建议每个都使用收藏

2024年被誉为AI应用元年&#xff0c;这一年人们普遍意识到&#xff0c;未来占据主导地位的将是基于大模型的应用程序&#xff0c;而不仅仅是大模型本身。因此&#xff0c;在这一趋势的推动下&#xff0c;各式各样的AI应用如雨后春笋般涌现出来。 今天就聊聊这些好用的AI工具&a…...

Mybatis之参数处理

在MyBatis中&#xff0c;参数处理是非常关键的部分&#xff0c;它负责将传入的参数正确映射到SQL语句中 单个简单类型参数 简单类型对于mybatis来说都是可以自动类型识别的&#xff1a; 也就是说对于mybatis来说&#xff0c;它是可以自动推断出ps.setXxxx()方法的。ps.setSt…...

windows内核探索--打印windows的GDT表(全局描述符表)

x86 #include <windows.h> #include<stdio.h> #include "x86struct.h" void PrintSegmentDescriptor(ULONG64* sd, WORD Count); SegmentSelector GetSegmentSelector(USHORT Selector); int main() {printf("0环cs段寄存器 ");GetSegmentSel…...

【ChatGPT】让ChatGPT帮助进行头脑风暴与创意生成

让ChatGPT帮助进行头脑风暴与创意生成 在日常工作和生活中&#xff0c;创意和头脑风暴是解决问题、创新和推动项目的关键步骤。ChatGPT&#xff0c;作为一个强大的语言模型&#xff0c;不仅可以提供信息和答案&#xff0c;还可以成为强大的头脑风暴工具&#xff0c;帮助用户快…...

大数据处理随堂测试

HDFS MapReduce HBase Spark...

2024最新pycharm安装教程及基本使用(超详细,新手小白必看)

文章目录 前言一、官网下载二、安装步骤三、使用示范四、番外篇&#xff08;汉&#xff09;大纲 PythonPyCharm安装包领取方式戳‘这块里’ 前言 一、官网下载 1. 进入pycharm官网&#xff0c;点击下载 PyCharm: The Python IDE for data science and web development by J…...

三国杀钓鱼自动化

三国杀钓鱼脚本 前言 本来是想做必杀的&#xff0c;但是后来测试了大约400钓发现纯靠连点没有漏掉的鱼&#xff0c;所以必杀功能就舍弃了。 我pyinstaller打包后运行.exe居然黑屏了&#xff1f;&#xff1f;&#xff1f;可能是多进程报错处理没写好&#xff0c;反正还是用vsc…...

在pycharm中使用sqllite

在pycharm中使用sqllite sqllite 简介 SQLite 是一个开源的、轻量级的、关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;它设计用于嵌入到应用程序中&#xff0c;并且可以在无需外部服务器进程的情况下运行。SQLite 提供了完整的 SQL 语言支持&#xff0c;允…...

Linux——文件操作

前言 1&#xff09;在Linux下面&#xff0c;一切皆文件&#xff0c;文件文件内容文件属性 2&#xff09;在访问文件是&#xff0c;都得先将文件打开&#xff0c;修改文件的本质其实还是通过执行代码的形式修改。 3&#xff09;文件是被进程打开的&#xff0c;一个进程可以打…...

数据结构 ——— 数组栈oj题:有效括号

目录 题目要求 代码实现 题目要求 给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0c;}&#xff0c;[&#xff0c;] 的字符串 s &#xff0c;判断字符串是否有效 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括号闭合。 左括号必须以正确的顺序闭合。 每…...

Character AI被起诉!14岁青少年自杀,AI陪伴何去何从

终于&#xff0c;AI在青少年心理问题方面&#xff0c;被推上了风口浪尖。 最近&#xff0c;美国佛罗里达州&#xff0c;一名14岁男孩Sewell Setzer的父母控告Character AI公司&#xff0c;声称孩子沉迷该公司的AI聊天机器人&#xff0c;最后走上了自杀的道路。 跟AI聊天还能致…...

CSS3 动画相关属性实例大全(三)(columns、filter、flex、flex-basis 、flex-grow、flex-shrink属性)

CSS3 动画相关属性实例大全&#xff08;三) &#xff08;columns、filter、flex、flex-basis 、flex-grow、flex-shrink属性&#xff09; 本文目录&#xff1a; 一、columns属性&#xff08;设置元素的列宽和列数&#xff09; 二、filter属性&#xff08;调整图像、背景和边…...

中国最厉害的思想家改名大师颜廷利:以诚信为基,塑企业信誉

跨文化融合&#xff0c;共筑包容性文化殿堂。尊重差异&#xff0c;促进团队合作&#xff0c;以诚信为基&#xff0c;塑企业信誉。融合《升命学说》智慧&#xff0c;推动员工多元化&#xff0c;践行社会责任&#xff0c;树立良好形象。创新不息&#xff0c;持续学习&#xff0c;…...

Python 代码实现用于进行水质模拟和优化加氯量

# -*- coding:utf-8 -*- import epamodule as em import epanetmsxmodule as msx import pandas as pd import numpy as np# 水质模拟,会产生一个rpt文件,但并不是返回这个文件。 def quality_simulation(inp_file,rpt_file,msx_file...

挖矿病毒来势汹汹

病毒来了, 我的个人站点使用了 wordpress, 它的不知哪个漏洞让黑客攻入了我的站点 使用 top 命令看到了有不明进程始终占据了 100% 的 CPU snapshot 1 snapshot 2 通过以下 "三板斧"可以查杀这个进程 先用 top (shiftp) 查找占据 CPU 最多的进程根据其进程号 pid 查看…...

国产数据库的蓝海在哪?

昨天有幸参加了 OceanBase2024年度发布会。在过去的几年中&#xff0c;OB 作为国内自主研发的分布式数据库&#xff0c;取得了令人瞩目的成就&#xff0c;特别是在金融行业&#xff0c;OB 通过不断的技术革新和优化&#xff0c;已经成为行业的领导者之一。OceanBase 展现了强大…...

MySQL~表的操作(创建表,查看表,修改表,删除表)

1.创建表 1.1.创建表 首先要选择需要操作的数据库&#xff0c;USE 数据库名&#xff0c;后续可以根据实际情况操作时添加。 USE fruitsales;建表语法&#xff1a; create table 表名( 字段名1 数据类型, 字段名2 数据类型, ); 实例&#xff1a;创建fruit_bak1表。 create t…...

多线程加锁与手搓智能指针实践

前缀知识 如何手搓智能指针 参考链接 如何多线程加锁&#xff0c;线程间通信 参考链接 注意&#xff1a; 在第一个链接中&#xff0c;重载赋值构造函数时&#xff0c;返回值类型为引用类型&#xff0c;仅适用于返回的这个对象, 在该函数调用前 (已经)存在了!!! 具体可参考 参考…...

网站建设的重要性意义与价值/今日头条极速版最新

linux中的线程分为用户线程和内核线程&#xff0c;用户线程是标准的线程&#xff0c;完全的自主性&#xff0c;完全的抢占性&#xff1b;但是内核线程就不那么好了&#xff0c;某种意义上没有用户线程那么清闲&#xff0c;这个怎么理解呢&#xff1f;用户线程的编写者只需要实现…...

做网站注册商标哪一类/hao123上网从这里开始官方

2019还剩50%了&#xff0c;这半年里&#xff0c;读了一些书&#xff0c;做了个小小总结&#xff0c;也当作分享&#xff0c;分为技术书籍和非技术书籍两部分。技术书籍技术书籍方面&#xff0c;读了《数据密集型系统设计》、《Java学习笔记&#xff1a;JDK8》、《实战高并发程序…...

hexo与 wordpress/网络营销的含义

本文翻译的内容为CodeSmith控制台指南。很多人仅仅知道CodeSmith像一个图形应用程序&#xff0c;或者可能是一个Visual Studio的附件&#xff0c;但是通过CodeSmith的控制台应用程序还有好多其他的使用方法。控制台应用程序是很有价值的&#xff0c;因为可以通过它去生成脚本&a…...

潍坊做网站价格/设计一个公司网站多少钱

Linux 下的硬盘读写速度测试工具执行一下以下命令看看你服务器的磁盘性能如何。hdparm -Tt /dev/sda以下是 2块 希捷 ES2 SATA 500G 做 Raid0 的速度[rootadmin ~]# hdparm -Tt /dev/sda/dev/sda:Timing cached reads: 18916 MB in 1.99 seconds 9484.20 MB/secTiming buffere…...

石家庄网站建设机构/好用的磁力搜索引擎

四大函数类型一. 局部和全局变量二. 引用三. 匿名函数四. 递归前言作者&#xff1a;神的孩子都在跳舞 关注我的csdn博客&#xff0c;更多python知识还在更新 一. 局部和全局变量 局部变量 &#xff08;1&#xff09;含义&#xff1a;就是在函数内部定义的变量&#xff08;作用…...

零食天堂专做零食推荐的网站/千万别在百度上搜别人的名字

第一次记录开发&#xff0c;话不多的说&#xff01; 1.引微信js-sdk npm install wx-module --save 备注&#xff1a;npm安装自行百度 2.在需要调用的页面中引入 import wx from jweixin-module 3.获取wx.config注册信息。注册成功提示config:ok &#xff0c;上线需修改…...