当前位置: 首页 > news >正文

【小白学机器学习20】单变量分析 / 0因子分析 (只分析1个变量本身的数据)

目录

1 什么是单变量分析(就是只分析数据本身)

1.1 不同的名字

1.2 《戏说统计》这本书里很多概念和一般的书不一样

1.3 具体来说,各种概率分布都属于单变量分析

2 一维的数据分析的几个层次

2.1 数据分析的层次

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

2.2.2 具体

3 多维数据分析

3.1 一维的数据分析

3.2 二维的数据分析

3.3 3维的面

4  典型的单变量分析

4.1 正态分布

5 多变量分析

5.1 分析方法分类

5.2 自变量的个数

5.3 为什么又了单因素分析,还需要多因素分析呢?


1 什么是单变量分析(就是只分析1个变量数据本身)

  • 本质:就是只分析1个变量数据本身
  • 就是只分析一个变量的数据,就是单变量分析。
  • 如果非要,统一说成是那种回归模型/因果分析模型/相关分析的话,这个就算是0因子分析。

1.1 不同的名字

  • 单变量分析:模型里只有1个变量,只分析这一个变量的数据
  • 纯单个变量分析
  • 0因子分析 :如果一定要把所有分析都看成是因果分析,那么单变量分析,就是没有因子的因变量分析,或者是0因子的单个因变量分布

1.2 《戏说统计》这本书里很多概念和一般的书不一样

书里说的(和一般的说法不一样,但是可以对应起来)

  • 单变量分析,由点到线-------→一般书里没有这个说法
  • 双变量分析,由线到面 ------→单变量回归
  • 多变量分析,由面到体-------→多变量回归

1.3 具体来说,各种概率分布都属于单变量分析

因为这些概率分布,只分析这个概率序列的内部情况,和其他因素无关。

  • 0-1分布
  • 几何分布
  • 二项分布
  • 超几何分布
  • 正态分布
  • 泊松分布等

2 一维的数据分析的几个层次

2.1 数据分析的层次

  • 层次1:看到一群数据,散点堆在一起,注意到数据有不同差异
  1. 完全散在一群,但是堆起来并不好看
  • 层次2:看到一群数据,注意到这些数据的数值是不同的,可分类的
  1. 有序的整理起来,比如每个数值的堆在一起可以数数量,分堆分类,生活里常见,
  • 层次3:定类:进行分类:
  1. 对数据进行分类,具体相同特征的在一起分堆。
  2. 本质上,这个类别只有数据本身序列的话,这个分类一定是不同数值/数值区间出现的次数,就是频度。
  3. (而频度本质就是概率)
  • 层次4:定类且组合图形为1维:
  1. 为了连续性,分类数据,类别全部首位相接,就是统计和机器学习里,都有的数据条
  2. 有序的排起来,比如动动脑筋,把这些首尾相接起来,这就是一条直线,且按区间划分,且区间也是按从小到大排列的
  3. 一根线,数据分类条,每个类别的长度代表频度,全部首位相接,可以比较了
  4. 定距数据。可比较互相的长度。
  • 层次5:把一维的数据,展开为2维进行展示
  1. 把频度展开为直方图:把一维的数据,展开为2维进行展示。
  2. 注意,因为只有一种数据,还是一维的,
  3. 是看起来形式展开像2维一样。
  4. 更巧妙的是把这一根直线,切分,切成多根直线,并着放. 这个是什么呢?不是正态分布啊,至少不一定是.,这个其实更通用的说是频度图
  5. 频度图,算是分布图吗?现在看起来就很像整体分布曲线了,看起来像也不一定就是,如果能代表概率,才是概率分布曲线(频度约等于权重,概率)
  6. 横轴,值的区间划分
  7. 纵轴,不同值的频度(频度就是概率)

2.2 一维的数据为什么可以画成二维,但不是二维的?

2.2.1 什么是一维数据,什么是二维的数据?

一维数据图:图上无论是画成1条轴,或者2条轴,实际只有1个变量的数据

二维数据图:有2条轴,且实际确实有2个变量!

2.2.2 具体

一维的线,也是可以画出2个维度的轴,比如一个变量的数据

  • 前面的数据分类条,从一根线变成一个二维表现形式的坐标轴
  • 横轴,不同的数据值(可以是离散的点,或者离散区间段,甚至连续的点组成的线)
  • 纵轴,每个数据值的发生次数/出现次数=频度
  • 频度的这个二维坐标,可以想象就是把 一根线的数据分类条,分别截断后,按左右的顺序摆在一起,且下面因为是地面,地面相当于一根起点相同的轴,X轴。

3 多维数据分析

3.1 一维的数据分析

  • 模型中只有一个变量
  • 单变量分析-----可以认为是0因素分析,只分析因变量本身,没有自变量。
  • 就是个体数据,扩展到样本数据,从1个到多个。但都还是属于同一个变量!

3.2 二维的数据分析

2维的线,直接是2个明确的轴,轴1,轴2,两个轴都有实际意义

  • 横轴:一般是自变量
  • 纵轴:一般是因变量Y

3.3 3维的面

  •    横轴:自变量1
  •    纵轴:自变量2
  •    Z轴:因变量
     

4  典型的单变量分析

4.1 正态分布

  • 1 第1层次,元素数据按频度展开,展示自然分布
  • 2 多次抽样的平均值符合
  • 3 正态分布,标准化后就是概率图,并且是100% 无限逼近两边的
     

5 多变量分析

就是至少包含了2个变量的分析

5.1 分析方法分类

  • 可能是相关性分析,不分因果
  • 可能是回归分析,有前因后果,有1个因子,2个因子等等。

5.2 自变量的个数

  • 也就是只分析1因1果,多因1果,而不直接分析1果多因的情况
  • 自变量1,因变量1
  • 自变量N,因变量1
  • 自变量1,因变量N---错误!
  • 实际上,1果多因不符合函数
  • 实际上,集合和函数的映射关系,也是这个规律
  • 单设,满射都满足才是双射
  • 而不能是一因多果,这也函数都不是,也不能有得因,果,缺乏映射关系。

5.3 为什么又了单因素分析,还需要多因素分析呢?

  • 自变量N,因变量1
  • 自变量1,因变量1
  • 已经有了自变量1,因变量1这种单变量分析了,理论上,即使有多个因素都可以拆成,多个:1个自变量--对应因变量,这样的关系,分别去分析,为什么还要搞多因素分析呢?
  • 因为虽然自变量1,因变量1,这种线性回归,有截距,斜率, 也可以列出函数表达式/方程。 但是这个是单个的。
  • 单因素分析(双变量分析),得出的公式只是一个变量的。这个无法预测结果。因为预测结果,大多数情况下是多因素的,我们已知多因素都影响因变量。所以,只知道一个因素的影响,不足于列出完整方程/建模来预测。
  • 只有多变量分析,才能出一个多自变量的综合方程,可以体现多变量一起变化的影响。虽然每个自变量系数,都是在假设其他变量不变时求出来的(也只能这么求出来),然后获得统一的包含多因子在场的表达式,这也才能求总公式

相关文章:

【小白学机器学习20】单变量分析 / 0因子分析 (只分析1个变量本身的数据)

目录 1 什么是单变量分析(就是只分析数据本身) 1.1 不同的名字 1.2 《戏说统计》这本书里很多概念和一般的书不一样 1.3 具体来说,各种概率分布都属于单变量分析 2 一维的数据分析的几个层次 2.1 数据分析的层次 2.2 一维的数据为什么…...

[软件工程]—桥接(Brige)模式与伪码推导

桥接(Brige)模式与伪码推导 1.基本概念 1.1 动机 由于某些类型的固有的实现逻辑,使它们具有两个变化的维度,乃至多个维度的变化。如何应对这种“多维度的变化”?如何利用面向对象技术是的类型可以轻松的沿着两个乃至…...

TensorFlow面试整理-TensorFlow 结构与组件

TensorFlow 的结构和组件是其功能强大、灵活性高的重要原因。掌握这些结构和组件有助于更好地理解和使用 TensorFlow 构建、训练和部署模型。以下是 TensorFlow 关键的结构与组件介绍: 1. Tensor(张量) 定义:张量是 TensorFlow 中的数据载体,类似于多维数组或矩阵。张量的…...

linux下gpio模拟spi三线时序

目录 前言一、配置内容二、驱动代码实现三、总结 前言 本笔记总结linux下使用gpio模拟spi时序的方法,基于arm64架构的一个SOC,linux内核版本为linux5.10.xxx,以驱动三线spi(时钟线sclk,片选cs,sdata数据读和写使用同一…...

makesense导出的压缩包是空的

md ,那些教程感觉都不是人写的,没说要在右边选标签,我本来就是一个标签,我以为他会自动识别打标,结果死活导出来空包 密码要在右边选标签,...

Spring Boot框架下的中小企业设备维护系统

5系统详细实现 5.1 用户信息管理 中小企业设备管理系统的系统管理员可以对用户信息添加修改删除以及查询操作。具体界面的展示如图5.1所示。 图5.1 用户信息管理界面 5.2 员工信息管理 管理员可以对员工信息进行添加修改删除操作。具体界面如图5.2所示。 图5.2 员工信息界面…...

处理文件上传和进度条的显示(进度条随文件上传进度值变化)

成品效果图&#xff1a; 解决问题&#xff1a;上传文件过大时&#xff0c;等待时间过长&#xff0c;但是进度条却不会动&#xff0c;只会在上传完成之后才会显示上传完成 上传文件的upload.component.html <nz-modal [(nzVisible)]"isVisible" [nzTitle]"文…...

【套题】大沥2019年真题——第5题

05.魔术数组 题目描述 一个 N 行 N 列的二维数组&#xff0c;如果它满足如下的特性&#xff0c;则成为“魔术数组”&#xff1a; 1、从二维数组任意选出 N 个整数。 2、选出的 N 个整数都是在不同的行且在不同的列。 3、在满足上述两个条件下&#xff0c;任意选出来的 N 个整…...

上传Gitee仓库流程图

推荐一个流程图工具 登录 | ProcessOnProcessOn是一个在线协作绘图平台&#xff0c;为用户提供强大、易用的作图工具&#xff01;支持在线创作流程图、思维导图、组织结构图、网络拓扑图、BPMN、UML图、UI界面原型设计、iOS界面原型设计等。同时依托于互联网实现了人与人之间的…...

二叉树相关OJ题 — 第一弹

目录 1. 检验两棵树是否相同 ​编辑 1. 题目解析 2. 解题步骤 2.判断一棵大树中是否包含有和一棵小树具有相同结构和节点值的子树 1. 题目解析 2. 解题步骤 3. 翻转二叉树 1. 题目解析 2.解题步骤 4. 判断一颗二叉树是否是平衡二叉树 1. 题目解析 2. 解题步骤…...

【学习笔记】RFID

RFID 1、 概述 1.1、RFID 介绍 1.2、RFID 发展史 1.3、RFID 系统的构造 1.3.1、阅读器 Reader 和 天线 Antenna 1.3.3、电子标签 tag 1.4、电子标签按吐字率分类 1.5、电子标签按能量供应的方式划分 1.6、RFID 工作流程 …...

自动化部署-01-jenkins安装

文章目录 前言一、下载安装二、启动三、问题3.1 jdk版本问题3.2 端口冲突3.3 库文件加载问题3.4 系统字体配置问题 四、再次启动五、配置jenkins5.1 解锁5.2 安装插件5.3 创建管理员用户5.4 实例配置5.5 开始使用5.6 完成 总结 前言 spingcloud微服务等每次部署到服务器上&…...

AI工具大爆发,建议每个都使用收藏

2024年被誉为AI应用元年&#xff0c;这一年人们普遍意识到&#xff0c;未来占据主导地位的将是基于大模型的应用程序&#xff0c;而不仅仅是大模型本身。因此&#xff0c;在这一趋势的推动下&#xff0c;各式各样的AI应用如雨后春笋般涌现出来。 今天就聊聊这些好用的AI工具&a…...

Mybatis之参数处理

在MyBatis中&#xff0c;参数处理是非常关键的部分&#xff0c;它负责将传入的参数正确映射到SQL语句中 单个简单类型参数 简单类型对于mybatis来说都是可以自动类型识别的&#xff1a; 也就是说对于mybatis来说&#xff0c;它是可以自动推断出ps.setXxxx()方法的。ps.setSt…...

windows内核探索--打印windows的GDT表(全局描述符表)

x86 #include <windows.h> #include<stdio.h> #include "x86struct.h" void PrintSegmentDescriptor(ULONG64* sd, WORD Count); SegmentSelector GetSegmentSelector(USHORT Selector); int main() {printf("0环cs段寄存器 ");GetSegmentSel…...

【ChatGPT】让ChatGPT帮助进行头脑风暴与创意生成

让ChatGPT帮助进行头脑风暴与创意生成 在日常工作和生活中&#xff0c;创意和头脑风暴是解决问题、创新和推动项目的关键步骤。ChatGPT&#xff0c;作为一个强大的语言模型&#xff0c;不仅可以提供信息和答案&#xff0c;还可以成为强大的头脑风暴工具&#xff0c;帮助用户快…...

大数据处理随堂测试

HDFS MapReduce HBase Spark...

2024最新pycharm安装教程及基本使用(超详细,新手小白必看)

文章目录 前言一、官网下载二、安装步骤三、使用示范四、番外篇&#xff08;汉&#xff09;大纲 PythonPyCharm安装包领取方式戳‘这块里’ 前言 一、官网下载 1. 进入pycharm官网&#xff0c;点击下载 PyCharm: The Python IDE for data science and web development by J…...

三国杀钓鱼自动化

三国杀钓鱼脚本 前言 本来是想做必杀的&#xff0c;但是后来测试了大约400钓发现纯靠连点没有漏掉的鱼&#xff0c;所以必杀功能就舍弃了。 我pyinstaller打包后运行.exe居然黑屏了&#xff1f;&#xff1f;&#xff1f;可能是多进程报错处理没写好&#xff0c;反正还是用vsc…...

在pycharm中使用sqllite

在pycharm中使用sqllite sqllite 简介 SQLite 是一个开源的、轻量级的、关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;它设计用于嵌入到应用程序中&#xff0c;并且可以在无需外部服务器进程的情况下运行。SQLite 提供了完整的 SQL 语言支持&#xff0c;允…...

十大经典排序算法解析与实现

## 1. 十大经典排序算法技术解析### 1.1 算法分类体系 排序算法可分为两大技术类别&#xff1a;**比较类排序**&#xff1a; - 通过元素间比较确定相对次序 - 时间复杂度下限为O(nlogn) - 典型代表&#xff1a;快速排序、堆排序、归并排序**非比较类排序**&#xff1a; - 不依赖…...

告别网络依赖:用这个开源工具+高德离线包,5步搞定前端地图离线展示

前端开发者的离线地图解决方案&#xff1a;5步实现高德地图本地化部署 在紧急演示、内网开发或网络不稳定的环境中&#xff0c;依赖在线地图服务往往成为前端开发的痛点。我曾参与过一个政府内网项目&#xff0c;现场演示时因网络权限问题导致地图无法加载&#xff0c;最后不得…...

all-MiniLM-L6-v2开发者案例:集成至LangChain实现动态RAG检索链路

all-MiniLM-L6-v2开发者案例&#xff1a;集成至LangChain实现动态RAG检索链路 在构建智能问答或文档分析系统时&#xff0c;一个核心挑战是如何从海量文本中快速、准确地找到最相关的信息。传统的基于关键词的搜索&#xff0c;往往因为无法理解语义而“答非所问”。今天&#…...

清音刻墨镜像免配置亮点:内置10+中文领域词典(医疗/法律/IT)开箱即用

清音刻墨镜像免配置亮点&#xff1a;内置10中文领域词典&#xff08;医疗/法律/IT&#xff09;开箱即用 1. 为什么字幕对齐需要专业词典&#xff1f; 做视频字幕的朋友都知道&#xff0c;最头疼的不是生成文字&#xff0c;而是让文字和声音完美对齐。普通字幕工具遇到专业术语…...

Claude官方Skills推荐

Claude官方skills仓库提供了17个skills### 创意设计类 (5个) #### 1. algorithmic-art - 算法艺术生成器**一句话简介**&#xff1a;使用 p5.js 创建带种子随机数和参数探索的算法艺术 **触发条件**&#xff1a;代码艺术、生成艺术、算法艺术、流场、粒子系统#### 2. canvas-de…...

Transformer在车道线检测中的实战应用:LSTR模型从理论到代码实现

Transformer在车道线检测中的实战应用&#xff1a;LSTR模型从理论到代码实现 自动驾驶技术的快速发展对车道线检测提出了更高要求。传统基于CNN的分割方法往往需要复杂的后处理流程&#xff0c;而LSTR&#xff08;Lane Shape Prediction with Transformers&#xff09;通过端到…...

Mac开发者必备:OpenClaw调试QwQ-32B代码补全全流程

Mac开发者必备&#xff1a;OpenClaw调试QwQ-32B代码补全全流程 1. 为什么选择OpenClaw作为代码助手 作为一名长期在Mac上开发的全栈工程师&#xff0c;我一直在寻找能够真正融入工作流的智能编码工具。直到遇到OpenClaw&#xff0c;才发现这个开源的本地化AI智能体框架完美契…...

STM32F103测风扇转速,除了输入捕获,你还可以试试这个更省资源的“数脉冲”法

STM32F103风扇测速实战&#xff1a;输入捕获与数脉冲法的资源博弈 在嵌入式开发中&#xff0c;风扇转速监测是个看似简单却暗藏玄机的任务。面对STM32F103这类资源有限的Cortex-M3内核单片机&#xff0c;如何在保证功能的前提下最大化硬件利用率&#xff1f;传统输入捕获法虽精…...

手把手教你用深信服备份系统做整机恢复:从PXE到U盘启动的保姆级避坑指南

深信服整机恢复实战&#xff1a;PXE与U盘启动的深度避坑手册 当服务器突然宕机&#xff0c;硬盘彻底损坏时&#xff0c;整机恢复能力就是IT工程师的救命稻草。深信服备份系统的裸机恢复功能&#xff0c;能在没有操作系统的"裸机"上直接还原整个系统环境——但实际操作…...

哔哩下载姬DownKyi:新手快速上手指南与实战技巧

哔哩下载姬DownKyi&#xff1a;新手快速上手指南与实战技巧 【免费下载链接】downkyi 哔哩下载姬downkyi&#xff0c;哔哩哔哩网站视频下载工具&#xff0c;支持批量下载&#xff0c;支持8K、HDR、杜比视界&#xff0c;提供工具箱&#xff08;音视频提取、去水印等&#xff09;…...