当前位置: 首页 > news >正文

【读书笔记】《深入浅出数据分析》第二章 检验你的理论

文章目录

      • 一,相关分析方法
          • 1,相关系数
      • 二,相关性不等于因果关系
      • 三,证明因果关系,“控制变量法”?

本章主要说明了两个问题:
1,相关性不等于因果关系
2,如何判断两种数据之间是相关性,还是因果关系?

一,相关分析方法

当研究两种或两种以上的数据之间有什么关系时,就要用到相关分析,如果两种数据之间有关系,叫作有相关关系,否则没有相关关系。

1,相关系数

相关系数可以用来衡量两种数据之间的相关程度。
(1)相关系数的数值大小可以表示两种数据的相关程度。
(2)相关系数的正负可以表示表示两种数据的相关方向。

当两个或两个以上的变量变化方向相同,正相关,相关系数>0。例如,夏天温度越高,冰淇淋销量越高。
当两个或两个以上的变量变化方向相反,负相关,相关系数<0。例如,速度与时间。
当两个或两个以上的变量变没有相关性,相关系数=0。

在分析过程中,相关分析可以帮助发现事物之间的联系。在某些情况下,甚至可以识别数据之间的因果关系。例如,温度越高,融化越快,但是,在得出这种结论时,我们必须小心谨慎。因果关系蕴藏着相关关系,但相关关系不等于因果关系。如果我们曲解了相关关系,我们就可能陷入错误的原因谬论。

二,相关性不等于因果关系

如果A和B存在正相关,A提升,B也提升,但是我们却不能简单地认为:B提升的原因是A提升,实际上,可能存在两种可能:
(1)纯属巧合。
(2)存在第三个变量C影响着B。
例如,冰激凌销量增加导致溺水事故增多
真相是,冰淇凌销量增加(A)和溺水事故增多(B)的关系,A和B有一个共同原因就是(夏天高气温),且A和B在统计学中曲线高度一致(具有相关性),但我们却不能想当然的定义A导致B,或B导致A(因果性)。

关于相关性和因果关系的深入探讨:https://www.cnblogs.com/LittleHann/p/12463465.html#_lab2_2_1

三,证明因果关系,“控制变量法”?

在自然科学常使用到一种实验方法:“控制变量法”,借用Wiki的术语,控制变量法通常称为Scientific Control,即在实验设计上,保证实验组和对照组之间只存在一个变量影响两组之间实验结果的差异。设置对照的目的通常是为了消除其他混杂因素对于实验结果的影响。对比实验组和对照组的结果,如果结果有任何的不同,都可以归因于这个变量。这些实验背后都有物理、化学、数学等基础原理支撑的,这些原理是稳定、科学、可量化的,因此可以通过数据统计+科学实验,慢慢地发现背后的自然规律。

然而,在实际分析工作中,这套方法可能不是很适用,因为其中会有很多混杂因素的影响,这些混杂因素无法被完全消除,比如,在营销、运营、产品、销售领域,无法完全消除人主观因素的影响,所以大多时候,无法找到其中的因果关系,但知道相关关系就可以帮助我们。

比如,大数据的经典案例之一是“啤酒和尿布”的故事,沃尔玛超市通过大量的数据,通过购物篮分析发现,买啤酒的人也买尿布,于是在货物架上,把两者放一块了,结果大大提升了销售额。这个很难证明其中的因果关系,但是只要运用啤酒和尿布的相关性,就可以提高销售额。
在这里插入图片描述

再比如,某宝,某东,给我们推荐商品,背后都是对我们的行为进行相关性分析,为我们推荐感兴趣的商品,从而提高销售额。

相关文章:

【读书笔记】《深入浅出数据分析》第二章 检验你的理论

文章目录一&#xff0c;相关分析方法1&#xff0c;相关系数二&#xff0c;相关性不等于因果关系三&#xff0c;证明因果关系&#xff0c;“控制变量法”?本章主要说明了两个问题&#xff1a; 1&#xff0c;相关性不等于因果关系 2&#xff0c;如何判断两种数据之间是相关性&am…...

pyflink学习笔记(一):table_apisql

具体定义请参考官方文档&#xff1a;https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/overview/本文主要针对实际使用中比较常用的api进行整理&#xff0c;大多数例子都是官网&#xff0c;如有歧义可与官方对照。一、 创建 TableEnvironmentTab…...

GCC 编译器套件说明

写在前面&#xff1a; 本文章旨在总结备份、方便以后查询&#xff0c;由于是个人总结&#xff0c;如有不对&#xff0c;欢迎指正&#xff1b;另外&#xff0c;内容大部分来自网络、书籍、和各类手册&#xff0c;如若侵权请告知&#xff0c;马上删帖致歉。 目录GCC 简述GCC 主要…...

IDEA集成Git

1&#xff1a;IDEA集合Git1.1&#xff1a;配置Git忽略文件-IDEA特定文件问题 1:为什么要忽略他们&#xff1f;答&#xff1a; 与项目的实际功能无关&#xff0c; 不参与服务器上部署运行。把它们忽略掉能够屏蔽 IDE 工具之间的差异。问题 2&#xff1a;怎么忽略&#xff1f;1&a…...

算法流程图

里程计定位&#xff1a; 优&#xff1a;定位信息连续&#xff0c;无离散的跳跃 缺&#xff1a;存在累计误差&#xff0c;不利于长距或长期定位 传感器定位&#xff1a; 优&#xff1a;比里程计定位更精准 缺&#xff1a;会出现跳变情况&#xff0c;且传感器定位在标志物较少的环…...

Java中安装JDK环境–javac命令无效

Java中安装JDK环境–javac命令无效 一&#xff0c;安装JDK1.8 阿里云盘地址推荐 我们可以选择安装地址&#xff0c;这个地址是我们用来配置环境变量的&#xff0c;唯一注意的是这个&#xff0c;其他的都是默认下一步。直至安装完成&#xff0c;jdk下载地址https://www.oracl…...

递推问题

递推&#xff1a;在面对一个大任务的时候&#xff0c;有时候我们可以将大任务划分为小任务&#xff0c;再将小任务划分为更小的任务......&#xff0c;直到遇到初始情况&#xff0c;最后由初始情况一直往前推进&#xff0c;最后解决大任务&#xff0c;这就是递推的思想。递推问…...

js中强制类型转换Number、parseInt、parseFloat、Boolean、String、toString的使用

文章目录一、Number() 转换为整数二、Number.parseInt() 将字符串转换为整数三、Number.parseFloat() 将字符串转换为浮点数四、Boolean() 转换为布尔值五、String() 转换为字符串六、.toString() 转换为字符串最近在巩固 js 的基础知识&#xff0c;今天复习到了 js 中的数据类…...

漏斗分析法

一什么是漏斗分析&#xff1f; 漏斗分析是数据领域最常见的一种“程式化”数据分析方法&#xff0c;它能够科学地评估一种业务过程&#xff0c;从起点到终点&#xff0c;各个阶段的转化情况。通过可以量化的数据分析&#xff0c;帮助业务找到有问题的业务环节&#xff0c;并进…...

pycharm入门快捷操作(部分)

altenter&#xff1a;提示意图动作shift两次或者crtlshifta&#xff1a;查找框&#xff08;查找动作、类、项目等&#xff09;crtlw&#xff1a;一次一个字符、两次整个字符串&#xff08;if条件下选择整个判断体&#xff09;、三次整个句子、四次整个引用ctrlshiftw&#xff1…...

宣布 Databricks 支持 Amazon Graviton2,性价比提高3倍

今天&#xff0c;我们很高兴地宣布 Databricks 对基于 Amazon Graviton2 的亚马逊弹性计算云&#xff08;Amazon EC2&#xff09;实例的支持的公开预览。Graviton 处理器由亚马逊云科技进行定制设计和优化&#xff0c;为运行在 Amazon EC2 上的云工作负载提供最佳性价比。当与高…...

18_FreeRTOS任务通知

目录 任务通知的简介 任务通知值的更新方式 任务通知的优势 任务通知的劣势 任务通知值和通知状态 发送通知相关API函数 接收通知相关API函数 任务通知模拟信号量实验 任务通知模拟消息邮箱实验 任务通知模拟事件标志组实验 任务通知的简介 任务通知:用来通知任务的…...

【华为OD机试模拟题】用 C++ 实现 - 整理扑克牌(2023.Q1)

最近更新的博客 华为OD机试 - 入栈出栈(C++) | 附带编码思路 【2023】 华为OD机试 - 箱子之形摆放(C++) | 附带编码思路 【2023】 华为OD机试 - 简易内存池 2(C++) | 附带编码思路 【2023】 华为OD机试 - 第 N 个排列(C++) | 附带编码思路 【2023】 华为OD机试 - 考古…...

mysql lesson1

常用命令 1:exit 退出mysql 2&#xff1a;uroot pENTER键&#xff0c;再输入密码&#xff0c;不被别人看见 3&#xff1a;完美卸载&#xff1a;双击安装包&#xff0c;手动删除program file中的mysql,手动删除Programedate里的mysql 4:use mysql 使用数据库 5&#xff1a;…...

联想笔记本无法下载 Lenovo Vantage

状况 在 Microsoft Store 下载时发生错误&#xff0c;可能是如下代码&#xff1a;0x80070005, 0x80073D05, or 0x80070017. 解决方法 1.在“开始”菜单搜索栏中输入PowerShell 2.当Windows PowerShell出现在“开始”菜单中&#xff0c;右键点击此图标&#xff0c;然后选择以…...

功能性材料深入超级赛道,赋能多行业迭代升级

中国国际胶粘剂及密封剂展览会深耕胶粘剂、密封剂和胶粘带行业26年&#xff0c;是行业认可的、优质的贸易与技术交流平台。展会连接了十几个行业的买家和卖家&#xff0c;包括汽车、电子、新能源、轨道交通、工业等重要领域&#xff0c;为客户提供封装、粘合、散热、装配制造等…...

【项目精选】jsp企业快信系统(论文+视频+源码)

点击下载源码 计算机网络的出现到现在已经经历了翻天覆地的重大改变。因特网也从最早的供科学家交流心得的简单的文本浏览器发展成为了商务和信息的中心。到了今天&#xff0c;互联网已经成为了大量应用的首选平台&#xff0c;人们已经渐渐习惯了网络交易&#xff0c;渐渐对网络…...

通信算法之112:载波同步及comm.CarrierSynchronizer

1. 2. 载波同步是基于锁相环技术使本地获取和载波同频同相的参考信号&#xff0c;用来解调信号。载波同步就是对本地参考信号进行频率和相位偏差的补偿&#xff0c;进而实现本地参考信号和载波信号同频同相。 载波同步只适用于单载波调制系统&#xff0c;载波同步算法对于BPSK、…...

【C. Build Permutation】(整数理论、构造、思维)

链接 理论基础 结论&#xff1a;在区间[n,2n]上&#xff0c;至少存在一个完全平方数。结论&#xff1a;在区间[n,2n]上&#xff0c;至少存在一个完全平方数。结论&#xff1a;在区间[n,2n]上&#xff0c;至少存在一个完全平方数。 构造⌈n⌉2构造\lceil \sqrt{n}\rceil^2构造⌈…...

前端面试题:事件循环(Eventloop)

什么是事件循环&#xff1f;如何理解事件循环?事件循环原理如何描述&#xff1f;事件循环涉及了很多知识点&#xff0c;想要彻底掌握JS事件循环原理必须要掌握以下知识点&#xff1a;同步任务、异步任务、宏任务、微任务、任务队列、执行栈、js运行机制、EventLoop。 1.事件循…...

jmeter接口自动化测试框架

接口测试可以分为两部分&#xff1a; 一是线上接口&#xff08;生产环境&#xff09;自动化测试&#xff0c;需要自动定时执行&#xff0c;每5分钟自动执行一次&#xff0c;相当于每5分钟就检查一遍线上的接口是否正常&#xff0c;有异常能够及时发现&#xff0c;不至于影响用…...

树莓派CM4基础设置

安装系统1.1 软件和硬件准备硬件&#xff1a;CM4&#xff08;4GB DDR32GB EMMC 板载WIFI和蓝牙&#xff09;CM4-to-Pi4-Adapter软件&#xff1a;Raspberry Pi或者 Win32DiskImagerRaspberry Pi下载链接&#xff1a;点击直接下载Win32DiskImager下载链接&#xff1a;链接&#x…...

JS 合并数组的三大方式

1. 数组的不可变合并 1.1使用扩展运算符进行合并 如果您想知道一种在JavaScript中合并数组的好方法&#xff0c;那么请记住使用扩展操作符进行合并。 在数组字面量中写入两个或更多带有扩展操作符…前缀的数组&#xff0c;JavaScript将创建一个合并所有这些数组的新数组: co…...

30岁测试开发年薪不足50万,被面试官嘲讽混得太差?

近日&#xff0c;有网友发帖称&#xff1a;“30岁去应聘测试开发&#xff0c;拿不到七八十万的年薪确实有点丢人了&#xff0c;还被面试官diss混得太差了”&#xff0c;网友们看完都炸了。 来看看网友们都是怎么说的。 有网友说&#xff1a; 扯淡 有网友气到&#xff1a; 那拿…...

【C语言】多线程

多线程线程线程的优点C语言多线程创建线程终止线程连接和分离线程开启一个线程最基本的多线程实现开启两个线程多线程进行协同运算无参数传递的线程并发编程实例简单参数传递的线程并发编程实例结构体参数传递的线程并发编程实例线程的连接编程实例信号量同步进行写入互斥信号量…...

CDGA|浅谈“以治促用,以用促治”的数据治理战略

数据治理夯实企业数字化转型基础。采取“以治促用&#xff0c;以用促治”的数据治理战略&#xff0c;可以充分释放了企业核心运行要素的活力。 “以治促用”是指通过建立在数据治理链路及用户多维评估系统的基础上&#xff0c;对数据资产重新进行价值识别&#xff0c;推进高价值…...

Apifox-比postman更优秀的接口自动化测试平台

一、Apifox介绍 Apifox 是 API 文档、API 调试、API Mock、API 自动化测试一体化协作平台&#xff0c;定位 Postman Swagger Mock JMeter。通过一套系统、一份数据&#xff0c;解决多个系统之间的数据同步问题。只要定义好 API 文档&#xff0c;API 调试、API 数据 Mock、A…...

周期矩形波的傅里叶级数展开(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…...

前端预防XSS攻击全攻略

如何防止XSS攻击 一、是撒子 XSS攻击&#xff08;跨站点脚本攻击&#xff09;&#xff0c;就是黑客恶意篡改你网页的前端代码&#xff0c;在里面注入一些恶意的 htmljavascript的脚本&#xff0c;并在你的浏览器内运行&#xff0c;获取你的信息&#xff0c;或者进行一些恶意操…...

JUC(一)

1.AQS原理 1.1.概述 1>.AQS全称是 AbstractQueuedSynchronizer,是阻塞式锁和相关的同步器工具的框架; 2>.特点: ①.用state属性来表示资源的状态(分独占模式和共享模式),子类需要定义如何维护这个状态,控制如何获取锁和释放锁; getState: 获取state状态;setStata: 设置…...