数据分析--统计学知识
描述型统计
描述统计
1.集中趋势 :众数、平均数、分位数
2.离散趋势: 极值(max)、极差(max-min)、平均差、方差、标准差、分位差
3.分布:峰泰、偏度
推理型统计
概率分布:离散型分布、连续型分布
离散型分布
二项分布:如抛硬币n次,不同正面朝上的次数对应的概率
几何分布:如抛硬币n次,到第k次才取得第一次成功的概率服从的分布
泊松分布:在一定时间范围内发生概率相同,给定其发生的平均发生的次数μ,则事件在该事件范围内发生k次的概率服从泊松分布
概率分布:
连续型分布
正态分布
2.假设检验
无效假设:
备择假设
样本抽样
结果检验
假设检验基本步骤
1建立原假设
2选择检验统计量
3寻找拒绝阈
计算样本统计量的值,和临界值做比较,做判断
数据分析里的统计学模型
回归模型
聚类模型
贝叶斯模型
1.回归?
某些因素对目标的影响程度,也就是影响因子
2.相关性分析?
研究事务的因果联系
3.避免伪相关,先定性
1.从业务逻辑出发,不断拆解指标,下钻
2.ABtest实验,测试因素是否对结果产生影响
3.找相关指标或因素替代,或直接删除
4.定量,回归分析
1.确定x、y
x:自变量
y: 因变量
2.建立回归模型
3.回归检验
1.Multiple R:也就是R值,表明自变量与因变量之间相关性大小的值
2 .R Square: R的平方值是指拟合系数,是自变量解释因变量差距的大小
3.Adjusted R Square:调整后的R square,说明自变量能说明因变量百分比
4.标准误差: 用来衡量拟合程度的大小1
5.观察值:用于训练回归方程的样本数据有多少个;
6.SignificanceF: 是指显著性检验度,其实就是我们上节课讲到的P值
7.T Stat: T检验中统计量t值,用于对模型参数的检验
8. Value P:是指系数的显著性检验度
总结
回归模型
定性分析:相关性分析、怎么定性
定量分析:规范回归(y定义清晰、x精准有力)、怎么定量
二、聚类模型
分类:已知分类标准和规则
聚类:根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终相似数据为一组,同类相同、异类相异
3、聚类步骤?
第一步确定分组k=0
第二步:随机选k个值为数据中心选择A、B两个点为初始中心
第三步:其他数值与数据中心的距离
第四步:重新选择数据中心
第五步:再次计算距离
第六步:再次重新选择数据中心
第七步:再次计算距离
相关文章:
![](https://img-blog.csdnimg.cn/633b82685eee48b5811d2a9243d6a73b.png)
数据分析--统计学知识
描述型统计 描述统计 1.集中趋势 :众数、平均数、分位数 2.离散趋势: 极值(max)、极差(max-min)、平均差、方差、标准差、分位差 3.分布:峰泰、偏度 推理型统计 概率分布:离散型…...
![](https://img-blog.csdnimg.cn/b92d40571f164afd89ce38f4d556068e.png#pic_center)
matlab 计算点云协方差矩阵
目录 一、概述1、算法概述2、主要函数二、代码示例三、结果展示四、参数解析输入参数输出参数五、参考链接本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、概述...
![](https://www.ngui.cc/images/no-images.jpg)
python进阶之图像编程 pillow扩展库
一、概述 1.1pillow简介 Python Imaging Library (PIL)是python 下的图像处理模块,支持多种格式,并提供强大的图像处理功能,可以通过pip进行安装后使用。 1.2pillow具体应用 Pillow 库是 Python3 最常用的图像处理库,它支持多种图像格式&a…...
![](https://www.ngui.cc/images/no-images.jpg)
TiCDC Canal-JSON 消息接收示例(Java 版)
1.引言 业务程序经常会通过各式各样的缓存来提升用户的访问速度。 由于存在缓存,在一些实时性要求较高的场景中,需要在数据变更的同时将数据缓存进行更新或删除。 如果数据本身由其他业务部门提供,就无法在写入的同时做缓存的一致性处理。…...
![](https://img-blog.csdnimg.cn/img_convert/046e1b5c3ed89ba8faa8b28e207a052a.png)
SQLite、MySQL、PostgreSQL3个关系数据库之间的对比
引言 关系数据模型以行和列的表格形式组织数据,在数据库管理工具中占主导地位。今天还有其他数据模型,包括NoSQL和NewSQL,但是关系数据库管理系统(RDBMS)仍然占主导地位用于存储和管理全球数据。 本文比较了三种实现最…...
![](https://img-blog.csdnimg.cn/img_convert/e1b8a62fe5fcfb378364fc38fdd58d37.jpeg)
开源容灾备份软件,开源cdp备份软件
数据的安全性和完整性面临着硬件问题、黑客攻击、人为错误等各种威胁。在这种环境下,开源容灾备份软件应运而生,通过提供自动数据备份和恢复,有效地保证了公司的数据安全。 一、开源容灾备份软件的定义和作用 开源容灾备份软件是一种基于开源…...
![](https://www.ngui.cc/images/no-images.jpg)
Java合并区间
问题: 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 。 示例: 示例 1ÿ…...
![](https://www.ngui.cc/images/no-images.jpg)
前端面试:【代码质量与工程实践】单元测试、集成测试和持续集成
在现代软件开发中,确保代码质量是至关重要的。单元测试、集成测试和持续集成是关键的工程实践,用于提高代码的可靠性和可维护性。本文将深入探讨这些概念,以及它们如何在软件开发中发挥作用。 1. 单元测试(Unit Testing࿰…...
![](https://img-blog.csdnimg.cn/bed2a51fe27642ea9e21ebfc5006394c.png)
2023/8/17总结
项目完善: 算法推荐 item-CF 算法推荐我主要写的是协同过滤算法,然后协同过滤算法分成俩种—— 基于用户的 user-CF 基于物品的 item-CF 因为害怕用户冷启动,和数据量的原因 我选择了 item-CF 主要思路是——根据用户的点赞列表&…...
![](https://img-blog.csdnimg.cn/0577df4069494af19d2d7fe82eb71c41.png)
REDIS 7 教程 数据类型-进阶篇
⑥ *位图 bitmap 1. 理论 由0和1 状态表现的二进制位的bit 数组。 说明:用String 类型作为底层数据结构实现的一种统计二值状态的数据类型 位图本质是数组,它是基于String 数据类型的按位操作。该数组由多个二进制位组成,每个二进制位都对应一个偏…...
![](https://img-blog.csdnimg.cn/img_convert/d7b74195e18ace5710d9a7e29fc45358.png)
图文并茂:Python Tkinter从入门到高级实战全解析
目录 介绍什么是Tkinter?准备工作第一个Tkinter程序界面布局事件处理补充知识点 文本输入框复选框和单选框列表框弹出对话框 综合案例:待办事项列表总结 介绍 欢迎来到本篇文章,我们将带您深入了解如何在Python中使用Tkinter库来创建图形用…...
![](https://img-blog.csdnimg.cn/8278907884f245f595314d9363b984cd.png#pic_center)
npm和yarn的区别?
文章目录 前言npm和yarn的作用和特点npm和yarn的安装的机制npm安装机制yarn安装机制检测包解析包获取包链接包构建包 总结后言 前言 这一期给大家讲解npm和yarn的一些区别 npm和yarn的作用和特点 包管理:npm 和 yarn 可以用于安装、更新和删除 JavaScript 包。它们提…...
![](https://www.ngui.cc/images/no-images.jpg)
微服务项目容器编排docker-compose.yml、Dockerfile文件模板、相关配置文件、shell脚本
nacos Dockerfile(不需要特殊处理,使用docker conpose可以不写) # 基础镜像 FROM nacos/nacos-server # author MAINTAINER jianglifeng<jlifengfoxmail.com> RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime \ &&a…...
![](https://img-blog.csdnimg.cn/144f12009179409abf2a7904ca0b9a84.png)
算法通过村第三关-数组黄金笔记|数组难解
文章目录 前言数组中出现超过一半的数字数组中只出现一次的数字颜色的分类问题(荷兰国旗问题)基于冒泡排序的双指针(快慢指针)基于快排的双指针(对撞指针) 总结 前言 提示:苦不来自外在环境中的人、事、物,…...
![](https://www.ngui.cc/images/no-images.jpg)
【2023】LeetCode HOT 100——矩阵
目录 1. 矩阵置零1.1 C++实现1.2 Python实现1.3 时空分析2. 螺旋矩阵2.1 C++实现2.2 Python实现2.3 时空分析3. 旋转图像3.1 C++实现3.2 Python实现3.3 时空分析4. 搜索二维矩阵 II4.1 C++实现4.2 Python实现4.3 时空分析1. 矩阵置零 🔗 原题链接:...
![](https://img-blog.csdnimg.cn/7045376bbbec41aab43a2a4122344cd5.png)
springboot源码方法
利用LinkedHashSet移除List重复的数据protected final <T> List<T> removeDuplicates(List<T> list) {return new ArrayList<>(new LinkedHashSet<>(list));} SpringFactoriesLoader#loadFactoryNames 加载配置文件...
![](https://www.ngui.cc/images/no-images.jpg)
基于java街球社区网站设计与实现
摘 要 本文主要讲述了基于SpringBootVue模式的街球社区网站的设计与实现。这里所谓的街球社区网站是通过类似于百度贴吧之类的网上论坛使得所有的街球爱好者有一个可以互相交流的平台,并使所有用户可以在社区进行教学视频的观看以及相关体育运动产品的选购,平台的盈利主要靠…...
![](https://www.ngui.cc/images/no-images.jpg)
定时产生不同频率方波
/*----------------------------------------------- 内容:通过定时产生不同频率方波 ------------------------------------------------*/ #include<reg52.h> //包含头文件,一般情况不需要改动,头文件包含特殊功能寄存器的定义 /*-…...
![](https://img-blog.csdnimg.cn/0257a006bbc944c7b8923c23bc83f602.png)
Java“牵手”天猫商品sku信息API接口数据,天猫API接口申请指南
天猫平台商品sku属性信息接口是开放平台提供的一种API接口,通过调用API接口,开发者可以获取天猫商品的标题、价格、库存、月销量、总销量、库存、详情描述、图片等详细信息 。 获取商品销量接口API是一种用于获取电商平台上商品sku属性数据的接口&#…...
![](https://img-blog.csdnimg.cn/58451380d6cb4edabb75a6c6d1b799ba.png#pic_center)
【⑮MySQL | 视图】概述 | 创建 | 查看 | 更新 | 修改 | 删除
前言 ✨欢迎来到小K的MySQL专栏,本节将为大家带来MySQL视图概述 | 创建 | 查看 | 更新 | 修改 | 删除的分享✨ 目录 前言1.视图概述2.创建视图3.查看视图4.更新视图数据5.修改视图6.删除视图总结 1.视图概述 1.1 为什么使用视图? 视图一方面可以帮我们使…...
![](https://img-blog.csdnimg.cn/86c1971480a94912855514007bf3ad82.png)
Linux驱动开发一、RK3568把hello编译到Linux内核中运行。‘rk_vendor_read’未定义的引用
1、在字符设备目录下建立hello目录 ~/Linux/rk356x_linux/kernel/drivers/char/hello 2、进入hello目录,新建hello.c、Makefile、Kconfig三个文件 3、Kconfig是打开make menuconfig配置界面是后的选项,这Kconfig是在字符设备下的。 config HELLOtrist…...
![](https://www.ngui.cc/images/no-images.jpg)
enable_shared_from_this
用途: enable_shared_from_this 是一个基类模板,用于解决在类成员函数中获取类对象的 shared_ptr 的需求。它提供了一种机制,使类能够安全地从成员函数内部获得指向自身的 shared_ptr。 解决对象生命周期管理问题:在某些情况下&…...
![](https://img-blog.csdnimg.cn/befe01de12754cacb94f9901f310d880.png)
weak_ptr是怎么探知对象生死的
weak_ptr是C智能指针中的一种。它用于解决共享所有权的问题,并且可以避免因循环引用而导致的内存泄漏。 weak_ptr本身并不承担对象的所有权,它指向由shared_ptr管理的对象。与shared_ptr不同,weak_ptr并不会增加计数器来计算对象的引用次数。…...
![](https://img-blog.csdnimg.cn/img_convert/fed06f66f5bfa8e4b3d1af032a0a87b2.jpeg)
⌈算法进阶⌋图论::拓扑排序(Topological Sorting)——快速理解到熟练运用
目录 一、原理 1. 引例:207.课程表 2. 应用场景 3. 代码思路 二、代码模板 三、练习 1、210.课程表Ⅱ🟢 2、2392.给定条件下构造举证🟡 3、310.最小高度树 🟡 一、原理 1. 引例:207.课程表 就如大学课程安排一样&…...
![](https://www.ngui.cc/images/no-images.jpg)
【Python】【数据结构和算法】保留最后N个元素
使用deque,指定maxlen参数的值为N,例如: >>> from collections import deque >>> dq deque(maxlen3) >>> dq.append(1) >>> dq.append(2) >>> dq.append(3) >>> dq.append(4) >&…...
![](https://www.ngui.cc/images/no-images.jpg)
wireshark 基本使用
在Wireshark中,你可以使用过滤器来根据接口名称定位到特定的包。下面是一些常见的过滤器示例: 根据源或目的IP地址过滤: ip.src 192.168.0.1:过滤源IP地址为192.168.0.1的包。ip.dst 192.168.0.1:过滤目的IP地址为…...
![](https://www.ngui.cc/images/no-images.jpg)
2、结构型设计模式
结构型设计模式 目录 结构型设计模式1. 代理模式1.1 概述1.2 结构1.3 静态代理1)抽象主题类 SellTickets2)真实主题类 TrainStation3)代理类 ProxyPoint4)客户端类1.4 JDK 动态代理1)代理工厂类:ProxyFactory2)客户端类3)JDK 动态代理原理4)动态代理的执行流程是什么样…...
![](https://img-blog.csdnimg.cn/6febee3b78a84871bacc2ef39830fa3e.png)
JavaScript下载excel文件
文章目录 通过链接下载a标签下载方法注意 获取文件流请求体配置下载文件流 总结 通过链接下载 a标签 对于已知地址的目标文件,前端可以使用 a标签 来直接下载,使用a标签下载使用到两个属性 download:下载文件名href:目标文件下…...
![](https://img-blog.csdnimg.cn/2f0955cb9e8b46e7a3c7141e07ab2e11.png)
研磨设计模式day12命令模式
目录 定义 几个参数 场景描述 代码示例 参数化设置 命令模式的优点 本质 何时选用 定义 几个参数 Command:定义命令的接口。 ConcreteCommand:命令接口的实现对象。但不是真正实现,是通过接收者的功能来完成命令要执行的操作 Receiver&#x…...
![](https://www.ngui.cc/images/no-images.jpg)
设计模式 06 适配器模式
适配器模式(Adapter Pattern)属于结构型模式 概述 结构型模式关注如何将现有的类或对象组织在一起形成更加强大的结构。 在生活中,我们经常遇到这样的一个问题:轻薄笔记本通常只有 type-c 或者 usb-a 接口,没有网口。…...
![](http://www.thinkphp.cn/Uploads/editor/2014-05-14/53732219a112a.png)
长沙优化网站服务/百度双十一活动
浏览:158发布日期:2014/05/14分类:技术分享关键字: win8wamp前几天心血来潮买了笔记本Thinpad T440 自带的win8系统,本来想换了的,想想挺可惜,就没换,安装软件,一路顺畅&…...
![](/Images/OutliningIndicators/None.gif)
网站怎么做才能上百度首页/友情链接联盟
Hibernate中进行数据库增删改的代码,太多不想背了,记在这里以后来查好啦~~~~packageorg.lxh.hibernate.demo01;importjava.util.Iterator;importjava.util.List;importorg.hibernate.Query;importorg.hibernate.Session;importorg.hibernate.SessionFact…...
![](https://img-blog.csdnimg.cn/0dfb0012fc0343c29cee22e5b844f9d9.png)
网站建设资讯版块如何做用户运营/长沙优化科技
解决方法 pycharm配置环境变量: PYTHONUNBUFFERED1;SPARK_HOMEF:\spark-3.3.0-bin-hadoop3;PYSPARK_PYTHONpython 或者配置他们到windows环境变量,然后重启pycharm....
![](/images/no-images.jpg)
网站建设企业排名/咸阳seo
protected transient int modCount 0;这个属性是记录这个List被修改的次数。在以下几个内部类和非public类中使用。private class Itr implements Iterator首先先看这个内部类,实现了迭代器接口。int cursor 0;这个变量是游标。int lastRet -1;这个变量代表的是上…...
![](https://img-blog.csdnimg.cn/img_convert/ea1cff44e9467af75984cdedba7397d5.png)
医院建设网站/搜索引擎调词软件
Ⅰ 英语单词的 排序首先楼主所提供的句子是一个固定句式,也就是一种习惯用法(是宾语回前置结构),这种习惯用法答不仅读起来朗朗上口,而且将说话人强调“赚更多的钱,然后才能花更多的钱”的隐含意思表达了出来,如果用一…...