读书笔记//来自公众号(1)
——【9大数据分析方法】——
总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。
总结2:抓住两个关键因素:维度(类别)、指标
一、周期性分析
1.常见的周期包括2种:自然周期/生命周期。
- 自然周期:指标随时间推移而自然发生波动。
- 生命周期依据对象分为3类:商品生命周期,app生命周期,用户生命周期。参考线:时间轴+指标走势。如:第1天/第2天/第3天,天/周/月。
2.周期性分析的作用:做出一个参考曲线,为进一步判断提供依据。
二、结构分析
1.结构分析,对指标在维度上做层层拆解和对比,如用户、行业、渠道、区域、产品等维度。
2.结构分析的作用:把握结构变化情况,追踪指标走势,能快速定位问题发生点,为进一步针对性提出解决方案提供方向。
三、分层分析
1.用户分群、商品ABC分析、行业二八法则,本质就是分层分析。
2.分层分析,针对单一指标,是为了应对平均值失效的场景,如异常值、极大值等
3.设定分层的层级的方法: “二四六八十”法则
- 比平均值高的,根据平均值的2倍、4倍、6倍、、分层。
- 比平均值低的,根据平均值的1/2、1/4分层。
4.分层分析的作用:是其他分析的前哨战,做好分层,能引发更多思考和分析。
5.单一指标用分层分析,两个指标用矩阵分析,多个指标用DEA模型。
四、矩阵分析
1.矩阵分析,对两个指标各自确定一个阈值分类点,划分出4个象限,把分析对象映射到矩阵图上。阈值客观上可以取平均数,主观上可以根据专家判断、或资源承受力等。
2.矩阵分析的作用:从两个指标交叉对比种发现问题。
3.常见的KANO模型(用户需求分析)和波士顿矩阵(企业实力分析),本质就是找两个评价指标,构造交叉矩阵,对业务分类。两个指标可以是互相矛盾的(收入规模和利润)、或互相促进的(增长率和占有率)。
4.有两个场景不适合用矩阵分析,①有极值影响平均数,②两个指标高度相关。
五、指标拆解
1.常见指标关系:
- 并列关系(相互独立),如业绩=客户数x消费率x客单价
- 串行关系(前后关系),如漏斗模型最后一个指标的逆推
2.固定的指标拆解法:财务分析领域的杜邦分析(利润=收入-成本),零售行业的人货场模型。
3.指标拆解的流程:
- 找到主指标
- 找到负责主指标的部门
- 确认子指标可采集到数据
- 列车拆解公式,进行数据对比
4.指标拆解的作用:可以发现问题,解释问题。
六、漏斗分析
1.漏斗分析,可处理多个指标,指标对应业务在流程上有顺序关系。
2.漏斗分析的作用:可以看到问题发生在哪里,但无法解释。
七、相关分析
1.直接相关,即有些指标之间天然存在关系,有三种形式:
- 在结构分析法种,整体指标与部分指标之间的关系
- 在指标拆解中,主指标与子指标之间的关系
- 在漏斗分析法中,前后步骤指标之间的关系
2.间接相关。有两种常用分析方法:散点图、计算相关系数。
3.相关分析法的不足: - 相关不等于因果
- 相关分析不能解决非量化指标因素。有时候我们寻找关系的因素不能量化,如装修风格。关于非量化特征与指标的关系,用标签分析法。
4.相关分析的作用:可以解释问题、可以预测。
八、标签分析
1.标签分析,把难以量化的因素转化为标签类别,比较不同标签下指标的差异。
2.标签化要确保标准统一、达成统一认识。
3.qx感觉标签分析与结构分析有很多相似之处。
九、MECE法
1.当有太多因素影响分析不知从何入手,可以用MECE把影响因素梳理清楚。先把最大因素分离出来,再分离小的因素。由大到小,逐步剥洋葱。
2.MECE指的是相互独立、完全穷尽的分类原则,可采用二分法(A和非A)。
3.该方法的不足是,有些因素无法量化,有时候缺乏数据。
——【必备7大能力】——
能力一:理解业务
业务流程、业务动作、业务方期望的结果
能力二:梳理需求
清晰的需求要说清楚5W:
who:数据使用者
when:数据使用时间
where:数据使用场合
why:使用数据原因(做监控?找原因?做预测?)
what:具体数据格式
能力三:梳理指标体系
qx根据我的项目经验,一开始的指标比较基础,往往为了满足监控和效果统计,随着业务深入开展,需要查找指标异常原因,在分析中提炼固化一些指标。业务发生变化,如变动更复杂更多样,相应要增加指标,同时理清指标间的关系。
能力四:梳理标签体系
注意:业务部门对标签有约定俗成的说法,不同部门之间标签口径混乱不一。能沟通一致最好,不能的话出报告要备注。
能力五:选择分析方法——数据分析
预测类方法:用哪个模型?
原因类方法:从哪个角度切入?如果构建逻辑链?
检验类方法:假设是什么?从哪个角度检验?
评估类方法:从哪些角度评估更合理、全面?
能力六:设计数据实验
结合业务流程,设计实验方法,要考虑具体问题:如抽样方式、样本量等等。
能力七:输出数据报告
做好汇报,很考验综合能力。数据分析首先是描述和发现问题。异常指标往往指向对应业务的负责人/负责部门,这是个找茬的活儿啊。
业务通常会找各种理由:
- 质疑数据
- 活动不如预期、指标不达标,如“自然增长率”计算不合理,或者大环境不行
本篇整理来自微信公众号【码工小熊】。作者在互联网大厂从事数据分析,很勤快,写了很多总结。有一些真知灼见,值得摘要。
相关文章:
读书笔记//来自公众号(1)
——【9大数据分析方法】—— 总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。 总结2:抓住两个关键因素:维度(类别)、指标 一、周期性分析 1.常见的周期包括2种:自然周期…...
10款让程序员用了会上瘾的工具
程序员必定会爱上的10款工具,相信肯定有不少是你的心头好,尤其是第4款。 第一款:TrueCryptTrueCrypt 可能很多人没用过,它是一个加密软件,能够对磁盘进行加密。还在担心自己电脑中的重要文件、私密档案被人查看&…...
类和对象(下)(一)
类和对象(下)(一)1.再谈构造函数1.1构造函数体赋值1.2初始化列表1.3explicit关键字2.static成员2.1概念2.2特性3.匿名对象🌟🌟hello,各位读者大大们你们好呀🌟🌟 &#x…...
46.在ROS中实现global planner(2)
前文实现了一个global planner的模板,并且可以工作,本文将实现astar算法,为后续完成一个astar global planner做准备 1. AStar简介 1.1 AStar Astar算法是一种图形搜索算法,常用于寻路。Astar算法原理网上可以找到很多,简单的说…...
05- 泰坦尼克号海难生死预测 (机器学习集成算法) (项目五)
Kaggle: 一个数据建模和数据分析竞赛平台sns画柱状图: sns.barplot(datatrain,xPclass,ySurvived)查看数据分布(survived 和 fare): sns.FacetGrid(train,hueSurvived,aspect3) ageFacetsns.FacetGrid(train,hueSurvived,aspect3) ageFacet.map(sns.kdeplot,Fare,shadeTrue) …...
【python百炼成魔】python运算符的使用与输入输出函数
文章目录前言一. python 运算符1.1 算术运算符1.2 .赋值运算符1.3 比较运算符1.4. 布尔运算符二. 输入和输出函数2.1 print函数2.1.1 help函数查看帮助文档2.1.2 print的格式化输出2.2 format函数2.3 input数据接收函数写在最后前言 Python 中的运算符主要分为算术运算符、比较…...
uniapp实现app检查更新与升级-uni-upgrade-center详解
app检查更新与升级 参考链接: 升级中心uni-upgrade-center - App uni-admin h5 api App资源在线升级更新 uni-app使用plus注意事项 关于在线升级(WGT)的几个疑问 什么是升级中心uni-upgrade-center uniapp官方开发的App版本更新的插件&#…...
公司项目引入这种方式,开发应用真是又快又准!
试想一下,你开足马力提了一串需求,给开发精英团队也好,给外包也行,都要等个半年甚至更久才会给到你一个满意的产品,你是否还有动力? 这还不止,业务越来越复杂,最初的需求也在随着着…...
virtuoso数据库介绍
在国内,对海量 RDF 数据的管理有着迫切的实际需求; RDF:Resource Description Framework,是一个使用XML语法来表示的资料模型(Data model),用来描述Web资源的特性,及资源与资源之间的关系。 Virtuoso可以对…...
linux高级命令之编辑器 vim
编辑器 vim学习目标能够说出vim的三种工作模式能够说出vim对应复制和粘贴命令1. vim 的介绍vim 是一款功能强大的文本编辑器,也是早年 Vi 编辑器的加强版,它的最大特色就是使用命令进行编辑,完全脱离了鼠标的操作。2. vim 的工作模式命令模式…...
分布式光伏储能系统的优化配置方法(Matlab代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...
Grafana loki部署及使用及问题处理方法(超详细)
一、下载软件 因为我是本地测试,所以用的windows版本的包,loki服务window版本的安装包下载地址:下载地址,选择 promtail-windows版本的安装包下载地址:下载地址 Grafana服务的下载地址:下载地址 二、配置…...
vue项目如何使用 SheetJS(xlsx)插件?
简言 SheetJS是一款非常好用的前端处理表格文件的工具。它分社区版和专业版,我们今天来介绍如何简单使用它的社区版。 SheetJS社区版官网 介绍 你应该打开官网浏览具体使用详情。 安装 打开官网在如上图的Installation板块中可以找到各种运行模块的使用方式。 …...
项目管理工具dhtmlxGantt甘特图入门教程(九):支持哪些数据格式(上篇)
dhtmlxGantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表,可满足项目管理控件应用程序的所有需求,是最完善的甘特图图表库这篇文章给大家讲解 dhtmlxGantt 的数据属性和数据库结构。 DhtmlxGantt正版试用下载(qun:764…...
iView Table合并单元格(行、列)
行/列合并设置属性 span-method 可以指定合并行或列的算法。该方法参数为 4 个对象:row: 当前行column: 当前列rowIndex: 当前行索引columnIndex: 当前列索引该函数可以返回一个包含两个元素的数组,第一个元素代表 rowspan,第二个元素代表 co…...
如何用P6软件编制项目进度计划(下)
卷首语 根据项目合同包含的工作范围进行工作分解(WBS),按照业主的要求及项目管理的需要,考虑不同阶段和层次,适时编制出项目管理所要求的的各级进度计划。 4搜集项目计划与进度控制相关信息 搜集与项目计划编制与进…...
环境配置完整指导——Installing C++ Distributions of PyTorch
目录一、前言二、动手开始做1. 安装cuda 11.42. 安装visual studio 2019 community3. 安装libtorch4. 安装mingw-w645. 配置环境变量6. 打开vscode开始写程序7. 运行程序8. 其他报错信息文章简介:这篇文章用于介绍在windows10 vscode中,跑通如下代码的全…...
深度学习——自注意力机制和位置编码(笔记)
1.自注意力: ①在深度学习中,经常使用卷积神经网络或者循环神经网络对序列进行编码 ②对于key,value和query,自注意力有一套自己的选法,因为key,value和query的值来自同一组输入。因此被称为自注意力或内部注意力 2…...
内网渗透(三十)之横向移动篇-利用远控工具向日葵横向移动
系列文章第一章节之基础知识篇 内网渗透(一)之基础知识-内网渗透介绍和概述 内网渗透(二)之基础知识-工作组介绍 内网渗透(三)之基础知识-域环境的介绍和优点 内网渗透(四)之基础知识-搭建域环境 内网渗透(五)之基础知识-Active Directory活动目录介绍和使用 内网渗透(六)之基…...
自动化测试中,该如何高效管理测试数据?
今晚在某个测试群,看到有人问了一个问题:把测试数据放配置文件读取和放文件通过函数调用读取有什么区别? 当时我下意识的这么回答:数据量越大,配置文件越臃肿,放在专门的数据文件(比如excel&am…...
Qt中项目A调用另一个项目B的方法汇总
在开发一个软件项目时候,当涉及到一个模块,已经有过类似的项目开发,为了避免重复开发,涉及到在该项目的工程中调用已开发的项目作为子项目,有很多种方法。 一、将项目编译成库文件然后进行调用 调用库文件通常有两种…...
【项目精选】基于Javaee的影视创作论坛的设计与实现(视频+论文+源码)
点击下载源码 基于Javaee的影视创作论坛的设计与实现主要用功能包括: 首页推荐、用户管理、影片管理、评论管理、 预告片管理、海报管理、公告管理、数据检索、用户注册与登录等等功能、统结构如下 (1)后台管理: 管理模块:管理员…...
深入【虚拟列表】动态高度、缓冲、异步加载... Vue实现
前言🎀 在前文中我们了解到: 1.在某种特殊场景下,我们需要将 大量数据 使用不分页的方式渲染到列表上,这种列表叫做长列表。 2.因为事件循环的机制,一次性大量的渲染耗时较长,并且渲染期间会阻塞页面交互…...
Windows 11 + WSL(ubuntu 20.04) + CLion(2022.3) 编译OpenJDK12
编译OpenJDK12 目录编译OpenJDK12前言一、下载OpenJDK源码二、编译OpenJDK参考https://openjdk.org/groups/build/doc/building.html1:安装编译所需的组件2:执行编译命令3:验证编译结果三、在Clion中调试OpenJDK源码1:Clion中配置…...
Freemarker 语法精粹
文章目录说明基本用法宏加载宏定义宏文件写法import和include区别内置方法注册全局共享变量处理空值和默认值获得hashmap的键值从map中拿对象遍历Map其它小技巧迁移事项参考说明 Freemarker 还存在我的一些老项目中,比起前端框架,自有它的简便之处&…...
使用Benchto框架对Trino进行SQL性能对比测试
有时需要对魔改源码前后的不同版本Trino引擎进行性能对比测试,提前发现改造前后是否有性能变差或变好的现象,避免影响数据业务的日常查询任务性能。而Trino社区正好提供了一个性能测试对比框架:GitHub - trinodb/benchto: Framework for runn…...
Redis之哨兵模式
什么是哨兵模式? Sentinel(哨兵)是用于监控Redis集群中Master状态的工具,是Redis高可用解决方案,哨兵可以监视一个或者多个redis master服务,以及这些master服务的所有从服务。 某个master服务宕机后,会把这个master下…...
Selenium自动化测试Python二:WebDriver基础
欢迎阅读WebDriver基础讲义。本篇讲义将会重点介绍Selenium WebDriver的环境搭建和基本使用方法。 WebDriver环境搭建 Selenium WebDriver 又称为 Selenium2。 Selenium 1 WebDriver Selenium 2 WebDriver是主流Web应用自动化测试框架,具有清晰面向对象 API&…...
蓝桥杯模块学习17——AT24C02存储器(深夜学习——单片机)
一、硬件电路:1、引脚功能:(1)A0-A2:决定不同设备的地址码:(2)WP:写保护二、通讯方式(IIC协议)通讯方式与PCF8591相同,可参考以下文章…...
netty
Netty的介绍Netty是异步的(指定回调处理)、基于事件驱动的网络应用框架,用于快速开发高性能、高可靠性的网络IO程序。Netty本质是一个NIO框架,适用于服务器通讯相关的多种应用场景,分布式节点远程调用中Netty往往作为R…...
mariadb php wordpress/网页设计和网站制作
目前几乎所有架构的CPU都会提供PCI接口,网上也有很多文章对Linux PCI驱动进行分析,在写这篇文章的过程中大量阅读了这些文章,很多只涉及驱动的一部分,不够完整,对驱动代码中一些特殊操作也语焉不详。要弄懂PCI驱动需要…...
微网站建设费用/社交网络推广方法
spring_boot打jar包及打包错误的解决方法参考文章: (1)spring_boot打jar包及打包错误的解决方法 (2)https://www.cnblogs.com/penglei-it/p/springboot_package.html 备忘一下。...
网站建设与推广推荐/看seo
线下发家的时髦品牌,线上线下互通早已经成为他们的根本装备。但近年来,发迹于线上的时髦品牌纷繁涉足线下实体商场。近日,汇集了近30个淘宝知名服饰品牌的“淘宝声调Taostyle”在杭州嘉里中心开业。一批在淘宝上成长起来的年轻品牌࿰…...
周口学做网站/网站之家
2019独角兽企业重金招聘Python工程师标准>>> 一、点击链接 https://natapp.cn/ 注册个免费的账户 NATAPP官网 二、登陆进去以后查看authtoken。复制这个,等下要在客户端用到! 分配的authtoken 三、点击右侧配置,做一下配置&#x…...
北京网站建设qq群/手机优化助手下载
2023-04-04:使用 Golang 和 ffmpeg-go 库实现 demuxing_decoding.c,轻松掌握音视频分离解码技巧。 答案2023-04-05: 使用github/moonfdd/ffmpeg-go库。 代码使用FFmpeg库打开一个音视频文件,提取其中的视频和音频流,…...
建个大型网站要多少钱/今日新闻最新消息
传统的旋转硬盘驱动器(HDD)是计算机上的基本非易失性存储器。也就是说,当系统关闭时,它不会像系统内存上的数据那样“走开”。硬盘驱动器本质上是带有磁性涂层的金属盘。该涂层存储你的数据,无论这些数据是来自上个世纪…...