震惊!邻桌的程序猿做可视化报告竟然比我还快,带着好奇心我打开了他的电脑,发现惊天秘密,原因竟是...
其实,本文就是想分享一个做可视化的捷径!
制作可视化的方式有千千万。
Excel 控若能轻车熟路驾驭 VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选 手。
会编程的,Echarts 几十行代码,分分钟出秀;R 语言玩得一手数据挖掘,可视化自不在话下;Python 爬数据达人,手握 matplotlib 包打天下。
这么多工具,从哪个入手较好?这也是很多人犯难的。
其实,数据分析大家大可不必垂涎于工具。对于绝大多数的我们,需求在于从万千数据中统计出一 些规律,或者某些业务问题想通过分析数据的方法得到求证。
分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解 决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了
笔者一直主张用 BI 分析,于数据分析师,节省时间提高效率。于入门,BI 也是最简单最好上手的可 视化分析工具。
之前分享了 《数据分析工具 link,》讲解了 FineBI 的主要功能、特点和基本 使用方法。
依照承诺,要分享一个实操类的文章。
所以今天想着重于数据分析的过程,来手把手教大家制作一个可视化报表。
PS:其实可视化报告真的不难,只要有一些分析基础,外加掌握 1~2 个工具即可。
一、数据分析的操作思路
数据分析通常是这样切入的,比方说业务上发生了变化,流量下降 20%,那么我们就要分析可能的 原因,需要多方数据去验证假设。又或者拿到一份数据,思考可以分析的规律点。无论哪种情况, 一个完整的数据分析都需要经历数据获取、数据预处理、数据分析与建模、可视化分析及报告撰写 的过程。
FineBI 这个 BI 工具的功能模块也是依据分析的流程来设计的,分为数据连接、数据准备、可视化分 析、仪表板驾驶舱、分享仪表板等。
二、认识这个工具——FineBI 的工作区
官网安装好合适的版本,成功激活,设置初始账号密码后,会跳转到这个 web 页面。
左侧是导航栏,类似于菜单栏。目录类似首页,展现已完成的分析报告,这里默认展现官方的内置 demo。
数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方,可进行业务包、数据表、关 联、多路径、数据更新、自助数据集等管理。
仪表板即创建可视化分析。管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外 观设置、数据、报表、分享权限等管理配置。
创建是提供给用户快捷新建数据连接、添加数据库表、 添加 SQL 数据集、添加 EXCEL 数据集、添 加自助数据集、新建仪表板的地方。
三、连接/导入数据
制作数据报告,第一步是导入数据,FineBI 能从很多种数据源导入数据:如 Excel,CSV,XML, 以及各类数据库(SQL Server,Oracle,My SQL 等),两大主流开源平台(Hadoop,Spark)等等。 最常用的方式是连接数据库和导入 excel 数据。两种方式因为最常用,所以这里都演示操作一遍。
1、数据库连接举例:连接 mysql
2、导入 excel 数据
同样的数据,用一份 excel 导入。
第一步:数据准备—添加业务包,业务包是用来统一整理数据表的。这里创建一个台风数据包。点 击添加表,新建 excel 数据集。
就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。(举例:有些 情况下将时间识别成文本类型,需要手动切换成时间类型,不然会影响后续操作)
至此,数据就导入成功。
四、数据塑性—自助数据集
自助数据集其实是数据加工的环节。一般我们拿到的数据往往是有空缺值有重复,所谓脏数据,脏 数据需要清理,关于数据清洗的处理可以写 5000 字篇,这里就不多讲了。更常见的情况是分析中
需要新建一些字段,这是源数据所没有的。这时候就可以根据需求对原数据进行再加工处理,新建
一个用于分析的数据集。再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排 序、左右合并、上下合并、挖掘。
这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作, 且一些过滤操作可以放到后面创建分析图表的过程中去做。
其实,在自助数据集之前,有个功能没讲到。FineBI 有个管理员的说法,这在企业部署中会涉及。 管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财 务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考 虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用, 比如本文所要介绍的分析,BI 系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文 的分析暂时不需要用到权限功能,这里只做简单介绍。
五、可视化分析
到这里数据准备好了,接下来开始正式分析。
先来观察这份数据,这份数据是我从网上当下来的,展示了 1945 年——2015 年登陆我国的台风信 息,包括时间、登陆省市以及台风强度。
那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发 日,以及台风强度分布。
1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。
2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是 finebi 仪表板
的组成元素。)
分析 1:各年度登陆我国的台风数量
添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时 间——这里只展示年份这个维度)
这里要注意,
源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记 录数要依赖 CMA 编号统计(记录数右侧小三角下拉),以免重复。
其次,这里又添加了一个统计每年台风平均数的指标。
最后再对次图表稍加美化,通常在图形属性和组件样式中:
① 修改线条颜色:图形属性—颜色
② 修改连线为平滑曲线,并且可调整有无标记点
③ 修改该组件标题:组件样式—标题,可调整字体样式
最终得到如下成图:
能明显感觉到登陆我国的台风呈现一个 2~4 年的波动变化,且 2000 年以来,直击我国的台风整体 数量有略微下降。
分析 2:台风登陆各省沿海城市分布—数据地图
这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。
必须将维度创建成地图角色,生成经纬度。
匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇 到把辽宁省匹配成宁夏的 bug,匹配有问题可以随时调整。
然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等, 这里就用填充地图举例。
填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看 到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数 量。
在组件样式——背景中,可以修改 GIS 地图样式,如下:
注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属 性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤 排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。
六、可视化报告
其他分析大同小异,篇幅有限,以上只举了两个例子。
图表分析组件完成之后,就是构建可视化报告(dashboard)了。
仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后 面调整了每个图表的样式和配色。好不好看全看个人审美了。
小结
总的来说,使用 FineBI 制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起 来才能得心应手。由于数据之前在 excel 里已经做了一些处理,所以拿到的数据基本可以直接上手 分析。
在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI 内置了很 多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可 视化制作中所有内置图形的绘制方法,以及样式调整。
相关文章:

震惊!邻桌的程序猿做可视化报告竟然比我还快,带着好奇心我打开了他的电脑,发现惊天秘密,原因竟是...
其实,本文就是想分享一个做可视化的捷径! 制作可视化的方式有千千万。 Excel 控若能轻车熟路驾驭 VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选 手。 会编程的,Echarts 几十行代码,分分…...

mathtype7与word冲突,无法安装,不显示工具栏的问题解决
首先无法安装,或安装出错时,要清理注册表防止以后再次出现该问题,以此记录留作备份。打开注册表的方法是键盘winr键同时按(win就是Alt旁边像窗户图标的键),正常的话会跳出一个叫“运行”的家伙,…...

IBM AIX 升级Openssh 实现篇(编译安装)
升级成功佐证 !!!本文所有内容仅作参考,请在测试环境中具体测试完毕后才能应用于生产环境!!! [1]备份和恢复方案 开启telnet 服务,防止ssh 掉线后无法重连维护。在修复漏洞后关闭telnet。 备份该服务相关的所有文件,以便恢复。 root@TEST:/etc# vi inetd.conf #ftp…...

linux的睡眠框架及实现
睡眠 4 种模式:S2I (Suspend-to-Idle): 挂起系统,IO进入低功耗模式。需配置CONFIG_SUSPEND。Standby:执行S2I后,把AP (nonboot CPU) 离线。除了CONFIG_SUSPEND的支持外,还需要向suspend子系统注册ÿ…...

Java面试知识点
工作也有好些年了,从刚毕业到前几年看过无数的面试题,总想着自己写一个面试总结,随着自我认识的变化,一些知识点的理解也越来越不一样了。写下来温故而知新。很多问题可能别人也总结过,但是答案不尽相同,如…...

PTA Advanced 1159 Structure of a Binary Tree C++
目录 题目 Input Specification: Output Specification: Sample Input: Sample Output: 思路 代码 题目 Suppose that all the keys in a binary tree are distinct positive integers. Given the postorder and inorder traversal sequences, a binary tree can be un…...

CDN绕过技术总汇
注 本文首发于合天网安实验室 首发链接:https://mp.weixin.qq.com/s/9oeUpFUZ_0FUu6YAhQGuAg 近日HVV培训以及面试,有人问了CDN该如何绕过找到目标真实IP,这向来是个老生常谈的问题,而且网上大多都有,但是有些不够全面…...

算法训练营DAY51|300.最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组
本期是求子序列的新的一期,题目前两道有一些相似之处,思路差不多,第三道有一点难度,但并不意味着第一道没有难度,没有做过该类型题的选手,并不容易解出题解。 300. 最长递增子序列 - 力扣(Leet…...

mac:彻底解决-安装应用后提示:无法打开“XXX”,因为无法验证开发者的问题;无法验证此App不包含恶意软件
mac从浏览器或其他电脑接收了应用,但是打开报错 目录报错解决办法一次性方法永久解决方法验证恢复应用验证报错 截图如下: 错误信息 无法打开“XXX”,因为无法验证开发者的问题;无法验证此App不包含恶意软件 解决办法 一次性方…...

CPU 指标 user/idle/system 说明
从图中看出,一共有五个关于CPU的指标。分别如下: User User表示:CPU一共花了多少比例的时间运行在用户态空间或者说是用户进程(running user space processes)。典型的用户态空间程序有:Shells、数据库、web服务器…… Nice N…...

Thinkphp大型进销存ERP源码/ 进销存APP源码/小程序ERP系统/含VUE源码支持二次开发
框架:ThinkPHP5.0.24 uniapp 包含:服务端php全套开源源码,uniapp前端全套开源源码(可发布H5/android/iod/微信小程序/抖音小程序/支付宝/百度小程序) 注:这个是全开源,随便你怎么开,怎么来&a…...

hgame2023 WebMisc
文章目录Webweek1Classic Childhood GameBecome A MemberGuess Who I AmShow Me Your BeautyWeek2Git Leakagev2boardSearch CommodityDesignerweek3Login To Get My GiftPing To The HostGopher Shopweek4Shared DiaryTell MeMiscweek1Where am I神秘的海报week2Tetris Master…...

67. Python的绝对路径
67. Python的绝对路径 文章目录67. Python的绝对路径1. 准备工作2. 路径3. 绝对路径3.1 概念3.2 查看绝对路径的方法4. 课堂练习5. 用绝对路径读取txt文件6. 加\改写绝对路径6.1 转义字符知识回顾6.2 转义字符改写7. 总结1. 准备工作 对照下图,新建文件夹和txt文件…...

VHDL语言基础-组合逻辑电路-加法器
目录 加法器的设计: 半加器: 全加器: 加法器的模块化: 四位串行进位全加器的设计: 四位并行进位全加器: 串行进位与并行进位加法器性能比较: 8位加法器的实现: 加法器的设计&…...

内存检测工具Dr.Memory在Windows上的使用
之前在https://blog.csdn.net/fengbingchun/article/details/51626705 中介绍过Dr.Memory,那时在Windows上还不支持x64,最新的版本对x64已有了支持,这里再总结下。 Dr.Memory源码地址https://github.com/DynamoRIO/drmemory,最新发…...

J6412四网口迷你主机折腾虚拟机教程
今天给大家做一个四网口迷你主机折腾虚拟机的安装教程,主机采用的是maxtang大唐NUC J6412 intel i226V四网口的迷你主机,这款主机它是不能直接装上NAS的,必须使用虚拟机系统,近期研究了下然后做了一个教程分享给大家。 首先需要做…...

电子招标采购系统—企业战略布局下的采购寻源
智慧寻源 多策略、多场景寻源,多种看板让寻源过程全程可监控,根据不同采购场景,采取不同寻源策略, 实现采购寻源线上化管控;同时支持公域和私域寻源。 询价比价 全程线上询比价,信息公开透明ÿ…...

elasticsearch 之 mapping 映射
当我们往 es 中插入数据时,若索引不存在则会自动创建,mapping 使用默认的;但是有时默认的映射关系不能满足我们的要求,我们可以自定义 mapping 映射关系。 mapping 即索引结构,可以看做是数据库中的表结构,…...

2023年rabbitMq面试题汇总2(5道)
一、如何确保消息接收⽅消费了消息?接收⽅消息确认机制:消费者接收每⼀条消息后都必须进⾏确认(消息接收和消息确认是两个不同操作)。只有消费者确认了消息,RabbitMQ才能安全地把消息从队列中删除。这⾥并没有⽤到超时…...

电视剧《狂飙》数据分析,正片有效播放市场占有率达65.7%
哈喽大家好,春节已经过去了,朋友们也都陆陆续续开工了,小编在这里祝大家开工大吉!春节期间,一大批电视剧和网剧上映播出,其中电视剧《狂飙》以不可阻挡之势成功成为“开年剧王”。这里小编整理了一些《狂飙…...

cas单点登录后重定向次数过多问题以及调试cas-dot-net-client
问题描述: web项目应用cas作为单点登录站点,登录后无法打开WEB项目的页面,报错,说重定向次数过多。 老实说,这种问题,以前遇到过不少,是我这种半桶水程序员的噩梦。解决这种问题,不…...

【监控】Prometheus(普罗米修斯)监控概述
文章目录一、监控系统概论二、基础资源监控2.1、网络监控2.2、存储监控2.3、服务器监控2.4、中间件监控2.5、应用程序监控(APM)三、Prometheus 简介3.1、什么是 Prometheus3.2、优点3.3、组件3.4、架构3.5、适用于什么场景3.6、不适合什么场景四、数据模…...

opencv+python物体检测【03-模仿学习】
仿照练习:原文链接 步骤一:准备图片 正样本集:正样本集为包含“识别物体”的灰度图,一般大于等于2000张,尺寸不能太大,尺寸太大会导致训练时间过长。 负样本集:负样本集为不含“识别物体”的…...

计算机科学基础知识第二节讲义
课程链接 运行环境:WSL Ubuntu OMZ终端 PS:看到老师终端具有高亮和自动补全功能,我连夜肝出oh-my-zsh安装教程,实现了此功能。 这节课主要讲变量的语法、控制流程、shell功能等内容。 修改终端用户名,输入密码后重启…...

openssl genrsa 命令详解
文章目录一、openssl genrsa 命令介绍二、openssl genrsa 命令的语法及选项三、实例1、生成512位的 RSA 秘钥,输出到屏幕。2、生成512位 RSA 私钥,输出到指定的文件 genrsa.txt3、生成 1024 位 RSA 秘钥,采用 des 算法加密,加密密…...

C语言标准 —— C89(C90)、C99、C11、C17、C2X
C语言主要的三个标准:C89(C90)、C99、C11、K&R C 指的是 C 语言的原始版本。1978年,C 语言的发明者丹尼斯里奇(Dennis Ritchie)和布莱恩柯林(Brian Kernighan)合写了一本…...

基于Java+Dubbo设计的智能公交查询系统
一、项目背景 随着经济的飞速发展,人们的生活质量有了较大的提高,城市居民的出行变得越来越频繁,城市交通也面临越来越多的挑战。城市公共交通具有客流量大、成本低、效率高、节约资源等优势,因此,如何大力发展公交产业,鼓励人们乘坐公交出行,进而改善交通状况,是一个值得思考…...

go语言的并发编程
并发编程是 Go语言的一个重要特性,而 go语言也是基于此而设计出来的。 本文将会介绍如何使用go-gc中的“runtime”方法实现 go语言中的并发编程。 在之前的文章中,我们已经对 runtime方法进行了详细介绍,这次文章将对 runtime方法进行深入分析,并讲解如何在go-gc中使用该方…...

亚马逊要求UL94防火测试阻燃测试标准及项目
UL94认证是什么?分几个等级?是如何表示各等级?带电的产品上架亚马逊都需要相关的UL报告,需要有ISO 17025资质的实验室出具的测试报告才能正常销售和恢复链接,UL94防火测试则是其中一项。UL94试验共有五种:1.B级的水平燃烧试验2.…...

ClickHouse 合并树表引擎 MergeTree 原理分析
目录 前言 MergeTree 存储 MergeTree思想 MergeTree存储结构 MergeTree查询 索引检索 数据Sampling 数据扫描 建表 数据存储...