一般用哪些工具做大数据可视化分析?
做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少!
这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图类、快速出图类、词云生成类、综合分析类5大类。个人经验,大家按需采纳:
01 纯统计图表类——简道云
可视化模板>>https://www.jiandaoyun.com
适用群体:更适合职场各种业务端的数据分析,可在线使用,替代Excel偷懒的神器!
这是一款我用了4年多的数据分析偷懒神器,模板一共提供10+基础数据分析图表,一般业务上的数据分析我用它就够了。
可以先看看效果:
像上面这种数据看板,放在excel里面做起来是很复杂的,但用简道云做可视化看板,就能轻松达到四两拨千斤的效果。
示例:
导入简道云>新建仪表盘>点击数据组件-统计表>添加刚刚的表格数据-订单管理
比如:想要在仪表盘中显示“订单总额”,即把“订单总额”字段拉入指标处,选择图标类型即可。
制作完成之后的可视化看板如下图:
我选择用它来做业务数据分析的另一个重要原因是——它能做的不止数据分析图表,基本上能够高效辅助完成所有业务数据的收集、处理、分析、展示、以及流程管理:
- 可以用它的在线表单来做数据收集
- 收集好的数据可以导入数据工厂自动处理分析
- 处理好的数据可以生成各种分析图表
- 流程引擎能够配合做好各业务环节之间的流转
- ......
不足:由于简道云本身就是偏向企业层面的,所以更适合一些偏业务端的数据分析。如果是想要做一些非常专业复杂的数据分析大屏,它是不如哪些专业做数据大屏的工具的。
02 CIS地图可视化类——QGIS
官网>>https://www.qgis.org/en/site/
适用于:适合想做专业地图可视化的伙伴,并且需要有一定的编程基础。
QGIS是我目前使用最多的GIS软件,免费、跨平台,不仅可以做各种分析,还可以制作各种漂亮的可视化地图,比如可以做这种非常炫酷的图表:
具体图表制作上稍微有些复杂,需要先安装QGIS(可在 linux、unix、mac 和 windows 上运行)并上传底图。
内容列表中有很多图层,在 QGIS 画布中能看到各式各样的世界地图,语言是可以设置为中文的,你用担心自己看不懂。
不会设计的也可以看他们官方的帮助文档,非常详细,入门的话完全足够了,如果还不会的话也有很多平台会针对QGIS发布一些教程,可以自己去搜搜。
不足:地图制作功能非常繁琐,这也是很多人不愿意用QGIS的原因,虽然它功能很强大但对于初学者来说太复杂了,劝退了很多人。
03 快速出图类——datawrapper
https://www.datawrapper.de/
适合自媒体快速出图、操作简单、开源、免费
datawrapper创建之初是为了服务一些新闻网站和报纸媒体的,尤其是金融媒体,需要用到非常多的可视化图表,而datawrapper的优势就在于能够在几分钟内就制作出一些简单、正确和可嵌入的图片。
注意:制作图表前要先将数据放到google文档里,然后在软件里导入Google文档。
比如下面的示例,先添加新的图表输入google文档地址
第二步是检查和调整数据,可以在这一步进行数据的删减、查询等。
第三步就是选择图表,datawrapper提供了非常多的图表模板,这里就用分列横向柱状图吧
第四步就可以生成图表,也可以生成分享链接,上传到平台上让更多人看到。
整个过程几乎不怎么费时间,缺点是外文工具,没有汉化版。
04 词云生成类——wordsift
官网>>https://wordsift.org/
适用于:适用于需要经常做各种词云生成、分析的伙伴,比较方便快捷
这是我用的比较多的一款词云生成类工具类,使用起来很方便,没有那些繁琐的步骤,而且页面很简洁,在我这里是上大分了!!
比如需要提取一段话里面的热点词汇,复制一段,然后点击Sift,这里示例我就直接用工具内置的词包了,是可以生成中文词云的哈!
就会自动生成一个词云图,可以选择自己喜欢的词云格式,也可以选择单词是怎么分的,比如从A-Z,正序还是倒序等等。
右上角分别是:刷新,放大和设置按钮,可以点开设置Scale为三种类别,如果频次相差太大,可以进行log,如果不大,可以选择n即可。
同时下方的角度from角度to角度,可以设置词汇的倾斜角度。Front可以设置字体,Colorset可以设置颜色为一个三色系或者同一个颜色的不同深浅。
最下面就是图片的下载,做好之后可以自行下载图片。
可以点击图中的单词,看到词汇出现的频次,最下面是这个单词在文中出现了几处以及地方。当然,你也可以点击文本可视化,这样,软件会对文本进行一个数据统计,右侧是统计的数据
不足:这个网站有个bug,有的时候不能下载图片,大家只能通过截图保存了,这也是唯一的缺点,说不定过阵子就好了。
05 综合可视化分析类——Tableau
https://www.tableau.com/
优点:OLAP功能强大、支持网页集成、学习难度适中
世界知名的BI工具,以超强的可视化能力著称。它已经成为商业BI界的TOP选手,很多大型公司像阿里、谷歌都在使用,能快速搭建数据系统。
打开Tableau,点击工作表,可以看到以下界面:
- 1) 功能区-作图过程需要使用的工具
- 2) 画布-展示图形的看板
- 3) 页选项卡-可添加或删除多页与切换数据源 工作表 仪表板不同页面
- 4) 筛选器-可筛选数据字段
- 5) “可视化效果”窗格-根据需要选择不同的图形
- 6) 搜索表格字段等
可以通过设置页面动画,来制作动态可视化图表,比如这种:
不足:tableau对计算机的硬件要求比较高(不止一次卡死过),而且需要有些可视化功能需要收费。
分享结束,如果有更好的工具推荐,欢迎一起交流讨论!
相关文章:
一般用哪些工具做大数据可视化分析?
做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少! 这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图…...
Python每日一练(20230308)
目录 1. Excel表列名称 ★ 2. 同构字符串 ★★ 3. 分割回文串 II ★★★ 🌟 每日一练刷题专栏 C/C 每日一练 专栏 Python 每日一练 专栏 1. Excel表列名称 给你一个整数 columnNumber ,返回它在 Excel 表中相对应的列名称。 例如࿱…...
jvm之堆解读
堆(Heap)的核心概述 堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。 Java堆区…...
重构·改善既有代码的设计.02
前言之前在《重构改善既有代码的设计.01》中初步了解了重构的基本前提,基础原则等入门知识。今天我们继续第二更......识别代码的坏味道Duplicated Code 重复代码。最单纯的Duplicated Code就是“同一个类中含有相同的表达式”或“两个互为兄弟的子类内含有相同表达…...
脑电信号处理总成
目录一. EEG(脑电图)1.1 脑波1.2 伪迹1.2.1 眼动伪迹1.2.2 肌电伪迹1.2.3 运动伪迹1.2.4 心电伪迹1.2.5 血管波伪迹1.2.6 50Hz和静电干扰1.3 伪迹去除方法1.3.1 避免伪迹产生法1.3.2 直接移除法1.3.3 伪迹消除法一. EEG(脑电图) 1.1 脑波 脑波(英语:br…...
判断推理之图形推理
考点一动态位置变化(一)平移1.特征:图形在平面上的移动,图形本身的大小和形状不发生改变。2.方向:直线(上下、左右、斜对角线),绕圈(顺时针、逆时针)3.距离&a…...
【预告】ORACLE Unifier v22.12 虚拟机发布
引言 离ORACLE Primavera Unifier 最新系统 v22.12已过去了3个多月,应盆友需要,也为方便大家体验,我近日将构建最新的Unifier的虚拟环境,届时将分享给大家,最终可通过VMWare vsphere (esxi) / workstation 或Oracle …...
Sql执行流程与Redo log、 Undo log、 Bin log日志文件
文章目录Sql执行流程与日志文件Sql的执行流程Redo LogBin logUndo logSql执行流程与日志文件 Sql的执行流程 mysql的内部组件结构如下图所示 连接器 与客户端建立连接,检验登录密码,分配相应权限 查询缓存 执行sql语句时会先从这里找一下,…...
如何提高软件测试执行力
高效的测试执行力 不管在哪个行业,高校的执行力都是不可或缺的。在软件测试行业更是这样。有些测试人员,很勤奋也很吃苦,但是可能最终不能很好的完成测试任务。究其原因就是一个测试执行力的问题。 高效执行就是有目标,有计划&…...
Open3D 计算点到平面的距离
目录 一、算法原理二、代码实现三、结果展示一、算法原理 平面外一点 ( x 1 , y 1 , z 1 ) (x_1,y_1,z_1) (x...
DDD领域驱动设计初探
DDD 强调领域模型要兼顾业务和技术两个视角。 我们怎么用一套系统化的方法,抽丝剥茧、一步一步地把需求落实到代码呢?咱们看看下面这张图,它表示了领域驱动设计中的主要流程。 领域驱动设计主要的开发流程你可以看到,在整个开发流…...
C中AES_cbc_encrypt加密对应java中的解密
前言知识: 1.AES(Advanced Encryption Standard)高级加密标准,作为分组密码(把明文分成一组一组的,每组长度相等,每次加密一组数据,直到加密完整个明文)。 2.在AES标准…...
演化算法:乌鸦搜索算法 (Crow Search Algorithm)
前言 如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 在机器学习中,我们所要优化的问题很多时候难以求导,因此通常会采用一些演化算法(又称零…...
基于open62541的OPC UA服务器和客户端开发技术
一、OPC UA的基本概念 1、OPC(OLE for Process Control),是一个工业标准,管理这个标准的国际组织是OPC基金会; 2、OPC通信结构:是指包含一个或多个OPC客户端与服务器相互通信的集合。以下是一个简单的流程图:标准的C/S结构。 3、OPC服务器:TOPC基金会定义了四种;...
测试测开面试要知道的那些事01
列表与元组的区别列表是动态数组,它们可变且可以重设长度(改变其内部元素的个数)。元组是静态数组,它们不可变,且其内部数据一旦创建便无法改变。元组缓存于Python运行时环境,这意味着我们每次使用元组时无…...
物联网毕设 -- 智能厨房监测系统(改)
前言 在家庭生活中,厨房是必不可少的,所以厨房的安全问题关乎着我们大家的生命,所以提出智能厨房监测系统,目的就是为我们减少不必要的安全问题 ⚠️⚠️(本文章仅提供思路和实现方法,并不包含代码&#x…...
macOS 13.3 Beta 3 (22E5236f)发布
系统介绍3 月 8 日消息,苹果今日向 Mac 电脑用户推送了 macOS 13.3 开发者预览版 Beta 3 更新(内部版本号:22E5236f),本次更新距离上次发布隔了 7 天。macOS Ventura 带来了台前调度、连续互通相机、FaceTime 通话接力…...
Failed to configure a DataSource: ‘url‘ attribute
一 完整的错误信息 *************************** APPLICATION FAILED TO START *************************** Description: Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to dete…...
Mysql高级——锁
锁 mysql锁的分类 从性能上分为:乐观锁、悲观锁从锁的粒度上分:行锁、间隙锁、页锁、悲观锁从对数据库的操作分类:读锁、写锁 乐观锁需要我们自己通过version字段来实现,如果更新失败则在代码中进行where重试。而我们常见的读锁…...
Spring的Async注解线程池扩展方案
目录- [Spring的Async注解线程池扩展方案]- [目录]- [1. 扩展目的]- [2. 扩展实现]- [2.1 扩展Async注解的执行拦截器AnnotationAsyncExecutionInterceptor]- [2.2 扩展Async注解的Spring代理顾问AsyncAnnotationAdvisor]- [2.3 扩展Async注解的 Spring Bean 后置处理器AsyncAn…...
wfb-ng 锁定WiFi接口
wfb-ng 锁定WiFi接口1. 源由2. 需求3. 分析4. 步骤4.1 确认网卡MAC地址4.2 修改udev配置文件4.3 配置重载&重启4.4 确认逻辑网卡接口4.6 修改wfb-ng逻辑WiFi通信接口5. 参考资料6. 补充资料为了更加方便的调试和使用wfb-ng软件,解决由于设备枚举发现时命名可能存…...
Python所有方向的入门和进阶路线,20年老师傅告诉你方法
干了20多年程序员,对于Python研究一直没停过,这几天把我自己对Python的认知和经验,再结合很多招聘网站上的技术要求,整理出了Python所有方向的学习路线图,基本上各个方向应该学什么,都在上面了,…...
RLOAM/RO-LOAM
LOAM框架 LOAM框架包含三个步骤: Scan registration:从原始激光扫描点数据中提取点特征。点特征是角点或者面点。 odometry estimation:在特征提取之后,特征点传递到里程计模块,通过特征匹配和优化步骤计算相对坐标变…...
JUC并发编程之Semaphore-应用与深度源码剖析
目录 JUC并发编程之Semaphore-应用与深度源码剖析 1. Semaphore 是什么? 2.怎么使用Semaphore? 2.1构造方法 2.2 重要方法 2.3 基本使用 需求场景 基础版代码实现 tryAcquire()引入代码实现 acquireUninterruptibly(),acquire()对比代码实现 3.…...
JWT详细介绍使用
一、JWT介绍 JWT是JSON Web Token的缩写,即JSON Web令牌,是一种自包含令牌。 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准。 JWT的声明一般被用来在身份提供者和服务提供者间传递被认证的用户身份信息,以便于从资源服务…...
C/C++开发,无可避免的多线程(篇六).线程池封装类
一、线程池概念 线程池是一种多线程处理方式,它包含一个线程工作队列和一个任务队列。当有任务需要处理时,线程池会从线程工作队列中取出一个空闲线程来处理任务,如果线程工作队列中没有空闲线程,则任务会被放入任务队列中等待处理…...
HIVE中如何实现针对IPv6 CIDR的查询
Hive默认情况下不支持IPv6 CIDR查询,因为IPv6 CIDR查询需要使用一些额外的函数。 但是可以通过使用UDF(用户自定义函数)来实现这一点。 IPv6 CIDR表示为网络地址/前缀长度,其中网络地址是一个IPv6地址,前缀长度是一个介于0和128之间的整数,表示网络地址中前多少位是网络…...
【微信小程序】-- 生命周期(二十八)
💌 所属专栏:【微信小程序开发教程】 😀 作 者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! &…...
Kafka 概述
Kafka 概述Broker消费者Kafka 属于分布式的消息引擎系统,主要功能 :提供一套完备的消息发布与订阅解决方案 生产者和消费者都是客户端(Clients): 生产者(Producer):向主题发布消息…...
详解Java8中如何通过方法引用获取属性名/::的使用
在我们开发过程中常常有一个需求,就是要知道实体类中Getter方法对应的属性名称(Field Name),例如实体类属性到数据库字段的映射,我们常常是硬编码指定 属性名,这种硬编码有两个缺点。 1、编码效率低&#x…...
网站空间域名是什么/seo优化平台
列表非常适合用于存储在程序运行期间可能变化的数据集。列表是可以修改的,但元组是不可修改的Python将不能修改的值称为不可变的,而不可变的列表被称为元组1. 元组的创建和删除(1)使用赋值运算符直接创建元组语法:tuplename (element1, elem…...
重庆网站建设网站制作/武汉seo楚天
1. 编译单元,一个.cc,或.cpp作为一个编译单元.生成.o 2. 普通数据类型的定义,声明,函数的定义声明(类函数是一样的) extern int x; //变量是声明,并未实际分配地址,未产生实际目标代码void pr…...
网站建设博敏/建立网站怎么搞
这样做的目的是一次遍历两个列表,一个是右列表,另一个是左列表。然后测量两点之间的角度,并将其与之前计算的角度进行比较。如果在某个时候计算的角度变大(漏斗变宽),我想用I0和新的右和左列表重新开始迭代过程。目前我没有任何输出。我认为问题出在calc()语句上,我希望def cal…...
做网站代理工作安全吗/优化关键词排名推广
问题解决方法问题原因 问题 编译安装redis时出现报错zmalloc.h zmalloc.h:50:31: error: jemalloc/jemalloc.h: No such file or directory zmalloc.h:55:2: error: #error "Newer version of jemalloc required" make[1]: *** [adlist.o] Error 1 解决方法 mak…...
查网站排名/淘宝优化关键词的步骤
在介绍USB的驱动开发时,我通常会用用Linux的的USB网络来演示,它兼容RNDIS网络,一台Linux即可充当USB的device端,也可以由另一台Linux来充当USB的Host端,Host端的也可以由…...
比较好的摄影网站/广州网站推广平台
<!DOCTYPE html><html><head lang"en"> <meta charset"UTF-8"> <title></title> <style> /* Positioning */ css 的 position 属性是用来设置元素的位置的,它还能设置一个元素出现在另一个元素的下层 元素能用 …...