数据分析三剑客之Matplotlib
0.Matplotlib绘图和可视化
1.简介
我的前面两篇文章介绍了 Nimpy ,Pandas 。今天来介绍一下Matplotlib。
简单来说,Matplotlib 是 Python 的一个绘图库。它包含了大量的工具,你可以使用这些工具创建各种图形,包括简单的散点图,正弦曲线,甚至是三维图形。Python 科学计算社区经常使用它完成数据可视化的工作。
你可以在他们的网站上了解到更多 Matplotlib 背后的设计思想,但是我强烈建议你先浏览一下他们的图库,体会一下这个库的各种神奇功能。
2.画一个简单的图形
In [1]: import matplotlib.pyplot as pltIn [2]: import numpy as npIn [3]: x = np.linspace(0, 2 * np.pi, 50)In [6]: plt.plot(x, np.sin(x))
Out[6]: [<matplotlib.lines.Line2D at 0x1dcdc98a748>]In [7]: plt.show()
上面的代码将画出一个简单的正弦曲线。np.linspace(0, 2 * np.pi, 50)这段代码将会生成一个包含 50 个元素的数组,这 50 个元素均匀的分布在 [0, 2pi] 的区间上。
plot命令以一种简洁优雅的方式创建了图形。提醒一下,如果没有第一个参数 x,图形的 x 轴坐标将不再是 0 到 2pi,而应该是数组的索引范围。
最后一行代码 plt.show()将图形显示出来,如果没有这行代码图像就不会显示。
运行代码后应该会类似得到下面的图形:
3.在一张图上绘制两个数据集
大多数时候读者可能更想在一张图上绘制多个数据集。用 Matplotlib 也可以轻松实现这一点。
In [15]: x = np.linspace(0, 2 * np.pi, 50)In [16]: plt.plot(x, np.sin(x), x, np.sin(2*x))
Out[16]:
[<matplotlib.lines.Line2D at 0x1dcdb38a080>,<matplotlib.lines.Line2D at 0x1dcdb38a1d0>]In [17]: plt.show()
上面的代码同时绘制了表示函数 sin(x) 和 sin(2x) 的图形。这段代码和前面绘制一个数据集的代码几乎完全相同,只有一点例外,这段代码在调用plt.plot()的时候多传入了一个数据集,并用逗号与第一个数据集分隔开。
最后你会得到类似于下面包含两条曲线的图形:
4.自定义图形的外观
当在同一个图形上展示多个数据集时,通过改变线条的外观来区分不同的数据集变得非常必要。
In [18]: x = np.linspace(0, 2*np.pi, 50)In [19]: plt.plot(x, np.sin(x), 'r-o', x, np.cos(x), 'g--')
Out[19]:
[<matplotlib.lines.Line2D at 0x1dcdb695898>,<matplotlib.lines.Line2D at 0x1dcdb695a20>]In [20]: plt.show()
上述代码展示了两种不同的曲线样式:'r-o' 和 'g--'。字母 'r' 和 'g' 代表线条的颜色,后面的符号代表线和点标记的类型。例如 '-o' 代表包含实心点标记的实线,'--' 代表虚线。其他的参数需要读者自己去尝试,这也是学习 Matplotlib 最好的方式。
颜色: 蓝色 - 'b' 绿色 - 'g' 红色 - 'r' 青色 - 'c' 品红 - 'm' 黄色 - 'y' 黑色 - 'k'('b'代表蓝色,所以这里用黑色的最后一个字母) 白色 - 'w' 线: 直线 - '-' 虚线 - '--' 点线 - ':' 点划线 - '-.' 常用点标记 点 - '.' 像素 - ',' 圆 - 'o' 方形 - 's' 三角形 - '^'
更多点标记样式点击这里
最后你会得到类似下面的图形:
5.使用子图
使用子图可以在一个窗口绘制多张图。
In [21]: x = np.linspace(0, 2*np.pi, 50)In [22]: plt.subplot(2, 1, 1) # (行,列,活跃区)
Out[22]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb6ba978>In [23]: plt.plot(x, np.sin(x), 'r')
Out[23]: [<matplotlib.lines.Line2D at 0x1dcdb7316d8>]In [24]: plt.subplot(2, 1, 2)
Out[24]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb731ba8>In [25]: plt.plot(x, np.cos(x), 'g')
Out[25]: [<matplotlib.lines.Line2D at 0x1dcdb77bfd0>]In [26]: plt.show()
使用子图只需要一个额外的步骤,就可以像前面的例子一样绘制数据集。即在调用 plot() 函数之前需要先调用 subplot() 函数。该函数的第一个参数代表子图的总行数,第二个参数代表子图的总列数,第三个参数代表活跃区域。
活跃区域代表当前子图所在绘图区域,绘图区域是按从左至右,从上至下的顺序编号。例如在 4×4 的方格上,活跃区域 6 在方格上的坐标为 (2, 2)。
最终你会得到类似下面的图形:
散点图是一堆离散点的集合。用 Matplotlib 画散点图也同样非常简单。
In [27]: x = np.linspace(0, 2*np.pi, 50)In [28]: y = np.sin(x)In [29]: plt.scatter(x, y)
Out[29]: <matplotlib.collections.PathCollection at 0x1dcddb706a0>In [30]: plt.show()
正如上面代码所示,你只需要调用 scatter() 函数并传入两个分别代表 x 坐标和 y 坐标的数组。注意,我们通过 plot 命令并将线的样式设置为 'bo' 也可以实现同样的效果。
最后你会得到类似下面的无线图形:
7.彩色映射散点图
另一种你可能用到的图形是彩色映射散点图。这里我们会根据数据的大小给每个点赋予不同的颜色和大小,并在图中添加一个颜色栏。
In [31]: x = np.random.rand(1000)In [32]: y = np.random.rand(1000)In [33]: size = np.random.rand(1000) * 50In [34]: colour = np.random.rand(1000)In [35]: plt.scatter(x, y, size, colour)
Out[35]: <matplotlib.collections.PathCollection at 0x1dcdde984e0>In [36]: plt.colorbar()
Out[36]: <matplotlib.colorbar.Colorbar at 0x1dcddece0b8>In [37]: plt.show()
上面的代码大量的用到了 np.random.rand(1000),原因是我们绘图的数据都是随机产生的。
同前面一样我们用到了 scatter() 函数,但是这次我们传入了另外的两个参数,分别为所绘点的大小和颜色。通过这种方式使得图上点的大小和颜色根据数据的大小产生变化。
然后我们用 colorbar() 函数添加了一个颜色栏。
最后你会得到类似于下面的彩色散点图:
8.直方图
直方图是另一种常见的图形,也可以通过几行代码创建出来。
In [38]: x = np.random.randn(1000)In [39]: plt.hist(x, 50)
Out[39]:
(array([ 2., 0., 0., 1., 2., 2., 1., 0., 1., 1., 9., 6., 11.,16., 20., 18., 23., 26., 34., 25., 42., 31., 52., 40., 38., 56.,35., 49., 49., 41., 44., 46., 46., 31., 30., 32., 26., 24., 24.,16., 8., 5., 12., 4., 4., 5., 2., 7., 2., 1.]),array([-3.32384545, -3.20164134, -3.07943724, -2.95723314, -2.83502904,-2.71282494, -2.59062084, -2.46841674, -2.34621264, -2.22400854,-2.10180443, -1.97960033, -1.85739623, -1.73519213, -1.61298803,-1.49078393, -1.36857983, -1.24637573, -1.12417163, -1.00196752,-0.87976342, -0.75755932, -0.63535522, -0.51315112, -0.39094702,-0.26874292, -0.14653882, -0.02433471, 0.09786939, 0.22007349,0.34227759, 0.46448169, 0.58668579, 0.70888989, 0.83109399,0.95329809, 1.0755022 , 1.1977063 , 1.3199104 , 1.4421145 ,1.5643186 , 1.6865227 , 1.8087268 , 1.9309309 , 2.05313501,2.17533911, 2.29754321, 2.41974731, 2.54195141, 2.66415551,2.78635961]),<a list of 50 Patch objects>)In [40]: plt.show()
直方图是 Matplotlib 中最简单的图形之一。你只需要给 hist() 函数传入一个包含数据的数组。第二个参数代表数据容器的个数。数据容器代表不同的值的间隔,并用来包含我们的数据。数据容器越多,图形上的数据条就越多。
最终你会得到类似下面的直方图:
9.标题,标签和图例
当需要快速创建图形时,你可能不需要为图形添加标签。但是当构建需要展示的图形时,你就需要添加标题,标签和图例。
In [41]: x = np.linspace(0, 2*np.pi, 50)In [42]: plt.plot(x, np.sin(x), 'r-x', label='Sin(x)')
Out[42]: [<matplotlib.lines.Line2D at 0x1dcde55db00>]In [43]: plt.plot(x, np.cos(x), 'g-^', label='Cos(x)')
Out[43]: [<matplotlib.lines.Line2D at 0x1dcde282ac8>]In [44]: plt.legend() # 展示图例
Out[44]: <matplotlib.legend.Legend at 0x1dcde282dd8>In [45]: plt.xlabel('Rads') # 给x轴添加标签
Out[45]: Text(0.5,0,'Rads')In [46]: plt.ylabel('Amplitude') # 给y轴添加标签
Out[46]: Text(0,0.5,'Amplitude')In [47]: plt.title('Sin and Cos Waves') # 添加图形标题
Out[47]: Text(0.5,1,'Sin and Cos Waves')In [48]: plt.show()
为了给图形添加图例,我们需要在 plot() 函数中添加命名参数 'label' 并赋予该参数相应的标签。然后调用 legend() 函数就会在我们的图形中添加图例。
接下来我们只需要调用函数 title(),xlabel() 和 ylabel() 就可以为图形添加标题和标签。
你会得到类似于下面这张拥有标题、标签和图例的图形:
10.饼图
饼图阴影、分裂等属性设置:
# labels参数设置每一块的标签;# labeldistance参数设置标签距离圆心的距离(比例值)# autopct参数设置比例值小数保留位(%.3f%%);# pctdistance参数设置比例值文字距离圆心的距离# explode参数设置每一块顶点距圆心的长度(比例值,列表);# colors参数设置每一块的颜色(列表);# shadow参数为布尔值,设置是否绘制阴影# startangle参数设置饼图起始角度
饼图适合展示各部分占总体的比例,条形图适合比较各部分的大小
In [51]: x = [11, 22, 33, 44]In [52]: plt.pie(x, labels=['a', 'b', 'c', 'd'])
Out[52]:
([<matplotlib.patches.Wedge at 0x1dcde8894a8>,<matplotlib.patches.Wedge at 0x1dcde8899b0>,<matplotlib.patches.Wedge at 0x1dcde889e80>,<matplotlib.patches.Wedge at 0x1dcde891390>],[Text(1.04616,0.339919,'a'),Text(0.339919,1.04616,'b'),Text(-1.04616,0.339919,'c'),Text(0.339919,-1.04616,'d')])In [53]: plt.show()
最终你会得到类似下面的饼图:
相关文章:
数据分析三剑客之Matplotlib
0.Matplotlib绘图和可视化 1.简介 我的前面两篇文章介绍了 Nimpy ,Pandas 。今天来介绍一下Matplotlib。 简单来说,Matplotlib 是 Python 的一个绘图库。它包含了大量的工具,你可以使用这些工具创建各种图形,包括简单的散点图&…...
Python Opencv实践 - LBP特征提取
参考资料: python skimage库LBP提取特征local_binary_pattern参数解释_local_binary_pattern函数_friedrichor的博客-CSDN博客 LBP特征笔记_亦枫Leonlew的博客-CSDN博客 import cv2 as cv import numpy as np import matplotlib.pyplot as plt from skimage.feat…...
Docker 搭建Redis Cluster 集群
环境: centos7 redis:7.0.5 三主三从,六个节点 一、下载redis镜像 docker pull redis:7.0.5 二、创建虚拟网卡 docker network create redis-cluster# 查看创建的Docker网卡 docker network ls 网卡类型为bridge桥接类型 三、准备redis配置文件 redi…...
解决谷歌浏览器会http网站自动变成https的问题
不知道是不是升级的缘故,最近打开公司一个http网站,会自动跳去https,用了网上说的这个方案,如下: 但发现还不行,这时我尝试用点击地址栏左边那锁的那个图标,图如下: 然后点击网站设…...
go小知识2
Golang开发新手常犯的50个错误_gezhonglei2007的博客-CSDN博客 一些题目整理,附带大佬的解释 1.go中哪些值不能寻址& 常量(const常量,字面值3.14,字符串“xxx”,函数或方法, map的val值) golang中接…...
zabbix监控H3C设备
背景 常见的服务和主机已经使用Prometheus进行监控了,但是网络设备还未配置监控。使用基于SNMP对网络设备进行监控。 设备概览 主要类型为H3C的路由器和交换机。 H3CS5560交换机 路由器MER5200 er8300 一台群晖的NAS服务 步骤 配置网络设备开启telnet远程&…...
国产化改造之Mysql迁移方案:Mysql Galera Cluster
一、背景 因某业务系统OS国产化改造,现需将生成环境Mysql 主从迁移到新部署的BCLinux OS主机上;如果保障业务不断,平滑迁移并成功割接将是本次方案的重要方向,现场环境涉及需迁移数据780G左右,目标主机OS版本ÿ…...
bootstrap表单类型
1.基本格式 <form><div class"form-group"><label>电子邮件</label><input type"email" class"form-control" placeholder"请输入你的电子邮件" /></div><div class"form-group"&g…...
第一章 SQL Server 数据库部署
个人简介:云计算网络运维专业人员,了解运维知识,掌握TCP/IP协议,每天分享网络运维知识与技能。座右铭:海不辞水,故能成其大;山不辞石,故能成其高。 个人主页:小李会科技的…...
赛事个人团体报名分组成绩查询证书h5小程序开源版开发
赛事个人团体报名分组成绩查询证书h5小程序开源版开发 以下是赛事个人团体报名分组成绩查询证书H5小程序的功能列表: 用户注册和登录:用户可以通过注册和登录功能创建账号或使用已有账号登录小程序。 赛事信息浏览:用户可以浏览小程序中提供…...
【大数据环境配置】01-安装VMware虚拟机
一、VMware的安装 1: 运行“VMware_workstation_full_12.5.2.exe”(或者其他版本) 2:引导页面,直接点击下一步 3: 同意许可,然后继续点击下一步 4: 选择VMware安装位置࿰…...
什么是C语言中的命名空间?
C语言本身并没有像某些其他编程语言(如C)中的显式命名空间(namespace)的概念,但C语言中有一些机制和约定,允许开发人员组织和管理变量、函数和其他标识符的名称,以避免名称冲突和提高代码可维护…...
Java语言特点 8种基本数据类型 标识符等练习题 插入/希尔/选择/堆/冒泡/快速/归并/计数排序
(单选题)java 的字符类型采用的是 Unicode编码方案,每个 Unicode码占用( )个比特位。 题目内容: A .8 B .16 C .32 D .64 (单选题)下列说法不正确的是( ࿰…...
建站系列(七)--- 常用前后端框架
目录 相关系列文章前言一、何为框架?二、为什么使用框架三、常用框架(一)Bootstrap(二)Layui(三)JQuery(四)Vue.js(四)ThinkPHP(五&am…...
Jmx协议远程连接java服务器
注意:本例里,我用的是jdk17 通常用jdk自带的jconsole,或者想要功能强大点的使用visualVM 需要java服务器在启动的时候加上以下参数 -Dcom.sun.management.jmxremote 启用jxm远程连接-Djava.rmi.server.hostname10.1.3.99 指定jxm监听地址&…...
consul 概念 键值对操作命令
传统配置文件的弊端 静态化配置,例如env文件配置文件无法区分环境配置文件过于分散历史版本无法查看 配置中心如何解决的呢?配置中心的思路是把项目中的配置参数全部放在一个集中的地方来管理,并提供一套标准的接口,当各个服务需要获取配置…...
R拒绝访问的解决方案
Win11系统 安装rms的时候报错: Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck vI[[j]]) : namespace Matrix 1.5-4.1 is already loaded, but > 1.6.0 is required## 安装rms的时候报错,显示Matrix的版本太低…...
SeaArt.ai: 海艺AI绘画艺术图片模型创作平台
【产品介绍】 • 名称 SeaArt.ai • 具体描述 SeaArt.ai是一个基于人工智能技术的AI绘画工具,它可以根据你的描述或者关键词来生成符合你想象的图片。你可以选择不同的模式来创建不同类型的图片,比如人物、风景、建筑、神话、自…...
服务器数据恢复-Xen server虚拟机数据恢复案例
服务器数据恢复环境: 一台某品牌服务器通过一张同品牌某型号RAID卡将4块STAT硬盘组建为一组RAID10阵列。上层部署Xen Server虚拟化平台,虚拟机上安装的是Windows Server操作系统,包括系统盘 数据盘两个虚拟机磁盘,作为Web服务器使…...
电工-PN结的工作原理
如果将PN结加正向电压,即P区接正极,N区接负极,如右图所示。由于外加电压的电场方向和PN结内电场方向相反。在外电场的作用下,内电场将会被削弱,使得阻挡层变窄,扩散运动因此增强。这样多数载流子将在外电场…...
C#教学辅助系统网站as.net+sqlserver
本教学辅助系统系统从两种用户角度进行功能划分。 1、学生部分: 1.1:新闻查看; 1.2:课程公告查看; 1.3:用户注册; 1.4:在线留言; 1.5:资料下载; …...
Selenium - Tracy 小笔记2
selenium本身是一个自动化测试工具。 它可以让python代码调用浏览器。并获取到浏览器中加们可以利用selenium提供的各项功能。帮助我们完成数据的抓取。它容易被网站识别到,所以有些网站爬不到。 它没有逻辑,只有相应的函数,直接搜索即可 …...
SVN 和 GIT 命令对比
参考 https://blog.csdn.net/justry_deng/article/details/82259470 # TortoiseSVN打分支、合并分支、切换分支 https://www.huliujia.com/blog/802a64152bbbe877c95c84ef2fdf3857a056b536/ # 版本控制:Git与Svn的命令对应关系 TortoiseSVN打分支、合并分支、切换…...
LeetCode 之 移除元素
算法模拟: Algorithm Visualizer 在线工具: C 在线工具 如果习惯性使用Visual Studio Code进行编译运行,需要C11特性的支持,可参考博客: VisualStudio Code 支持C11插件配置 问题1:LeetCode 27.移除元素…...
Leecode1160: 拼写单词
直接使用一个哈希表存整体的结果,一个临时的哈希表每次算一遍,但是1是要设置标志位来判断最后是否正确并加上长度,2是千万要记得每次新建一个空间来存哈希表绝对不能不空间就等于,会出事!!...
电脑死机的时候,CPU到底在做什么?
电脑死机,应该每个接触计算机的小伙伴都经历过吧。 尤其是早些年,电脑配置还没现在这么高的时候,多开几个重量级应用程序,死机就能如约而至,就算你把键盘上的CTRLALTDELETE按烂了,任务管理器也出不来&…...
jdk 中的 keytool 的使用,以及提取 jks 文件中的公钥和私钥
这里暂时只需要知道如何使用就可以了。 首先是生成一个密钥, keytool -genkeypair -alias fanyfull -keypass ffkp123456 -validity 365 -storepass ffsp123456 -keystore fanyfull.jks -keyalg RSA解释一下这里的选项, -alias 密钥对的名称-keypass …...
Mysql--技术文档--B+树-数据结构的认知
阿丹解读: 之前的文章中写道了有关mysql底层索引,那么在数据量特别大的情况下。mysql采用了B来管理索引。和存储的数据。 Mysql--技术文档--索引-《索引为什么查找数据快?》-超底层详细说明索引_一单成的博客-CSDN博客 B树解读:…...
cms之wordpress主题安装
WordPress主题安装教程的方法有两种,分为在线安装和上传安装,下面是主题详细安装方法的步骤。 后台在线安装主题 从后台的主题界面在线安装主题是最方便的WordPress主题安装方式。方法如下: 1 在WordPress后台,转到外观→主题 …...
【Python程序设计】Python 中的环境变量【05/8】
一、说明 以下文章是有关 Python 数据工程系列文章的一部分,旨在帮助数据工程师、数据科学家、数据分析师、机器学习工程师或其他刚接触 Python 的人掌握基础知识。本篇将讲述环境变量的问题。 迄今为止,本初学者指南包括: 第 1 部分…...
怎么做网站优化 s/苏州百度推广公司地址
1.准备工作——安装一些工具包 $ sudo apt-get install ros-melodic-ros-tutorials ros-melodic-geometry-tutorials ros-melodic-rviz ros-melodic-rosbash ros-melodic-rqt-tf-tree2.运行demo roslaunch turtle_tf turtle_tf_demo.launch会跳出一个窗口,一只小乌…...
南京做网站的网络公司排名/网站排名软件利搜
本文摘自深入理解 Java 虚拟机第三版 对象的创建 Java 是一门面向对象的语言,Java 程序运行过程中无时无刻都有对象被创建出来。从语言层面看,创建对象只是一个 new 关键字而已,而在虚拟机中,对象(仅限于普通 Java 对…...
哪种语言的网站 做seo更好/百度百科入口
指针的偏移值是多少取决于指针的类型: int a 10; char c A;int *p; char *p2;p &a; p2 &c;//p (自身运算)之后再加1 printf("a的地址的打印:%p\n",p); //p (自身加1运算)之后再下一步 …...
方维网站建设/营销策划的概念
分享讲师:王文广—达观数据副总裁,浙江大学计算机系硕士,在系统架构设计及研发方面有十余年工作经验。讲师简介:曾在百度负责MP3搜索的架构设计和开发,及百度第一版的语音搜索系统和百度音频指纹系统;曾负责…...
wordpress 空间推荐/网络营销的工具和方法
多年以后,面对办公室的屏幕,我会回忆起开始肝第二周OO作业的那个遥远的下午。那时的程序是一个一两百行的符号求导,基类与接口在包里一字排开,工整的注释一望到底 谁能想到,接下来的十几个小时我要经历什么样的噩梦&am…...
苏州网站开发公司电话/网店代运营公司靠谱吗
今天遇到一个问题:pc客户端和android的App通信,心跳通道(心跳包27个字节,是一个业务空包)在部分pc上总是会超时(5秒超时),nagle算法也给禁用了,pc端时按按量发送心跳的&a…...