【47 Pandas+Pyecharts | 杭州二手房数据分析可视化】
文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
- 2.1 读取数据
- 2.2 过滤数据
- 2.3 行政区处理
- 2.4 地址处理
- 2.5 房屋信息处理
- 2.6 面积处理
- 2.7 楼层处理
- 2.8 年份处理
- 2.9 房价处理
- 2.10 删除不用的列
- 2.11 数据类型转换
- 2.12 查看数据信息
- 🏳️🌈 3. Pyecharts数据可视化
- 3.1 各行政区二手房数量地图
- 3.2 各行政区二手房数量柱状图
- 3.3 各行政区二手房均价地图
- 3.4 户型占比分布
- 3.5 楼层数量分布
- 3.6 朝向数量分布
- 3.7 面积-总价分布
- 3.8 建设年份分布
- 3.9 小区房价词云
- 🏳️🌈 4. 可视化项目源码+数据
大家好,我是 👉【Python当打之年(点击跳转)】
本期利用 python 分析一下「杭州二手房数据」 ,看看杭州市各区二手房数量、二手房价格分布、户型分布、年份分布、小区分布 等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
- Pandas — 数据处理
- Pyecharts — 数据可视化
🏳️🌈 1. 导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df = pd.read_excel("./二手房数据.xlsx")
2.2 过滤数据
df1 = df.copy()
2.3 行政区处理
names = ['拱墅', '西湖', '滨江', '上城', '临平', '余杭', '萧山', '富阳', '桐庐', '临安', '淳安','建德', '钱塘']
2.4 地址处理
df1['小区'] = df1['地址'].str.split(' ', n=2 ,expand=True)[1]
2.5 房屋信息处理
df1['房屋信息'].str.split('|',expand=True)
2.6 面积处理
df1['面积(㎡)'] = df1['面积'].apply(lambda x: re.findall(r'\d+', x))
2.7 楼层处理
df1['楼层'] = df1['楼层'].apply(lambda x: re.findall(r'\d+', x))
2.8 年份处理
df1['年份'] = df1['年份'].apply(lambda x: re.findall(r'\d+', x))
2.9 房价处理
df1['总价(万)'] = df1['房价'].apply(lambda x: re.findall(r'\d+', x))
2.10 删除不用的列
df1 = df1.drop(['房屋信息','房价','联系人','面积', '地址','地铁'])
2.11 数据类型转换
for col in ['楼层','年份', '卧室', '客厅', '面积(㎡)','总价(万)','单价(元/㎡)']:df1[col] = df1[col].astype('int')
2.12 查看数据信息
df1.info()
🏳️🌈 3. Pyecharts数据可视化
3.1 各行政区二手房数量地图
def get_chart():chart = (Map().add("",[list(z) for z in zip(x_data, y_data)],"杭州",).set_global_opts(title_opts=opts.TitleOpts(title="1-各行政区二手房数量地图",subtitle=subtitle,pos_top="2%",pos_left="center",),visualmap_opts=opts.VisualMapOpts(pos_left='3%',)))
- 萧山区、拱墅区、西湖区、上城区、临安区的二手房数量要高于其他城区。
- 东部二手房数量高于西部地区。
3.2 各行政区二手房数量柱状图
def get_chart2():chart = (Bar().add_xaxis(x_data).add_yaxis("", y_data).set_global_opts(title_opts=opts.TitleOpts(title="2-各行政区二手房数量",pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False),))return chart
3.3 各行政区二手房均价地图
- 上城区、滨江区二手房均价在600万以上,富阳区、淳安县、拱墅区均价在500万以上。
3.4 户型占比分布
def get_chart():chart = (Pie().add("",sorted_by_value,).set_global_opts(title_opts=opts.TitleOpts(title="4-户型占比分布",pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False,),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%",)))
- 3室2厅户型的二手房共1905套,占比约45%。
- 4室2厅户型的二手房共876套,占比约20%。
- 2室2厅户型的二手房共509套,占比约12%。
- 3室2厅、4室2厅、2室2厅户型的二手房,占比约77%。
3.5 楼层数量分布
def get_chart3():chart = (Pie().add("", [list(z) for z in zip(x_data, y_data)]).set_global_opts(title_opts=opts.TitleOpts(title="5-出行团体占比",pos_top='2%',pos_left="center"),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False,),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%")))return chart
- 7层、8层、12层、19层的二手房数量明显高于其他楼层。
- 除此之外的二手房楼层分布,高层的数量比低层的多,也就是说出售低层房屋的住户较高层少。
3.6 朝向数量分布
- 90%以上的二手房朝向都是南向、南北向的。
3.7 面积-总价分布
def get_chart():chart = (Scatter().add_xaxis(x_data).add_yaxis("",y_data,label_opts=opts.LabelOpts(is_show=False)).set_global_opts(title_opts=opts.TitleOpts(title="7-面积-总价分布",pos_top='2%',pos_left="center"),visualmap_opts=opts.VisualMapOpts(is_show=False),))
- 呈现面积越大,房价越高的走势,基本符合二手房市场的现状。
3.8 建设年份分布
def get_chart4():chart = (WordCloud().add("",words,word_size_range=[10,50]).set_global_opts(title_opts=opts.TitleOpts(title='8-旅游行程景点词云',pos_top='2%',pos_left="center",),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False),))return chart
- 近10年的房屋出售数量普遍不较高,尤其是2018年和2020年的房屋出售数量超过400套,房屋建设年限算是比较短的了。
3.9 小区房价词云
def get_chart():chart = (WordCloud().add("",words,word_size_range=[10,50]).set_global_opts(title_opts=opts.TitleOpts(title='9-小区房价词云',pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False),))
【下期:杭州二手房数据爬虫】
🏳️🌈 4. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。
相关文章:
【47 Pandas+Pyecharts | 杭州二手房数据分析可视化】
文章目录 🏳️🌈 1. 导入模块🏳️🌈 2. Pandas数据处理2.1 读取数据2.2 过滤数据2.3 行政区处理2.4 地址处理2.5 房屋信息处理2.6 面积处理2.7 楼层处理2.8 年份处理2.9 房价处理2.10 删除不用的列2.11 数据类型转换2.12 查看…...
C++入门基础知识13
C 的关键字(接上一篇博文)!! 10. const_cast用法: 该运算符用来修改类型的 const 或 volatile 属性。除了 const 或 volatile 修饰之外, type_id 和 expression 的类型是一样的。常量指针被转化成非常量指针…...
IP地址证如何实现HTTPS访问?(内网IP、公网IP)
IP地址证书(全称为IP地址的SSL/TLS证书)是实现通过IP地址进行HTTPS访问的关键。以下是实现这一目标的详细步骤: 一、选择证书颁发机构(CA) 1.选择支持IP证书的CA:并非所有证书颁发机构都提供为IP地址颁…...
东土科技车规级网络芯片获批量应用
东土科技孵化的我国第一颗国产汽车芯片名录的车规级TSN交换网络芯片,于近期获得国家新能源汽车技术创新中心10万片芯片订单,将规模化应用于车载网关,赋能新一代自主可控汽车网络通信架构。 车规级TSN交换网络芯片于2021年流片成功࿰…...
nvidia系列教程-AGX-Orin pcie扩展M.2磁盘调试笔记
目录 前言 一、AGX-Orin pcie接口介绍 二、原理图连接 三、SDK配置 四、M.2磁盘调试 总结 前言 NVIDIA Jetson AGX Orin 是一款强大的嵌入式平台,广泛应用于 AI 推理、机器人和自动驾驶等领域。在扩展存储方面,PCIe 接口的 M.2 SSD 是一个常见的选择。本篇博客将记录如何…...
haproxy七层代理知识点以及各种配置
1.为什么用haproxy 当后端主机有一个出现问题了的时候,我们需要访问的流量全部打到正常工作的后端主机,所以我们需要后端检测,lvs没有后端检测,所以就需要用到haproxy 2.负载均衡 2.1 什么是负载均衡 负载均衡,Loa…...
uniapp自定义浮动图标、列表布局
uniapp自定义浮动图标 <button class="fab" @click="goPage"><image src="../../../static/yiyuan.png" mode="" style="width: 60rpx;height:60rpx;"></image></button>.fab {z-index: 100;positi…...
学习嵌入式入门(十)高级定时器简介及实验(下)
一、高级定时器互补输出带死区控制实验 上图中,CH1 输出黄色的 PWM,它的互补通道 CH1N 输出绿色的 PWM。通过对比,可以 知道这两个 PWM 刚好是反过来的,CH1 的 PWM 为高电平期间,CH1N 的 PWM 则是低电平, 反…...
使用python在不改变原有excel的格式下,修改指定单元格格式
需求 有一个账单,需要生成一个副本,但是需要将交易员列隐藏,不能改变原有的格式 xlsx的文件容易实现,使用openpyxl实现 xls的文件使用xlrdxlutil实现 参考了https://segmentfault.com/q/1010000008270267 class GenCopyReport(o…...
MySQL数据库:详细安装与配置指南
目录 背景: 一.下载过程(MySQL数据库): 二.安装过程(MySQL数据库): 三.验证MySQL是否安装成功 背景: MySQL 是一个流行的开源关系数据库管理(RDBMS),由瑞典MySQL AB公司开发,后俩该公司被Sun Microsystems收购,Sun Microsyste…...
python爬虫代理IP实战
Python爬虫代理IP实战指南 在进行网络爬虫时,使用代理IP可以有效隐藏真实IP地址,避免被目标网站封禁。本文将通过实际示例,展示如何在Python中使用代理IP进行网络爬虫。 1. 环境准备 首先,确保您已安装Python和所需的库。在本示…...
样式,常用组件
3、代码实现登录的思路 设置属性的成员方法都有统一的命名规范: set()//就是某种属性的名字 父窗口:组件嵌套到那个主窗口中,这个主窗口就是父窗口 第一步:创建一个标签对象用来显示登录界面的标题 QLabe…...
Django Project | 云笔记练习项目
文章目录 功能整体架构流程搭建平台环境子功能先创建用户表 并同步到数据库1.用户注册密码存储 -- 哈希算法唯一索引引发的重复问题 try登陆状态保持 -- 详细看用户登录状态 2. 用户登录会话状态时间 cookie用户登录状态校验 3. 网站首页4.退出登录5.笔记模块 列表页添加笔记 …...
Zookeeper的监听机制
Zookeeper的监听机制是Zookeeper框架中一个至关重要的功能,它实现了分布式系统中数据状态变化的实时通知,使得客户端能够及时响应并处理这些变化。下面将详细解析Zookeeper的监听机制及其原理,包括监听器的注册、事件通知的处理、监听器的特点…...
Swift withAnimation 动画完成监听
在ios17中withAnimation有completion方法可以监听动画完成,但是低于ios17没有,需要自定义一个监听器,原理就是通过AnimatableModifier可以监听到值的didSet修改,我们就可以调用回调函数。 代码 // 动画完成监听 struct Animatabl…...
场外期权交易:找到适合你的那一款
各位期权爱好者们!今天咱们来聊聊在进行场外期权交易时,怎么去评估和选择适合自己风险承受能力的期权产品。 第一,你得对自己有个清楚的认识。想想看,你是那种激进型的冒险家,还是保守型的稳健派呢?了解自己…...
Elasticsearch-使用java 批量插入文档
首先创建两个实体类,用于存放所需值 开始编写接口,这里我使用的是RestController风格,然后使用PostMapping注解,入参根据自己的需求自定义,没有固定规范 这里实现接口的方法 然后重写接口中的方法(编写核心…...
【区块链+食品安全】农业产业全过程溯源云平台 | FISCO BCOS应用案例
近年来,食品安全问题频发,尤其疫情期间,海鲜、冷冻畜牧产品的入口安全成为大众关注焦点,追溯、确保相关产品生产、运输、售卖等环节的信息真实、有效,成为保证食品安全的核心环节。浙江天演维真网络科技股份有限公司基…...
每日面试题Day2
C语言中 # 和 ## 的用法 # 是 字符串化操作符,定义时用括号代表参数传递, 可以把传入的参数名替换成带双引号的字符串 定义: #define a(b) #a 使用:a(123) 编译时会展开成 "123" ## 是字符串连接符,定义时用括号代表参数传递, 可以把参数在宏定义的字符…...
基于MyBatis-plus的SpringBoot开发
目录 一、SpringBoot整合mybatis 二、SpringBoot整合mybatis-plus 1、什么是mybatis-plus? 2、mybatis-plus的特性 3、mybatis-plus的使用 (1)编写注解配置实体类与关系表映射关系 (2)mapper层 (3…...
网站数据导出为excel 源码大全java php c# js python 与网络安全兼顾-阿雪技术观
一、阿雪技术观谈网站安全 1.保护用户隐私和数据 用户在访问网站时会提供各种个人信息,如姓名、地址、联系方式、信息等。如果网站存在安全漏洞,这些敏感信息可能会被黑客窃取,导致用户遭受身份盗窃、欺诈等 2.维护企业声誉和信任 一个安全可…...
Python知识点21---怎么把你的Python项目打包成一个完整的结果物给别人提供
很多写Python的人,都会遇到一个很抓瞎的事情,项目这么打包?就比如写Java代码写惯了,突然写个Python,就在想怎么办Python的平替Maven是什么?怎么把环境和写的代码打成一个结果物?这篇就告诉你。 …...
关于#genesiscsheel#的问题,如何解决?
🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…...
无人机之如何避免飞行错误篇
在无人机飞行中,飞手可能会遇到各种问题,这些问题不仅会影响飞行效果,还可以带来安全隐患。以下是一些常见的错误及避免方法,帮助飞手提高飞行稳定性和安全性: 一、校准传感器 IMU(惯性测量单位࿰…...
免费简单的制作3D卡通建模——Fuse软件和Readyplayer的使用介绍
最终效果 文章目录 最终效果一、使用Fuse软件去Steam下载安装捏人选择身体部位自定义人物细节参数换装贴图修改导出OBJ文件即可 二、使用ReadyplayerReadyplayer官网地址选择从模板开始,或者拍照选择图片进行捏脸将模型导入Unity通过Readyplayer官方插件导入模型通过…...
企业大模型业务架构技术选型分析
AI赋能企业:选择适合你的大模型业务架构 现代企业中,大模型业务日益普及,主要涵盖AI Embedded、AI Copilot和AI Agent三大架构。本文深入剖析其特性与适用场景,为企业选择合适的大模型业务架构提供指导,助力企业高效应…...
pyqt5 中python如何通过Qtwebchannel主动发消息给web前端
🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…...
Java Web —— 第五天(请求响应2)
响应数据 ResponseBody 类型:方法注解、类注解 位置: Controller方法上/类上 作用:将方法返回值直接响应,如果返回值类型是 实体对象/集合,将会转换为JSON格式响应 说明: RestController Controller ResponseBody ; package com.example.springbo…...
数据科学 - 模型检验
1. 前言 模型检验是数据科学项目中至关重要的步骤,确保模型的质量,可靠性和实用性。 模型检验的主要目的是评估模型的性能,验证其在实际应用中的效果,以及防止模型出现过拟合,欠拟合或其他潜在问题。 在日常学习工作…...
【GaussDB(DWS)】数仓部署架构与物理结构分析
数仓架构与物理结构分析 一、部署架构二、物理结构三、测试验证 一、部署架构 华为数据仓库服务DWS,集群版本8.1.3.x 集群拓扑结构: 上述拓扑结构为DWS单AZ高可靠部署架构,为减少硬件故障对系统可用性的影响,建议集群部署方案遵…...
芙蓉区建设局网站/福州短视频seo服务
与VBOX相关操作: 1.右ctrl :ERH5在VBox中使用右边的ctrl实现光标的释放。 用exit退出当前terminal. 用halt 关机 reboot 重新启动就OK了。 linux命令的基本命令规定: 2.linux命令下是区分大小 写的。 3.命令 空格 -选项选项 名称OR路径;使用…...
冲压加工瑞安有做网站吗/网站接广告平台
“忆享聚焦”栏目第十三期来啦!本栏目汇集近期互联网最新资讯,聚焦前沿科技,关注行业发展动态,筛选高质量讯息,拓宽用户视野,让您以最低的时间成本获取最有价值的行业资讯。 目录 行业资讯 1. 微软深夜放炸…...
丽水网站建设报价/百度广告客服电话
目录 HMR是什么 使用场景 配置使用HMR 配置webpack解析webpack打包后的文件内容配置HMRHMR原理 debug服务端源码 服务端简易实现服务端调试阶段 debug客户端源码 客户端简易实现客户端调试阶段问题总结 HMR是什么 HMR即Hot Module Replacement是指当你对代码修改并保存后&…...
网站建设价格评审资料清单/深圳seo推广培训
线程中一个比较大的问题,就是任务一般是死循环. 而且如果强行终止线程,往往会带来内存泄漏的问题. 这方面最好的办法,就是设置一个值作为标志. 如果这个标志发生了变化,就break. 最好的方式是用事件的方式,而不是用sleep()轮询的方式. 因为sleep是有不可避免的时间差的. 下面看…...
无锡网站制作哪家便宜/个人免费开发app
进程管理 1. 进程管理基础 在Linux中,每个执行的**程序(代码)**都称为一个进程。每个进程都分配一个ID号每一个进程,都会对应一个父进程,而这个父进程可以复制多个子进程。例如www服务器。每个进程都可能以两种方式存…...
建网站需要多钱/外贸网站设计
Devart 提供包括Oracle、SQL Server、MySQL、PostgreSQL、InterBase以及Firebird在内的专业数据库远程管理软件,dbForge Studio for MySQL是一个在Windows平台被广泛使用的MySQL客户端,它能够使MySQL开发人员和管理人员在一个方便的环境中与他人一起完成…...