数据分析实战—房价特征关系
1.实战内容
(1) 读取房价特征关系表(house_price.npz)绘制离地铁站的距离与单位面积的房价的散点图,并对其进行分析;
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings("ignore")
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] = 'SimHei'
matplotlib.rcParams['axes.unicode_minus'] = Falsedata = np.load('house_price.npz', encoding='ASCII', allow_pickle=True)
data.files
columns = data['arr_0']
columns
values = data['arr_1']
values
year = values[:, 0]
age = values[:, 1]
distance = values[:, 2]
store = values[:, 3]
price = values[:, 4]
p = plt.figure(figsize=(8, 8))
plt.scatter(distance, price, marker='o')
plt.xlabel('离地铁站的距离')
plt.ylabel('单位面积房价')
plt.savefig('离地铁站的距离与单位面积房价关系图.png')
plt.show()
(2) 创建新画布,将附近的商店个数划分为“0~3”,“4~7”,“8~10”3 个区间,并根据个数贴上 对应的标签:“较少”,“中等”,“较多”。分别计算 3 个区间下单位面积的房价的均值,绘制附近商店的个数与单位面积的房价的柱形图,并进行分析;
# (2)划分和画图
num_0_3 = []
num_4_7 = []
num_8_10 = []
for i in range(len(values)):if 0 <= store[i] < 4:num_0_3.append(price[i])elif 4 <= store[i] < 8:num_4_7.append(price[i])else:num_8_10.append(price[i])mean_num_0_3 = round(np.mean(num_0_3), 2)
mean_num_4_7 = round(np.mean(num_4_7), 2)
mean_num_8_10 = round(np.mean(num_8_10), 2)
mean_all_num = [mean_num_0_3, mean_num_4_7, mean_num_8_10]p = plt.figure(figsize=(8, 8))
label = ['较少', '中等', '较多']
plt.bar(range(3),mean_all_num, width=0.4) # 绘制直方图
plt.xlabel('附近商店数')
plt.ylabel('单位面积房价')
plt.xticks(range(3),label)
plt.savefig('附近商店数与单位面积房价关系图.png')
plt.show()
(3) 创建新画布,根据交易年份绘制饼图,并查看交易年份的分布情况;
#(3)交易年份
import pandas as pd
year_new=pd.DataFrame(year)
year_new=year_new.drop_duplicates()#查看年份
year_new
year_2018 = 0
year_2019 = 0
year_2020 = 0
for i in range(len(values)):if year[i] == 2018:year_2018 += 1elif year[i] == 2019:year_2019 += 1else:year_2020 += 1all_year = [year_2018, year_2019, year_2020]p = plt.figure(figsize=(8, 8))
label= ['2018', '2019', '2020']
explode = [0.01, 0.01, 0.01] # 设定各项离心 n 个半径
plt.pie(all_year, explode=explode, labels=label, autopct='%1.1f%%',
textprops={'fontsize': 20}) # 绘制饼图
plt.title('房屋交易年份分布情况饼图', fontsize=20)
plt.savefig('房屋交易年份总体分布情况饼图.png')
plt.show()
(4) 创建新画布,再子图上分别绘制房屋年龄、离地铁站的距离、附近商店的个数、单位面积的 房价 4 个特征的箱线图,查看是否存在异常值。
# (4)箱线图
p = plt.figure(figsize=(10,10)) # 设置画布
ax1 = p.add_subplot(2, 2, 1)
gdp = (list(age))
plt.boxplot(gdp, notch=True, meanline=True) # 绘制箱线图
plt.ylabel('房屋年龄')
plt.title('房屋年龄分布情况箱线图', fontsize=20)
ax2 = p.add_subplot(2, 2, 2)
gdp = (list(distance))
plt.boxplot(gdp, notch=True, meanline=True) # 绘制箱线图
plt.ylabel('地铁站距离')
plt.title('地铁站距离分布情况箱线图', fontsize=20)ax3 = p.add_subplot(2, 2, 3)
gdp = (list(store))
plt.boxplot(gdp, notch=True, meanline=True) # 绘制箱线图
plt.ylabel('附近商店个数')
plt.title('附近商店个数分布情况箱线图', fontsize=20)
ax4 = p.add_subplot(2, 2, 4)
gdp = (list(price))
plt.boxplot(gdp, notch=True, meanline=True) # 绘制箱线图
plt.ylabel('单位面积房价')
plt.title('单位面积房价分布情况箱线图', fontsize=20)
plt.savefig('各个特征分布情况箱线图.png')
plt.show()
ax2 = p.add_subplot(2, 2, 2)
gdp = (list(distance))
plt.boxplot(gdp, notch=True, meanline=True) # 绘制箱线图
plt.ylabel('地铁站距离')
plt.title('地铁站距离分布情况箱线图', fontsize=20)
相关文章:
数据分析实战—房价特征关系
1.实战内容 (1) 读取房价特征关系表(house_price.npz)绘制离地铁站的距离与单位面积的房价的散点图,并对其进行分析; import pandas as pd import numpy as np import warnings warnings.filterwarnings(&…...
云和恩墨 zCloud 与华为云 GaussDB 完成兼容性互认证
近日,云和恩墨(北京)信息技术有限公司(以下简称:云和恩墨)的多元数据库智能管理平台 zCloud 与华为云计算技术有限公司(以下简称:华为云)的 GaussDB 数据库完成了兼容性互…...
【大语言模型LangChain】 ModelsIO OutputParsers详解
【大语言模型LangChain】 ModelsIO OutputParsers详解 一、简介二、OutputParsers 的优势三、解析器类型四、实战示例1、String 解析器2、Json 解析器3、Pydantic 解析器4、结构化输出解析器5、OpenAI 函数输出解析器5.1、JsonOutputFunctionsParser5.2、JsonKeyOutputFunction…...
PaddleSpeech本地部署文档
windows安装paddlespeech步骤: 1. 安装vs c编译环境 对于 Windows 系统,需要安装 Visual Studio 来完成 C 编译环境的安装。 Microsoft C Build Tools - Visual Studio 2. 安装conda conda create -y -p paddlespeech python3.8 conda activate pad…...
Android 第三方框架:RxJava:源码分析:责任链模式
文章目录 责任链模式RxJava中的责任链总结 责任链模式 RxJava中的责任链 链式调用的使用过程中形成了两个单向链表 第一个单向链表是Observable链表 它的形成过程: 1.首先调用Observable的静态方法创建第一个Observable对象,作为Observable链表的表…...
网络安全 与 加密算法
计算机中的网络安全 在本篇中介绍了以下几个方面: 机密性 密码学 对称加密算法(DES, 3DES, AES) 公开秘钥算法 RSA大素数的获取 完整性 散列函数(MD5, SHA-1, 并没有提及算法实现) 报文鉴别(MAC) 数字签名 端点鉴别 应用 SSL(TCP网络安全) 运行时安全 防火墙的基本知识 …...
UE4_贴花_贴花基础知识二
五、多表面投射 在本示例中,你将了解贴花如何在多个表面上进行投射。请注意,如果表面朝向与投射方向较为平行,贴花投射时必然会产生一些拉伸。另外,请记住,贴花可以在包括骨骼网格体在内的静态和动态网格体上进行投射。…...
ElasticSearch 搜索、排序、分页功能
一、DSL 查询文档 ElasticSearch 的查询依然是基于 json 风格的 DSL 来实现的。 官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/8.15/query-dsl.html 1.1 DSL 查询分类 常见的查询类型包括: 查询所有:查询出所有数…...
MySQL-9.1.0 实现最基础的主从复制
目录 1 实验介绍 2 实验准备 2.1 创建目录为MySQL挂载使用 2.2 编写 docker-compose.yml 文件 2.3 启动容器 3 主从复制操作 3.1 MASTER 操作指令 3.2 SLAVE1 操作指令 3.3 SLAVE2 操作指令 4 验证是否实现主从 4.1 导入sql脚本查看是否正常主从复制 4.2 检验从库是否看见复制…...
Java中的“泛型“
泛型(Generics)是Java中的一种重要特性,它允许在定义类、接口和方法时使用类型参数(type parameters)。泛型的主要目的是提高代码的类型安全性和重用性。下面我将详细讲解Java中的泛型。 1. 泛型的基本概念 泛型允许我…...
前端(五)css属性
css属性 文章目录 css属性一、字体属性二、文本属性三、背景属性四、盒子模型 一、字体属性 font-weight:文字粗细,在100到900之间,normal(400),bord(700),inherit(继承父类) font-style:文字风格,normal表示正常(默认…...
总结拓展十七:SAP 采购订单行项目“交货“页签解析
《 SAP采购订单行项目“交货”页签字段解析》 在 SAP 系统的采购流程中,采购订单行项目的“交货”页签承载着关键的信息,其中的字段更是对整个交货环节的精准描述和把控的重要元素。理解和正确解析这些字段,对于确保采购流程的顺利进行、优化…...
分布式日志系统设计
一、分布式日志系统定义 分布式日志系统是一种用于收集、存储和分析大规模分布式系统日志的系统。它可以帮助开发人员和系统管理员实时监控和调试系统,提高系统可靠性和可用性,同时也可以用于日志分析和故障排查。 二、简单设计思路 日志收集ÿ…...
DApp开发如何平衡性能与去中心化?
DApp的核心价值在于信任、透明和去中心化,但这些特点往往伴随着性能的瓶颈和高成本。在DApp开发中,如何在保证去中心化的前提下提升性能,成为开发者面临的重要挑战。如何实现性能与去中心化的平衡是一个重要课题。 一、为什么去中心化影响性…...
RK3588开发笔记-Buildroot编译Qt5WebEngine-5.15.10
目录 前言 一、Qt5WebEngine简介 二、Qt5WebEngine编译 总结 前言 Rockchip RK3588是一款强大的多核处理器,广泛应用于边缘计算、人工智能、嵌入式系统等领域。为了在RK3588上运行自定义的Linux系统,并使用Qt5WebEngine进行Web内容渲染,Buildroot是一个非常合适的工具。本…...
2024年12月GESPC++三级真题解析
一、单选题(每题2分,共30分) 题目123456789101112131415答案 B D A A D B C A A D D C D C A 1.下列二进制表示的十进制数值分别是( )[10000011]原( ) [10000011]补ÿ…...
vue-router路由传参的两种方式(params 和 query )
一、vue-router路由传参问题 1、概念: A、vue 路由传参的使用场景一般应用在父路由跳转到子路由时,携带参数跳转。 B、传参方式可划分为 params 传参和 query 传参; C、而 params 传参又可分为在 url 中显示参数和不显示参数两种方式&#x…...
Asp.net 做登录验证码(MVC)
public class ValidateCode{/// <summary>/// 创建随机数/// </summary>/// <param name"num"></param>/// <returns></returns>public string CreateRandom(int num){string str "ABCDEFGHJKMNPQRSTUVWXYZabcdefghjkmnpq…...
在 Chrome中直接调用大型语言模型的API
AI 时代的高速发展,我们都习惯了使用 ChatGPT、Claude、Gemini 和其他 AI 工具来询问各种问题,目前大部分的 AI 应用都是通过服务端 API 来实现的。 如果想要在 Web 上使用 AI 功能往往需要靠服务器来处理一些非常大的模型。这在制作一些生成内容的 AI …...
微信小程序调用腾讯地图-并解读API文档 JavaScript SDK和 WebService API
搜索:腾讯位置服务 找到API文档: 入门中第一步:申请开发者密钥key 前往控制台: 创建应用并获取key: 设置key的时候,还需要小程序的APPID。所以要前往微信公众平台中获取小程序的APPID: 限制要求:…...
WPF 控件
<div id"content_views" class"htmledit_views"><p id"main-toc"><strong>目录</strong></p> WPF基础控件 按钮控件: Button:按钮 RepeatButton:长按按钮 RadioButton:单选按钮 数据显示控件 Te…...
VScode执行任务
背景 在vscode 中 如果执行命令需要传递进来参数,那么直接通过命令行终端的方式不太方便。通过task 任务的方式来进行启动执行,降低反复输入参数等繁琐工作。 首先可以查看vscode 官方文档 task 启动 crtl shift p .vscode/task.json 示例 执行cp…...
MySQL(数据类型)
目录 1. 数值类型 2. bit类型 3.小数类型 3. 字符串类型 4 日期和时间类型 5. enum和set 1. 数值类型 对标C语言: tinyint->char(1字节): 有符号:127 ~ 255 无符号:0 ~ -128。 smalli…...
pytorch中的tqdm库
tqdm 是一个 Python 的进度条库,名字来源于阿拉伯语 "taqaddum"(意思是“进步”)。它以简单易用、高效著称,常用于循环操作中显示进度信息。 基本用法 1. 普通循环 tqdm 可以轻松为 for 循环添加进度条: …...
NoSQL大数据存储技术测试(5)MongoDB的原理和使用
单项选择题 第1题 关于 MongoDB 集群部署下面说法不正确的是() 已经不使用主从复制的模式 在实际应用场景中, Mongodb 集群结合复制集和分片机制 MongoDB 支持自动分片, 不支持手动切分 (我的答案) 每…...
【Golang】Go语言编程思想(六):Channel,第四节,Select
使用 Select 如果此时我们有多个 channel,我们想从多个 channel 接收数据,谁来的快先输出谁,此时应该怎么做呢?答案是使用 select: package mainimport "fmt"func main() {var c1, c2 chan int // c1 and …...
Vue2简介
一、官网 英文官网: https://vuejs.org/中文官网: https://cn.vuejs.org/ 二、介绍与描述 动态构建用户界面的渐进式 JavaScript 框架 作者: 尤雨溪 三、Vue 的特点 遵循 MVVM 模式 编码简洁, 体积小, 运行效率高, 适合移动/PC 端开发 它本身只关注 UI, 也可以引入其它第三…...
EasyPlayer.js播放器如何在iOS上实现低延时直播?
随着流媒体技术的迅速发展,H5流媒体播放器已成为现代网络视频播放的重要工具。其中,EasyPlayer.js播放器作为一款功能强大的H5播放器,凭借其全面的协议支持、多种解码方式以及跨平台兼容性,赢得了广泛的关注和应用。 那么要在iOS上…...
ChatGPT Pro是什么
ChatGPT Pro 和 ChatGPT Plus 的区别主要体现在功能范围、适用场景和目标用户上。 ChatGPT Plus 功能 • 价格:20美元/月。 • 目标用户:针对个人用户设计。 • 主要特点: • 在高峰期响应速度更快。 • 使用高级模型(如 GPT-4…...
基于Springboot汽车资讯网站【附源码】
基于Springboot汽车资讯网站 效果如下: 系统主页面 汽车信息页面 系统登陆页面 汽车信息推荐页面 经销商页面 留言反馈页面 用户管理页面 汽车信息页面 研究背景 随着信息技术的快速发展和互联网的普及,互联网已成为人们查找信息的重要场所。汽车资讯…...
做品牌文化的网站/南宁seo优化公司排名
https://www.luogu.org/problem/show?pid1197 感觉并查集要维护删除好像很棘手; 开两个并查集也无法解决问题; 尴尬; 本着zyy大神的不是考试懒得想的理念发了一下题解; 发现只要倒着来就好了; 就是离线做&#…...
网站源码编辑软件/职业技能培训
--事物的难度远远低于对事物的恐惧! 最近出差较多,没什么时间记录博客笔记,刚好乘五一假期好好写一点。今天我们来看看C语言条件编译使用分析。 在C语言中,我们很熟悉if...else...这样的条件语句,而我们这章所说的条件…...
好看的网站首页/如何创建自己的卡网
虽然到现在为止,留言中还没有一个人看好 Dojo ,但是我还是准备继续写下去,不保证能写完,也许哪天不想写了,或者另有所爱了,可能就结束了,呵呵。 另外,相对于效率,我还是更…...
海珠营销型网站建设/免费推广渠道有哪些
前两天刚刚装了一个MyEclipse,今天用了一下,却发现,每次想要在控制台上输出中文时,总是以乱码显示的。查了很多资料,对算是搞明白,怎么回事。首先,在这里先解释下,MyEclipse…...
路由器怎么做网站/seo优化常识
本文介绍使用Spire.Cloud.SDK for Java 提供的BackgroundApi接口来操作Word文档背景的方法,可设置背景,包括设置颜色背景setBackgroundColor()、图片背景setBackgroundImage(),删除背景deleteBackground()和获取背景颜色getBackgroundColor()…...
重庆本地建站/郑州seo外包阿亮
1.首先你要有一个github账号,如果没有的话,登录网址注册:https://github.com/ 2.进入你的github 点击右上角的号 选择 New repository 3.取一个Repository name,不能和自己的其他项目冲突 PS:Repository name: 仓库名称Description(可选…...