【数据分析实战】冰雪大世界携程景区评价信息情感分析采集词云
文章目录
- 引言
- 数据采集
- 数据集展示
- 数据预处理
- 数据分析
- 评价总体情况分析
- 本人浅薄分析
- 各游客人群占比分析
- 本人浅薄分析
- 各评分雷达图
- 本人浅薄分析
- 差评词云-可视化
- 本人浅薄分析
- 好评词云-可视化
- 本人浅薄分析
- 综合分析
- 写在最后
今年冬天,哈尔滨冰雪旅游"杀疯了",在元旦假期更是被南方游客"包场"。据哈尔滨市文化广电和旅游局提供大数据测算,截至元旦假日第3天,哈尔滨市累计接待游客304.79万人次,实现旅游总收入59.14亿元。游客接待量与旅游总收入达到历史峰值。
“不是北欧去不起,而是哈尔滨更有性价比。”
“零下二十摄氏度,我在哈尔滨当‘俄式公主’。”
引言
最近几天,哈尔滨冰雪大世界也屡登社交平台热搜榜。
12月18日上午,第二十五届哈尔滨冰雪大世界开园,不到3小时,预约游玩人数已达40000人。火爆之下,游客现场大喊“退票”的视频却在网络热传。据悉,冰雪大世界有几个热门项目需要线上预约后才能玩,不少游客吐槽,这些项目不仅难约,约上后排队时间也很长,以致引发不满。舆情发酵后,次日,景区发布致歉声明并推出整改措施,哈尔滨文旅局领导赴冰雪大世界现场督导。
今天,我们通过Python采集点评网站(携程)上网友对哈尔滨冰雪大世界的评价,通过数据分析一下游客对冰雪大世界的各个不满意的点和值得学习的点。
数据采集
数据采集是数据分析的前提,在数据采集阶段,我选择了在携程网站上获取用户公开评价冰雪大世界的数据。使用了Python编程语言,结合相关库如Requests和JSON,通过网页爬虫技术实现了数据的自动抓取。共采集到5528条公开评价数据。
采集难度★★
数据集展示
_id | publishTime | score | content | publishTypeTag | ipLocatedName | touristTypeDisplay | |
---|---|---|---|---|---|---|---|
0 | 180204656 | /Date(1703671819000+0800)/ | 5 | 太壮观啦,上一次是10年前来的,变化很大… | 2023-12-27 发布点评 | 上海 | 情侣夫妻 |
需要采集数据的可以联系我~
vvvvvv:176-1035-2720
数据预处理
使用了Python中一些强大的数据处理和分析工具,包括:
Pandas:用于数据清洗和整理。
Numpy:进行数学运算,如计算评分占比。
Pyecharts:生成可视化图表,直观展示分析结果。
预处理了发布日期的杂乱文字,还将一些分值拆分了出来。
_id | publishTime | score | content | publishTypeTag | ipLocatedName | touristTypeDisplay | 景色 | 趣味 | 性价比 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 180204656 | /Date(1703671819000+0800)/ | 5 | 太壮观啦,上一次是10年前来的,变化很大… | 2023-12-27 | 上海 | 情侣夫妻 | 5 | 5 | 5 |
数据分析
通过pyecharts配合pandas、numpy进行了各个指标的分析。
评价总体情况分析
统计不同评分的占比,观察整体满意度。
本人浅薄分析
-
总体评分分布:
- 大多数用户给予景区较高的评分,特别是5分和4分,分别占总评价的69.05%和13.44%。可以看出大多数的游客对景区的整体体验是持积极态度。
-
主要评分集中在高分:
- 有近90%的用户给予3分及以上的评分,说明整体来说,景区受到了较为积极的评价。
各游客人群占比分析
通过用户评价中提到的信息,分析不同人群的占比。
本人浅薄分析
-
主要人群占比:家庭亲子、朋友出游和情侣夫妻是该景区的主要游客群体,分别占比较大。可以看出冰雪大世界在家庭、朋友和情侣旅行市场有较好的吸引力。
-
其他出游和商务出差占比较低:相较于其他出游和商务出差,这两类人群在评价中的占比相对较低。可以看出该景区的特色更适合休闲度假和亲子游,而在商务和其他类型旅行方面有发展空间。
各评分雷达图
本人浅薄分析
-
总体评分较高:雷达图上各项评分都在4分以上,显示大多数游客对景区的各方面评价都较为满意。这是一个积极的信号,说明景区在整体上受到游客的好评。
-
景色和景区评分相对较高:从雷达图中可以看出,景色和景区方面的评分较高,可能是景区的自然风光和整体设计得到了游客的好评。这是景区的优势,值得进一步宣传。
差评词云-可视化
差评:分值为1、2的定义为差评
本人浅薄分析
问题关键词:预约、排队、滑梯、摩天轮、体验、小时、退票、黄牛是差评中出现频率较高的关键词。这些词反映了一些问题,如预约流程、排队体验、设备运行时间等。景区可能需要关注这些方面,以改善游客体验。
好评词云-可视化
本人浅薄分析
- 好评关键词:哈尔滨、滑梯、很漂亮、不错、灯光、冰雕、值得是好评中出现频率较高的关键词。这些词反映了游客对景区整体美观性、设施、服务的积极评价。景区可以借助这些优势进一步宣传和推广。
综合分析
-
冰雪大世界在吸引家庭亲子、朋友出游和情侣夫妻方面表现较好,可进一步加强在这些人群中的宣传和推广。
-
差评中的问题关键词提示了一些流程和体验问题,景区可能需要优化一些运营方面的细节,以提升整体用户满意度。
-
好评中的关键词反映了景区的美丽和特色,景区可以通过这些优势进行更有针对性的宣传。
-
总体评分较高,但仍有一些方面可以改进,比如提升性价比。景区可通过进一步了解游客需求,优化服务和提升设施,以提高整体满意度和吸引更多游客。
写在最后
通过对冰雪大世界5528条携程用户公开评价的深入分析,我们深入了解了游客的评价情况,以及景区在不同方面的优势和改进空间。
该分析仅供学习交流使用,禁止用于商业用途,不构成任何投资建议。
大数据分析为运营和各行业带来了前所未有的机会,使企业能够更敏锐地洞察市场、优化运营,并更有效地应对竞争和变革。在信息时代,充分利用大数据分析,将成为企业取得竞争优势的不可忽视的关键要素。
本人数据分析领域的从业者,拥有专业背景和能力,可以为您的数据挖掘和分析需求提供支持。期待着能够与您共同探索更多有意义的数据洞见,为您的项目和业务提供数据分析方面的帮助。
创作不易,如果你觉得有帮助,请点个赞支持一下。你的鼓励是我创作的最大动力,期待未来能为大家带来更多有趣的分析文章。感谢大家的阅读和支持!
相关文章:

【数据分析实战】冰雪大世界携程景区评价信息情感分析采集词云
文章目录 引言数据采集数据集展示数据预处理 数据分析评价总体情况分析本人浅薄分析 各游客人群占比分析本人浅薄分析 各评分雷达图本人浅薄分析 差评词云-可视化本人浅薄分析 好评词云-可视化本人浅薄分析 综合分析写在最后 今年冬天,哈尔滨冰雪旅游"杀疯了&q…...

BIND-DNS配置介绍
一、主要配置文件 /etc/named.conf options { //Option 段全部配置 listen-on port 53 { 127.0.0.1; };//表示BIND将在53端口监听,若需要对所有IP进行监听,则修改为// listen-on port 53 { any; }; directory "/var/named"…...

Python技巧
Python,现如今非常热门的一种编程语言,在人工智能中大放异彩。做任何事都需要技巧,这可以大大提高效率,学习Python,同样如此! 第一个就是assret语句,让我们看下面一个关于折扣的例子: def dic…...

几种常见的CSS三栏布局?介绍下粘性布局(sticky)?自适应布局?左边宽度固定,右边自适应?两种以上方式实现已知或者未知宽度的垂直水平居中?
几种常见的CSS三栏布局 流体布局 效果: 参考代码: <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…...

箭头函数 - JavaScript的新宠儿
📢 鸿蒙专栏:想学鸿蒙的,冲 📢 C语言专栏:想学C语言的,冲 📢 VUE专栏:想学VUE的,冲这里 📢 CSS专栏:想学CSS的,冲这里 Ǵ…...

操作系统期末复习知识点
目录 一.概论 1.操作系统的介绍 2.特性 3.主要功能 4.作用 二.进程的描述与控制 1.进程的定义 2.特性 3.进程的创建步骤 4.基本状态转化 5.PCB的作用 6.进程与线程的比较 三.进程同步 1.同步的概念(挺重要的) 2.临界区 3.管程和进程的区…...

[英语学习][23][Word Power Made Easy]的精读与翻译优化
[序言] 译者的这次翻译, 完全直译, 生硬无比. [英文学习的目标] 提升自身的英语水平, 对日后编程技能的提升有很大帮助. 希望大家这次能学到东西, 同时加入我的社区讨论与交流英语相关的内容. [原著英文与翻译版对照][第22页] Knowledge is chiefly in the form of words…...

吉林大学19、21级计算机学院《计算机网络》期末真题试题
一、21级(考后回忆) 一、不定项选择(一共10个选择题,一个两分,选全得满分) 不定项:可以选择1~4个 考点有: ①协议、服务 ②码分多路复用通过接受码片序列,求哪个站点发送…...

python练习3【题解///考点列出///错题改正】
一、单选题 1.【单选题】 ——可迭代对象 下列哪个选项是可迭代对象( D)? A.(1,2,3,4,5) B.[2,3,4,5,6] C.{a:3,b:5} D.以上全部 知识点补充——【可迭代对象】 可迭代对象(iterable)是指可以通过迭代ÿ…...

LINUX服务器防火墙nf_conntrack问题一例
一、故障现象 业务反馈服务异常,无法响应请求,从系统日志 dmesg 或 /var/log/messages 看到大量以下记录:kernel: nf_conntrack: table full, dropping packet. 二、问题分析 业务高峰期服务器访问量大,内核 netfilter 模块 conntrack 相关参…...

经典八股文之RocketMQ
核心概念 NameServer nameserver是整个rocketmq的大脑,是rocketmq的注册中心。broker在启动时向所有nameserver注册。生产者在发送消息之前先从 NameServer 获取 Broker 服务器地址列表(消费者一 样),然后根据负载均衡算法从列表中选择一台服务器进行消…...

Pandas之从sql库中导入数据的几种方法分析
1.使用mysql-connector-python库将SQL文件导入到Python中,并查询数据库中的表 确保已经安装mysql-connector-python库 #导入模块 import mysql.connector# 建立与MySQL数据库的连接 conn mysql.connector.connect(host"localhost",user"username&…...

18. Mysql 存储过程,实现动态数据透视
文章目录 概述常见操作创建存储过程存储过程局部变量定义和赋值查看存储过程删除存储过程调用存储过程 示例-动态数据透视详细讲解总结参考资料 概述 Mysql 存储过程是一组预先编译的 sql 语句集合,它们被存储在数据库中,并可以被多次调用执行。存储过程…...

VuePress部署到GitHub Pages
一、git push自动部署 1、创建用于工作流的文件 在项目根目录下创建一个用于 GitHub Actions 的工作流 .yml 文件 name: docson:# 每当 push 到 main 分支时触发部署push:branches: [main]# 手动触发部署workflow_dispatch:jobs:docs:runs-on: ubuntu-lateststeps:- uses: a…...

git 本地仓库
本地仓库 start.bat 启动...

Hive实战:分科汇总求月考平均分
文章目录 一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到HDFS指定目录 (二)实现步骤1、启动Hive Metastore服务2、启动Hive客户端3、创建分区的学生成绩表4、按分区加载数据5、查看分区…...

快速搭建知识付费小程序,3分钟即可开启知识变现之旅
明理信息科技知识付费saas租户平台 在当今数字化时代,知识付费已经成为一种趋势,越来越多的人愿意为有价值的知识付费。然而,公共知识付费平台虽然内容丰富,但难以满足个人或企业个性化的需求和品牌打造。同时,开发和…...

【计算机图形学划重点】第一讲-Pipeline and Introduction
基础知识 Vertex(顶点) define the location of primitives in space, and consists of vertex stream. 顶点用于定义空间中基本图形(primitives)的位置。它包含了一个顶点流(vertex stream),…...

面试题-DAG 有向无环图
有向无环图用于解决前后依赖问题,在Apollo中用于各个组件的依赖管理。 在算法面试中,有很多相关题目 比如排课问题,有先修课比如启动问题,需要先启动1,才能启动2 概念 顶点: 图中的一个点,比…...

vite + vue3引入ant design vue 报错
npm install ant-design-vue --save下载插件并在main.ts 全局引入 报错 解决办法一: main.ts注释掉全局引入 模块按需引入 解决办法二 将package.json中的ant-design-vue的版本^4.0.0-rc.4改为 ^3.2.15版本 同时将将package-lock.json中的ant-design-vue的版本…...

使用EasyPoi导入数据并返回失败xls
添加依赖 <!-- https://mvnrepository.com/artifact/cn.afterturn/easypoi-base --> <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-base</artifactId><version>4.4.0</version> </dependency> 工…...

机械配件移动商城课程概述
项目介绍 开发准备 任务 开源库介绍 框架搭建 工具类...

prometheus-docker 快速安装
镜像加速 sudo mkdir -p /etc/docker sudo tee /ect/docker/daemon.json << "EOF" {"register-mirros": ["http://hub-mirror.c.163.com"] } EOF安装docker export DOWNLOAD_URL"http://mirrors.163.com/docker-ce" curl -fsSl…...

RabbitMQ 核心概念(交换机、队列、路由键),队列类型等介绍
RabbitMQ 核心概念(交换机、队列、路由键),队列类型等介绍 RabbitMQ 是一个消息队列系统,它的核心概念包括交换机(Exchange)、队列(Queue)和路由键(Routing Key),它们一起…...

1001 害死人不偿命的(3n+1)猜想
卡拉兹(Callatz)猜想: 对任何一个正整数 n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把 (3n1) 砍掉一半。这样一直反复砍下去,最后一定在某一步得到 n1。卡拉兹在 1950 年的世界数学家大会上公布了…...

七、HTML 文本格式化
一、HTML 文本格式化 加粗文本斜体文本电脑自动输出 这是 下标 和 上标 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>HTML文本格式化</title> </head><body><b>加粗文本</b><br>…...

OSI 模型和 TCP/IP 模型的异同
开放式系统互联模型(OSI)是一个参考标准,解释协议相互之间应该如何相互作用。TCP/IP协议是美国国防部发明的,是让互联网成为了目前这个样子的标准之一 OSI:物理层,数据链路层,网络层࿰…...

创新性文生视频模型,南洋理工开源FreeInit
文本领域的ChatGPT,画图领域的Midjourney都展现出了大模型强大的一面,虽然视频领域有Gen-2这样的领导者,但现有的视频扩散模型在生成的效果中仍然存在时间一致性不足和不自然的动态效果。 南洋理工大学S实验室的研究人员发现,扩散…...

linux的页缓存page cache
目录 如何查看系统的 Page Cache? 为什么 Linux 不把 Page Cache 称为 block cache? Page Cache 的优劣势 Page Cache 的优势 加快数据访问 减少 IO 次数,提高系统磁盘 I/O 吞吐量 Page Cache 的劣势 由于我们开发的程序要运行的话一般…...

数字IC后端实现之Innovus TA-152错误解析(分频generated clock定义错误)
**ERROR: (TA-152): A latency path from the ‘Fall’ edge of the master clock at source pin… Error Code TA-152 在数字IC后端实现innovus中我们经常会看到这类Error,具体信息如下所示。 Error Message **ERROR: (TA-152): A latency path from the ‘Fa…...