【45 Pandas+Pyecharts | 去哪儿海南旅游攻略数据分析可视化】

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 查看数据信息
    • 2.3 日期处理,提取年份、月份
    • 2.4 经费处理
    • 2.5 天数处理
  • 🏳️‍🌈 3. Pyecharts数据可视化
    • 3.1 出发日期_年份分布
    • 3.2 出发日期_月份分布
    • 3.3 出行天数分布
    • 3.4 旅游途经点分布
    • 3.5 出行团体占比
    • 3.6 人均消费区间占比
    • 3.7 出行类型标签统计
    • 3.8 旅游行程景点词云
  • 🏳️‍🌈 4. 可视化项目源码+数据

大家好,我是 👉【Python当打之年(点击跳转)】

本期利用 python 分析一下「去哪网海南旅游攻略数据」 ,看看海南哪些旅游景点最受大家喜爱,哪个时间段旅游的朋友比较多,最受大家欢迎的旅行方式有哪些,以及旅行目的 等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas — 数据处理
  • Pyecharts — 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_excel("./去哪网海南攻略数据.xlsx")

在这里插入图片描述

2.2 查看数据信息

df.info()

在这里插入图片描述

2.3 日期处理,提取年份、月份

df['出发日期_年'] = [int(i.split('-')[0]) for i in df['出发日期'].tolist()]
df['出发日期_月'] = [int(i.split('-')[1]) for i in df['出发日期'].tolist()]

在这里插入图片描述

2.4 经费处理

fee = [int(i.replace('人均','').replace('元','')) for i in df_fee['人均消费'].tolist()]
df_fee['人均消费'] = fee

在这里插入图片描述

2.5 天数处理

df['天数'] = df['天数'].str[1:-1]
df['天数'] = df['天数'].astype('int')

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 出发日期_年份分布

def get_chart1():chart = (Bar().add_xaxis(x_data).add_yaxis("", y_data).set_global_opts(title_opts=opts.TitleOpts(title="1-出发日期_年",pos_top='2%',pos_left="center",),legend_opts=opts.LegendOpts(is_show=False),xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=False)),yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=False)),visualmap_opts=opts.VisualMapOpts(is_show=False,),))return chart

在这里插入图片描述

  • 2014、2015、2016年的攻略数量相较于其他年份明显较多、2017-2021年趋于平稳。

  • 近三年时间大概由于时间比较近,加之疫情原因,所以攻略数量较少。

3.2 出发日期_月份分布

def get_chart2():chart = (Line().add_xaxis(x_data).add_yaxis("", y_data).set_global_opts(title_opts=opts.TitleOpts(title="2-每月攻略数量",pos_top='2%',pos_left="center",),visualmap_opts=opts.VisualMapOpts(is_show=False),legend_opts=opts.LegendOpts(is_show=False),))return chart

在这里插入图片描述

  • 1月、12月的攻略数比较高,大概占到了总数量的20%,反而6月、7月、8月的数量相对低一些。

3.3 出行天数分布

在这里插入图片描述

  • 从出行天数上来看,大多集中在一周(5天)左右,也有少量半个月、一个月的旅游时间。

3.4 旅游途经点分布

在这里插入图片描述

  • 首当其冲当然是三亚(1853)啦!远超排在第二的海口(182),基本是10倍之多,紧随其后的是陵水(108)、万宁(60)、文昌(46)等地。

3.5 出行团体占比

def get_chart3():chart = (Pie().add("", [list(z) for z in zip(x_data, y_data)]).set_global_opts(title_opts=opts.TitleOpts(title="5-出行团体占比",pos_top='2%',pos_left="center"),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False,),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%")))return chart

  • 出行团体方面大多以好友(22%)、情侣(21%)和家庭(20%)团体居多。

3.6 人均消费区间占比

在这里插入图片描述

  • 人均消费3000-5000元居多,占比46%,1000-3000元占比28%。

3.7 出行类型标签统计

在这里插入图片描述

3.8 旅游行程景点词云

def get_chart4():chart = (WordCloud().add("",words,word_size_range=[10,50]).set_global_opts(title_opts=opts.TitleOpts(title='8-旅游行程景点词云',pos_top='2%',pos_left="center",),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=False),))return chart

在这里插入图片描述

  • 亚龙湾、三亚湾、蜈支洲岛、大东海、天涯海角、海棠湾等景点更受驴友的喜爱。

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1472527.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

PyCharm中如何将某个文件设置为默认运行文件

之前在使用JetBrain公司的另一款软件IDEA的时候,如果在选中static main函数后按键altenter可以默认以后运行Main类的main函数。最近在使用PyCharm学习Python,既然同为一家公司的产品而且二者的风格如此之像,所以我怀疑PyCharm中肯定也有类似的…

获取VC账号,是成为亚马逊供应商的全面准备与必要条件

成为亚马逊的供应商,拥有VC(Vendor Central)账号,是众多制造商和品牌所有者的共同目标。这不仅代表了亚马逊对供应商的高度认可,也意味着获得了更多的销售机会和更广阔的市场前景。 全面准备与必要条件是获取VC账号的关…

中科院分区表中被“On Hold”的TOP期刊!爱思唯尔会对中国学者下手吗?

关注GZH【欧亚科睿学术】,GET完整版2023JCR分区列表! ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ 目前,共37本期刊被科睿唯安标记为“On Hold”状态,其中包含5本中科院TOP期刊,主要来自Elsevier出版社旗下。…

简单配置VScode轻量级C++竞赛环境

1. 安装拓展 Chinese是中文,需要重启才可以运行,C/C拓展只是进行语法代码提示,不需要进行任何配置修改,默认即可。 2. 创建文件 如上图创建好各级文件夹,其中C是工作文件夹,.vscode是配置文件夹&#xff0…

前端根据目录生成模块化路由routes

根据约定大于配置的逻辑,如果目录结构约定俗成,前端是可以根据目录结构动态生成路由所需要的 route 结构的,这个过程是要在编译时 进行,生成需要的代码,保证运行时的代码正确即可 主流的打包工具都有对应的方法读取文…

Renderless 思想正在影响前端开发

本文由前端小伙伴方长_beezen 原创。欢迎大家踊跃投稿。 原文链接:https://juejin.cn/post/7385752495535472655 前言 截止到 2024 年,跨端应用开发所需要考虑的兼容性,已经涵盖了框架、平台和设备类型等多个方面,例如&#xff1…

【Matlab 路径优化】基于蚁群算法的XX市旅游景点线路优化系统

基于蚁群算法的XX市旅游景点线路优化系统 (一)客户需求: ①考虑旅游景点的空间分布、游客偏好等因素,实现了旅游线路的智能规划 ②游客选择一景点出发经过所要游览的所有景点只一次,最后回到出发点的前提下&#xf…

Jackson与Json、Json和各种Java数据类型的互相转化

jackson是什么 json是最常用的数据交换格式 Jackson是最流行的Json库 首先对于这种JSON序列化的库其实有非常多,比如我们熟悉的Gson,Fastjson等等,当然技术没有完全的好坏,但是从使用情况和社区生态等方面综合看来,Ja…

【饼图交通方式】用ECharts的graphic配置打造个性化

利用ECharts的graphic配置打造个性化图表 内容概要 ECharts是一款强大的数据可视化工具,它提供了丰富的配置选项来定制图表。本文将重点介绍graphic配置的使用,展示如何通过在饼图中添加个性化的图形元素,例如中心图像,来增强图…

房屋租赁管理小程序的设计

管理员账户功能包括:系统首页,个人中心,用户管理,中介管理,房屋信息管理,房屋类型管理,租房订单管理,租房信息管理 微信端账号功能包括:系统首页,房屋信息&a…

05-《猪笼草》

猪笼草 猪笼草是猪笼草属全体物种的总称。属于热带食虫植物,原产地主要为旧大陆热带地区。其拥有一个独特的吸取营养的器官——捕虫笼,捕虫笼呈圆筒形,下半部稍膨大,笼口上具有盖子,因其形状像猪笼而得名。 猪笼草 形…

快手矩阵系统源码:技术优势解析

在短视频和直播行业迅猛发展的今天,快手凭借其强大的矩阵系统源码,为用户提供了多端管理、多账号管理、素材管理、视频批量上传、AI视频制作和定时发布等一系列高效功能。本文将深入探讨快手矩阵系统源码的多项优势,以及这些功能如何助力内容…

【FreeRTOS】同步互斥与通信 有缺陷的同步示例

目录 1 同步互斥与通信1.1 同步互斥与通信概述1.2 同步与互斥的概念1.3 同步的例子:有缺陷1.4 freertos.c源码3. 互斥的例子:有缺陷4. 通信的例子:有缺陷5. FreeRTOS的解决方案 1 同步互斥与通信 1.1 同步互斥与通信概述 参考《FreeRTOS入门…

ESP32CAM物联网教学08

ESP32CAM物联网教学08 本地网页控制小车 小智制作的物联网小车,在与云台监控摄像头的PK中,一路攻城掠地、勇往直前。突然有一天,他觉得似乎忘了最开始时的初衷,忘了一路走来的首发站:这个不就是一辆遥控车吗?我能不能就做一辆快乐的、纯粹的遥控车。 CameraWebServer转换…

揭秘数据之美:【Seaborn】在现代【数学建模】中的革命性应用

目录 已知数据集 tips 生成数据集并保存为CSV文件 数据预览: 导入和预览数据 步骤1:绘制散点图(Scatter Plot) 步骤2:添加回归线(Regression Analysis) 步骤3:分类变量分析&…

深度学习——深度学习中感受野的计算

感受野 在卷积神经网络(CNN)中,感受野(Receptive Field) 是一个非常重要的概念。它描述了网络中某一层的输出(通常是特征图上的一个像素点)所对应的输入图像上的空间范围。这个范围代表了该输出…

更新GCC版本问题处理(Could not resolve host: mirrorlist.centos.org;)更换SCL配置源/SCL后yum使用不了

SCL: 在 Linux 系统中,更新 GCC(GNU Compiler Collection)编译器需要使用 Software Collections (SCL) 库的原因主要有以下几点: https://wiki.centos.org/AdditionalResources/Repositories/SCLhttps://wiki.centos…

【C++】 解决 C++ 语言报错:未定义行为(Undefined Behavior)

文章目录 引言 未定义行为(Undefined Behavior, UB)是 C 编程中非常危险且难以调试的错误之一。未定义行为发生时,程序可能表现出不可预测的行为,导致程序崩溃、安全漏洞甚至硬件损坏。本文将深入探讨未定义行为的成因、检测方法…

【LLM大模型】LangChain从到入门到实战

1.概述 最近,在研究LangChain时,发现一些比较有意思的点,今天笔者将给大家分享关于LangChain的一些内容。 2.内容 2.1 什么是LangChain? LangChain是一项旨在赋能开发人员利用语言模型构建端到端应用程序的强大框架。它的设计…