[Python数据可视化]探讨数据可视化的实际应用:三个案例分析

        数据可视化是理解复杂数据集的重要工具,通过图形化的方法,可以直观地展示信息、趋势和模式。本文将深入探讨三个实际案例,包括健康数据分析、销售趋势分析、城市交通流量分析。每个案例将提供假设数据、详细注释的代码及分析结果。

案例 1: 健康数据分析

背景

分析城市居民的体重指数(BMI)分布,帮助公共健康部门识别潜在的健康问题。

假设数据

  • age_group: 年龄组(如 "18-25", "26-35", 等)
  • bmi: 体重指数
  • count: 每个年龄组的居民人数

代码

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns# 假设数据
data = {'age_group': ['18-25', '26-35', '36-45', '46-55', '56-65', '66+'],'bmi': [22.0, 24.5, 27.0, 28.5, 29.0, 26.5],'count': [200, 300, 250, 150, 100, 50]
}health_data = pd.DataFrame(data)# 绘制条形图
plt.figure(figsize=(10, 6))
sns.barplot(x='age_group', y='count', data=health_data, palette='Blues')
plt.title('Distribution of Residents by Age Group', fontsize=16)
plt.xlabel('Age Group', fontsize=14)
plt.ylabel('Number of Residents', fontsize=14)
plt.grid(axis='y')# 增加BMI指标
for index, row in health_data.iterrows():plt.text(index, row['count'] + 5, f"BMI: {row['bmi']}", color='black', ha='center')plt.show()

分析结果

通过条形图和BMI信息,我们可以看出,年龄较大的群体BMI普遍较高,这可能暗示他们面临更高的健康风险。公共健康部门可以针对高BMI的年龄组开展健康教育和体检活动。


案例 2: 销售数据分析

背景

分析电商平台的销售数据,以识别最佳销售季节,指导营销策略。

假设数据

  • month: 销售月份
  • sales: 销售额(单位:万元)

代码

# 假设数据
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
sales = [20, 35, 30, 40, 50, 70, 90, 100, 80, 60, 50, 30]
promotions = [1, 2, 1, 2, 3, 5, 6, 7, 4, 2, 1, 1]sales_data = pd.DataFrame({'month': months, 'sales': sales, 'promotions': promotions})# 绘制双Y轴折线图
fig, ax1 = plt.subplots(figsize=(12, 6))ax2 = ax1.twinx()
ax1.plot(sales_data['month'], sales_data['sales'], marker='o', color='orange', label='Sales')
ax2.plot(sales_data['month'], sales_data['promotions'], marker='s', color='blue', label='Promotions', linestyle='--')ax1.set_title('Monthly Sales Trends and Promotions', fontsize=16)
ax1.set_xlabel('Month', fontsize=14)
ax1.set_ylabel('Sales (in ten thousand)', fontsize=14, color='orange')
ax2.set_ylabel('Number of Promotions', fontsize=14, color='blue')ax1.tick_params(axis='y', labelcolor='orange')
ax2.tick_params(axis='y', labelcolor='blue')
ax1.grid()fig.legend(loc="upper left", bbox_to_anchor=(0.15, 0.85), bbox_transform=ax1.transAxes)
plt.xticks(rotation=45)
plt.savefig('sales.jpg')
plt.show()

分析结果

折线图展示了销售的季节性趋势。7-8月的销售额达到最高,电商可以在此时增加营销预算以提升销售。


案例 3: 城市交通流量分析

背景

分析城市主要路段的交通流量,识别高峰时段以优化交通管理。

假设数据

  • datetime: 时间(每小时记录一次)
  • road_id: 路段编号
  • vehicle_count: 车辆数量

代码

# 假设数据
date_range = pd.date_range(start='2023-01-01', periods=24, freq='h')
road_ids = [1, 2, 3]
vehicle_counts = [np.random.poisson(lam=50 + i*10, size=24) for i in road_ids]traffic_data = pd.DataFrame({'datetime': np.tile(date_range, len(road_ids)),'road_id': np.repeat(road_ids, len(date_range)),'vehicle_count': np.concatenate(vehicle_counts)
})# 绘制热力图
plt.figure(figsize=(10, 6))
# 使用 pivot 方法创建数据透视表
heatmap_data = traffic_data.pivot(index='road_id', columns='datetime', values='vehicle_count')
sns.heatmap(heatmap_data, cmap="YlGnBu", cbar_kws={'label': 'Vehicle Count'})
plt.title('Traffic Volume Heatmap', fontsize=16)
plt.xlabel('Hour of the Day', fontsize=14)  # 更新 x 轴标签
plt.ylabel('Road ID', fontsize=14)# 设置 x 轴刻度标签
plt.xticks(np.arange(0.5, heatmap_data.shape[1] + 0.5, 1), np.arange(1, heatmap_data.shape[1] + 1))plt.tight_layout()
plt.savefig('Traffic.jpg')
plt.show()

分析结果

热力图显示了不同路段在一天内的交通流量变化,高峰时段明显,交通管理部门可以根据这些数据优化信号灯时长和交通流向。


总结

以上三个案例展示了数据可视化在健康、销售、交通中的实际应用。通过直观的图形化展示,决策者能够快速理解数据背后的趋势与模式,为优化策略提供数据支持。这些示例强调了数据可视化的重要性,能够帮助各行各业做出更为明智的决策。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/147019.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【每日刷题】Day128

【每日刷题】Day128 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 606. 根据二叉树创建字符串 - 力扣(LeetCode) 2. LCR 194. 二叉树的最近公…

Spring在不同类型之间也能相互拷贝?

场景还原 日常开发中,我们会定义非常多的实体,例如VO、DTO等,在涉及实体类的相互转换时,常使用Spring提供的BeanUtils.copyProperties,该类虽好,可不能贪用。 这不在使用过程中就遇到一个大坑&#xff0c…

逻辑分析仪看波形方法

一、串口波形讲解 异步串行数据的一般格式是:起始位数据位停止位,其中起始位1 位,数据位可以是5、6、7、8位,停止位可以是1、1.5、2位。 对于正逻辑的TTL电平, a.起始位是一个值为0的位,低电平&#xff…

leetcode练习 二叉树的最大深度

给定一个二叉树 root ,返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:3提示: 树中节点的数量在 [0, 104] 区间内。-100 …

【图像检索】基于Gabor特征的图像检索,matlab实现

博主简介:matlab图像代码项目合作(扣扣:3249726188) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 本次案例是基于Gabor特征的图像检索,用matlab实现。 一、案例背景和算法介绍 这次博…

排序----快速排序(快排)(递归版)

首先讲一下单趟的思路: 在这一块数据中,记录第一个元素为key,然后设置L和R两个指针,L找比key处的元素大的,R找比key处元素小的,找到了就交换这两个位置的元素。当两个指针相遇时,若相遇点的元素…

20240921在友善之臂的NanoPC-T6开发板上确认宸芯的数传模块CX6602N的AT命令

console:/dev # cat ttyUSB1 & console:/dev # echo AT > ttyUSB1 20240921在友善之臂的NanoPC-T6开发板上确认宸芯的数传模块CX6602N的AT命令 2024/9/21 21:03 【必须】Android12/Linux(Buildroot)都必须要! 4、【Android12默认打开U…

https的连接过程

根证书: 内置在操作系统和浏览器中,可手动添加,下级是中间证书或服务器证书,只有当中间证书或服务器证书关联到已存在的根证书时,中间证书或服务器证书才视为有效 中间证书: 位于根证书和服务器证书之间,他们之间也可以没有中间证书,作用是对根证书增加一个下级,方便管理,由根…

GAMES101(作业4~5)

作业四 题目: 由 4 个控制点表示的 Bzier 曲线, bezier:该函数实现绘制 Bzier 曲线的功能。它使用一个控制点序列和一个 OpenCV::Mat 对象作为输入,没有返回值。它会使 t 在 0 到 1 的范围内进 行迭代&a…

【Linux】进程地址空间和进程调度队列

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343🔥 系列专栏:https://blog.csdn.net/qinjh_/category_12625432.html 目录 问题现象 进程地址空间 进一步理解 地址空间 Linux2.6内核进程调度队列 …

RecyclerView的notifyDataSetChanged和notifyItemRemoved之间的区别

本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点 RecyclerView 提供了多种方法来通知适配器(Adapter)数据集发生变化,其中 notifyDataSetChanged() 和 notify…

数据库系统基础概述

文章目录 前言一、数据库基础概念 1.数据库系统的组成2.数据模型3.数据库的体系结构二、MySQL数据库 1.了解MySQL2.MySQL的特性3.MySQL的应用场景总结 前言 MySQL数据库是一款完全免费的产品,用户可以直接从网上下载使用,不用花费任何费用。这点对于初学…

proteus仿真学习(1)

一,创建工程 一般选择默认模式,不配置pcb文件 可以选用芯片型号也可以不选 不选则从零开始布局,没有初始最小系统。选用则有初始最小系统以及基础的main函数 本次学习使用从零开始,不配置固件 二,上手软件 1.在元件…

【AcWing】875. 快速幂

#include<iostream> using namespace std; typedef long long LL;LL qmi(int a,int b,int p){LL res1%p;//%p是为了p1的时候&#xff0c;余数是0while(b){if(b&1) resres*a%p;//位数是1的b>>1;aa*(LL)a%p;//a*a再modp是为了防止溢出}return res; }int main(){i…

【动态规划】(三)动态规划——完全背包

动态规划——完全背包 完全背包理论基础零钱兑换Ⅱ组合总和Ⅳ爬楼梯&#xff08;进阶版&#xff09;零钱兑换完全平方数单词拆分背包问题总结 完全背包理论基础 有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i]&#xff0c;得到的价值是value[i] 。每件物品…

零食店小程序发展客户转化运营

零食店、折扣店近些年市场中跑出了不少区域性、多地化的品牌&#xff0c;直营及加盟模式&#xff0c;还有各种超市、商场、街边小店等&#xff0c;零食基本没有年龄群体限制&#xff0c;又属于常消费品&#xff0c;线上线下生意都可以进行发展。 线下客户到店&#xff0c;线上…

链表数据结构

链表可以解决顺序表的缺点 我们今天简单引用下链表 这边是代码讲解 头文件 #pragma once #include<stdio.h> #include<iostream> #include<string.h> #include<stdlib.h> using namespace std; typedef struct student {union {int data;int len;};s…

【计网】从零开始掌握序列化与反序列化 --- 基础知识储备与程序重构

从零开始掌握序列化与反序列化 1 初识序列化与反序列化2 再谈Tcp协议3 程序重构3.1 Socket类3.2 回调函数设计3.3 最终的Tcp服务器类 1 初识序列化与反序列化 在刚学习计算机网络时&#xff0c;我们谈到过网络协议栈&#xff0c;其中最上层的就是应用层&#xff0c;那么这个应…

Rosetta 一:手把手教你用Linux安装Rosetta(全网最简洁)

文章目录 1. Rosetta 介绍2.下载2. Rosetta 安装3. 验证安装 1. Rosetta 介绍 很久很久之前就对Rosetta有所耳闻&#xff0c;有一篇文章叫做denovo protein design&#xff0c;说的就是用rosetta来设计蛋白质。 rosetta是david baker团队设计的软件&#xff0c;早期只是一个蛋…

【Godot4.3】胶囊形的偏移获取法

概述 之前用半圆弧拼接的方式求过胶囊形&#xff0c;在逐渐熟练使用Geometry2D的过程中&#xff0c;发现通过线段求端点是圆角类型的偏移多边形&#xff0c;获得的就是胶囊形。 所以我们有了第二种胶囊形求法。 测试代码 tool extends Node2D## 横向宽度 export var width:…