【二等奖论文】2024年华为杯研赛D题成品论文(后续会更新)

您的点赞收藏是我继续更新的最大动力!

一定要点击如下的卡片,那是获取资料的入口!

点击链接获取【2024华为杯研赛资料汇总】:

https://qm.qq.com/q/jTIeGzwkScicon-default.png?t=O83Ahttps://qm.qq.com/q/jTIeGzwkSc

题 目:   ­­­­大数据驱动的地理综合问题       

摘 要:

地理系统是自然、人文多要素综合作用的复杂巨系统,地理学家常用地理综合的方式对地理系统进行主导特征的表达,本文利用大数据的手段对地理系统进行综合,探索全球气候变化下中国地理环境的演化。

针对问题一,本文首先对数据进行清洗,替换一些取值较大或较小的特殊值,并利用

准则确定一些离群点,然后使用数字、图表等方式,对原始数据进行定量总结、概括,得出了一些降水量、土地利用/土地覆被面积两个变量的在1990至2020年间中国范围内的时空演化特征。

针对问题二,首先利用逻辑回归模型量化地形-气候相互作用在极端天气形成过程中的作用,再用格兰杰因果检验和斯皮尔曼相关系数加以检验,确定它们之间的相互作用,验证了本文模型建立的有效性,为后文预测的准确性奠定基础。

针对问题三,首先对题目中提到的自变量进行量化,建立逻辑回归模型,再利用移动平均线模型和LSTM神经网络进行预测,将预测的数据代入前面建立的逻辑回归模型进行降水量的预测,利用不同的成灾临界值可确定不同的防范政策。若需要推广至多分类问题,为不同地区制定不同政策,也即对全国所有城市分类出应对暴雨灾害能力最为脆弱、较为脆弱、一般、不脆弱等类的话,只需将本文中的成灾临界值调为阶梯型的函数即可,增强模型的泛化能力。

针对问题四,将数据集3的降水量、数据集5的人口数量、数据集6的GDP数据作为中国土地利用变化的影响因素,重复问题一的描述性统计,与问题二、三的建模进行分析,描述中国土地利用变化的特征与结构,并从准确性和有用性两个方面总结解释本文所建立的模型与获得的结果。

关键词:逻辑回归;LSTM;大数据可视化;格兰杰因果检验;斯皮尔曼相关系数

一、问题重述

    1. 问题背景

地理系统是自然、人文多要素综合作用的复杂巨系统,地理学家常用地理综合的方式对地理系统进行主导特征的表达。如以三大阶梯概括中国的地形特征,以秦岭—淮河一线和其它地理区划的方式揭示中国气温、降水、植被、土壤及生态环境在水平和垂直方向上的地带性与非地带性规律,利用胡焕庸线、T型开发结构等描绘我国人口、社会和经济发展的总体格局。这些方法早期以宏观结构和定性分析为主体,对我国生态保护、社会经济发展和国家安全保障起到了巨大的支撑作用。伴随着对地观测体系的快速发展,当前已经积累了巨量的对地观测数据。如何利用大数据的手段对地理系统进行综合,探索全球气候变化下中国地理环境的演化,是当前地球科学研究的关键问题。

    1. 问题回顾

问题1:在众多描述地理环境的变量中,一些简单的指标背后蕴藏了深厚的内涵,对人类的生存发展具有重大深远的影响,如大气中二氧化碳的浓度、全球年平均气温等。降水量是一个连续变化的变量,而土地利用/土地覆被类型则是一个存在突变和离散分布的变量。同时,它们都具有时空分布不均匀的特征。请从附件数据中选取相关数据集,为这两个变量分别构建一套描述性统计方法,用1到3个较为简洁的统计指标或统计图表,对这两个变量在1990~2020年间中国范围内的时空演化特征进行描述和总结。

问题2:近年来,以暴雨为代表的极端天气事件对人类的生产生活造成了越来越难以忽视的影响。请结合附件中所给的数据,建立数学模型,说明地形-气候相互作用在极端天气形成过程中的作用。

问题3:降雨、地形和土地利用对于暴雨等极端天气灾害的形成都具有不可忽视的影响。这其中,降雨的时空变异性和不可控性都最强;土地利用作为自然条件和人类活动的综合结果,虽然也随时空演化,但具有一定可控性;地形是最为稳定、不易改变的因素。请考虑第2问所反映的从“暴雨”到“灾害”中上述三方面因素的角色及其交互作用,确定暴雨成灾的临界条件;并结合第1问中降雨量和土地利用/土地覆被变化的历史时空演化特征,对2025至2035年间中国境内应对暴雨灾害能力最为脆弱的地区进行预测。请以地图的形式呈现你们的预测结果。

问题4:在中国级别的尺度上,描述自然地理特征的地形可以概括为“三级阶梯”,而降水中具有标志性意义的“800mm等降水量线”则与区分我国南北方的“秦岭—淮河”一线大体重合;描述人文地理特征的人口分布及其社会经济活动总量等指标,则被由连接黑龙江黑河与云南腾冲的“胡焕庸线”清晰地划分成东密西疏的两部分。那么,对于自然地理和人文地理交汇点的土地利用/土地覆被情况,结合其在前三问中描述、估计和预测任务中的“特性”,利用地理大数据,建立相应的数学模型,对数据进行简化和综合,描述中国土地利用变化的特征与结构。从准确性和有用性两个方面解释验证你们的总结。

二、问题分析

2.1 问题一分析

针对问题一,本文首先对数据进行清洗,替换一些取值较大或较小的特殊值,然后使用数字、图表等方式,对原始数据进行定量总结、概括,得出了一些降水量、土地利用/土地覆被面积两个变量的在1990至2020年间中国范围内的时空演化特征。

2.2 问题二分析

针对问题二,首先利用逻辑回归量化地形-气候相互作用在极端天气形成过程中的作用,再用格兰杰因果检验和斯皮尔曼相关系数加以检验,确定它们之间的相互作用,验证了本文模型建立的有效性,为后文预测的准确性奠定基础。

2.3 问题三分析

针对问题三,首先对题目中提到的自变量进行量化,建立逻辑回归模型,再利用移动平均线模型和LSTM神经网络进行预测,将预测的数据代入前面建立的逻辑回归模型进行降水量的预测,利用不同的成灾临界值可确定不同的防范政策。若需要推广至多分类问题,为不同地区制定不同政策,也即对全国所有城市分类出应对暴雨灾害能力最为脆弱、较为脆弱、一般、不脆弱等类的话,只需将本文中的成灾临界值调为阶梯型的函数即可,增强模型的泛化能力。

2.3 问题四分析

针对问题四,将数据集3的降水量、数据集5的人口数量、数据集6的GDP数据作为中国土地利用变化的影响因素,重复问题一的描述性统计,与问题二、三的建模进行分析,描述中国土地利用变化的特征与结构,并从准确性和有用性两个方面总结解释本文所建立的模型与获得的结果。

三、模型假设

1、假设所有使用的气象、地形和土地利用数据都是准确和可靠的。

2、假设在研究期间内,中国的地形变化不大,可以认为是稳定的。

3、假设在未来预测期间,现有的社会经济发展趋势和政策导向将持续

4、在模型中,假设人类活动对土地利用变化的影响可以通过现有数据进行合理估计,并在模型中得到体现。

5、在分析暴雨成灾的临界条件时,假设一个地区的灾害风险主要受当地气候、地形和土地利用因素的影响,而较少受到远离地区的影响。

6、假设数据记录时不存在漏记错记的情况。

四、符号说明

符号

说明

Xtij

Logistic模型中的自变量

Ytij

Logistic模型的自变量

Ztij

Logistic模型的因变量

自变量与因变量之间的映射机制

MAPE

平均绝对百分比误差

i个序列误差

斯皮尔曼相关系数

置信水平

LSTM中的隐藏状态

Wi

LSTM中的可学习参数

σ

标准差

注:这里只列出论文各部分通用符号,个别模型单独使用的符号在首次引用时会进行说明。

五、模型建立与求解

5.1 数据清洗

对于数据集3,数据集中将中国以外的经纬度上的降水量数据均设为了-99.9,在后续数据处理中,因问题一中需要建立统计指标与统计图表,将-99.9设为0,防止这些数据对一些边界地区的降水量指标造成影响。对于人口、GDP等数据的处理方式相同,将其中的-NAN或NAN替换为0.

图1 数据集3中取某一天的降水量的可视化

利用Python进行编程将负值设为0,并进行可视化后的结果可见图2。将NetCDF文件中的数据daily precipitation也即pre的数据取出转化为矩阵的形式,利用

准则对异常数据进行分析,此时并不进行剔除,在问题二和三中对“暴雨”和“成灾”界定后再进行剔除。于此同时,对于其他数据集的如GDP、人口、地形、气温,土地利用和覆盖,以每一年为一个样本,利用

准则对异常数据进行分析并剔除。

图2 处理后的数据集3的降水量可视化

5.2 问题一模型的建立与求解

5.2.1 问题一模型的建立与求解

首先对这降水量在1990至2020年间中国范围内的时空演化特征进行描述和总结,首先固定空间分析该变量随时间变化的趋势,

图3

图4

从波动来看最大值与最小值的差距并不是特别明显,每年基本上都维持在当地的一个平均水平上。但从月降水量的波动来看,全国的月降水量明显呈现出季节趋势,存在着明显的波峰与波谷。(为降重考虑,大家可以自行补充语

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/147516.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

一劳永逸:用脚本实现夸克网盘内容自动更新

系统环境:debian/ubuntu 、 安装了python3 原作者项目:https://github.com/Cp0204/quark-auto-save 感谢 缘起 我喜欢看电影追剧,会经常转存一些资源到夸克网盘,电影还好,如果是电视剧,麻烦就来了。 对于一…

深度学习-卷积神经网络(CNN)

文章目录 一、网络构造1. 卷积层(Convolutional Layer)(1)卷积(2)特征图计算公式(3)三通道卷积 2. 激活函数(Activation Function)3. 池化层(Pool…

【JUC并发编程系列】深入理解Java并发机制:线程局部变量的奥秘与最佳实践(五、ThreadLocal原理、对象之间的引用)

文章目录 【JUC并发编程系列】深入理解Java并发机制:线程局部变量的奥秘与最佳实践(五、ThreadLocal原理、对象之间的引用)1. 基本 API 介绍2. 简单用法3. 应用场景4. Threadlocal与Synchronized区别5. 内存溢出和内存泄漏5.2 内存溢出 (Memory Overflow)5.2 内存泄…

全栈项目小组【算法赛】题目及解题

题目:全栈项目小组【算法赛】 题目: 解题思路 1.遍历简历信息:我们需要读取所有简历,根据期望薪资和岗位类型进行分类和统计。 2.分类统计:使用哈希表来存储每个薪资下的前端(F)和后端&#…

【线程】线程的同步

本文重点:理解条件变量和生产者消费者模型 同步是在保证数据安全的情况下,让我们的线程访问资源具有一定的顺序性 条件变量cond 当一个线程互斥地访问某个变量时,它可能发现在其它线程改变状态之前,它什么也做不了,…

window系统DockerDesktop 部署windows容器

目录 参考文献1、安装Docker Desktop1.1 下载安装包1.2 安装教程1.3 异常解决 2、安装windows容器2.1 先启动DockerDesktop 软件界面2.2 检查docker版本2.3 拉取windows镜像 参考文献 windows容器docker中文官网 Docker: windows下跑windows镜像 1、安装Docker Desktop 1.1 …

SSM框架VUE电影售票管理系统开发mysql数据库redis设计java编程计算机网页源码maven项目

一、源码特点 smm VUE电影售票管理系统是一套完善的完整信息管理类型系统,结合SSM框架和VUE、redis完成本系统,对理解vue java编程开发语言有帮助系统采用ssm框架(MVC模式开发),系 统具有完整的源代码和数据库&#…

【C语言零基础入门篇 - 17】:排序算法

文章目录 排序算法排序的基本概念冒泡排序选择排序插入排序 排序算法 排序的基本概念 1、什么是排序? 排序是指把一组数据以某种关系(递增或递减)按顺序排列起来的一种算法。 例如:数列 8、3、5、6、2、9、1、0、4、7 递增排序…

深入浅出:Eclipse 中配置 Maven 与 Spark 应用开发全指南

Spark 安装配置 1.在 Eclipse 中配置 Maven Eclipse 中默认自带 Maven 插件,但是自带的 Maven 插件不能修改本地仓库,所 以通常我们不使用自带的 Maven ,而是使用自己安装的,在 Eclipse 中配置 Maven 的 步骤如下:…

Nature Electronics |无感佩戴的纤维基电子皮肤(柔性半导体器件/柔性健康监测/电子皮肤/柔性传感/纤维器件)

英国剑桥大学Yan Yan Shery Huang课题组,在《Nature Electronics 》上发布了一篇题为“Imperceptible augmentation of living systems with organic bioelectronic fibres”的论文,第一作者为王文宇博士(Wenyu Wang),论文内容如下: 一、 摘要 利用电子技术对人类皮肤和…

0-PCIE串行高速接口架构介绍

随着计算机技术日新月异的发展,对于I/O传输速率的需求愈发提高,PCI总线由于是并行传输,在时钟频率提高之后会带来信号偏移和串扰的问题从而使信号衰减失真,同时在数据传输速率不断提高之后PCI总线还面临着管脚限制,传输…

哈电集团数智化转型新突破:浪潮信息SAP HANA驱动数智升级

浪潮信息SAP HANA一体化解决方案,鼎力推动哈尔滨电气集团有限公司(哈电集团)取得了数字化转型的非凡成就。该定制化方案不仅促使哈电集团业财一体化程度显著跃升,突破70%大关,更确保了库存管理的绝对精准,库…

【C++前缀和 排序】2171. 拿出最少数目的魔法豆|1748

本文涉及的基础知识点 C算法:前缀和、前缀乘积、前缀异或的原理、源码及测试用例 包括课程视频 LeetCode2171. 拿出最少数目的魔法豆 难度分:1748 给定一个 正整数 数组 beans ,其中每个整数表示一个袋子里装的魔法豆的数目。 请你从每个袋…

Vue3实现类ChatGPT聊天式流式输出(vue-sse实现)

1. 效果展示 流式输出 直接输出 2. 核心代码 找了一些示例与AI生成的代码,或多或少有些问题,搞了好久,郁闷~,在此记录下 2.1 依赖安装 npm install vue-sse2.2 改写main.ts import VueSSE from vue-sseconst app Vue.cre…

饲料颗粒机全套设备有哪些机器组成

饲料颗粒机全套设备通常包括原料粉碎、混合机、制粒机、冷却器、筛分机、包装机以及配套的电气控制等多个部分组成:1、粉碎机:将各种饲料原料进行清理、去杂、破碎等预处理,确保原料的纯净度和适宜粒度,为后续加工做准备。2、混合…

撤销与恢复的奥秘:设计模式之备忘录模式详解

备忘录模式 🎯 备忘录模式(Memento Pattern)简介 备忘录模式 是一种行为型设计模式,用于保存对象的某一时刻状态,以便稍后可以恢复到该状态,而不破坏对象的封装性。备忘录模式将对象的状态封装在一个独立的…

240922-Conda的在线下载与离线安装

A. 修改路径(如果需要) 在 conda 中无法直接通过命令指定下载路径。默认情况下,conda 将软件包下载到其缓存目录中,具体位置通常是 ~/miniconda/pkgs 或 ~/anaconda/pkgs,取决于你安装 conda 的路径。 如果你希望将下…

【机器学习】ROC曲线

【机器学习】ROC曲线 1、ROC曲线简介2、ROC曲线和AUC值2.1 ROC曲线2.2 AUC值 3、实验内容3.1 准备数据集3.2 特征提取3.3 数据集划分3.4 模型训练与预测3.5 计算和绘制ROC曲线3.6 绘制混淆矩阵3.7 三分类混淆矩阵 4 源代码4.1 实现ROC二分类4.2 三分类混淆例子 1、ROC曲线简介 …

Qt 注册表操作

一.操作环境 二.注册表查看 1. 搜索注册表打开 2. 注册表查看 例如我想操作 计算机\HKEY_CURRENT_USER\SOFTWARE\winzq\qwert下的内容 三.代码 1. H文件 #ifndef __REGISTER_H__ #define __REGISTER_H__#include <QString> #include <QSettings> #include <Q…

Kotlin 类和属性(五)

导读大纲 1.1 封装行为和数据: 类和属性1.1.1 将数据与类关联并使其可被访问: 属性1.1.2 计算属性,而不是存储其值: 自定义访问器1.1.3 Kotlin 源代码目录和包 1.1 封装行为和数据: 类和属性 与其他面向对象编程语言一样,Kotlin 也提供类的抽象 Kotlin 在这方面的概念您一定不…