【 2023华为杯C题】大规模创新类竞赛评审方案研究(思路、代码......)

目录

1 题目概述

2 问题

3 极差的定义及标准分的计算方法

4 题目及数据下载

5 思路、代码下载......


1 题目概述

现在创新类竞赛很多,其中规模较大的竞赛,一般采用两阶段(网评、现场评审)或三阶段(网评、现场评审和答辩)评审。创新类竞赛的特点是没有标准答案,需要评审专家根据命题人(组)提出的评审框架(建议)独立评审。所以,对同一份作品,不同评委的评分可能存在较大差异。事实上,当竞赛规模大,评委的人数众多时,极差(定义见附件1)大的问题更为突出。显然,简单地依据多位评委评分的总和进行排序并不是创新类竞赛评审的好方案。因此,探讨大规模创新类竞赛评审方案的公正性、公平性和科学性具有深远意义。

目前,各项创新类竞赛都在摸索、调整自己的评审方案。现有方案包括:(1)对每位评审专家的评分进行标准化(公式见附件1),按作品将标准分相加得每件作品总分,然后依总分排序;(2)去掉同一份作品得分中的最高分、最低分,再将剩余评分相加,最后依总分排序;(3)同一份作品如果专家的评分差异(极差)较大,组织相关专家协商调整,将调整后得分相加,再依总分排序;(4)当竞赛规模很大时,首先利用上述方案(1)或(2)或(3)对作品进行初选,再对初选入围的作品组织专家评审(第二阶段评审)或经过答辩等环节确定获奖名单。这些方案都有一定的合理性,但也有局限性。特别是针对大规模创新类竞赛评审,现有方案偏简单,研究不多。

在大规模创新类竞赛中,增加评审每份作品的专家人数,显然有利于评审工作的公正、公平。然而,由于种种原因,参与评审工作的专家数目是受限的。评审专家少了,评审工作的误差会变大。不过,考虑到大规模创新类竞赛获奖比例通常小于50%,有些误差并不影响是否获奖。因此,在不影响获奖等级的前提下,为了适应评审专家人数较少的现状,不少竞赛采用两阶段评审办法。

为探索大规模创新类竞赛评审的好方法,附件给出模拟大规模创新类竞赛的数据。其包含两阶段评审,第一阶段由五位专家对作品评审,取标准分后,将五位专家的标准分取均值后排序,按事先约定的比例取排名在前的作品,进入第二阶段评审。第二阶段由三位专家对作品评审,分别取标准分,并对少数极差大作品的标准分进行必要的调整后,再将第一阶段五位专家评审标准分的均值、第二阶段三位专家的评审标准分共4份成绩求和,依最终总成绩再排序。请利用这批数据建立数学模型,探讨建立更为合理、公平的评审方案。

2 问题

问题一 在每个评审阶段,作品通常都是随机分发的,每份作品需要多位评委独立评审。为了增加不同评审专家所给成绩之间的可比性,不同专家评审的作品集合之间应有一些交集。但有的交集大了,则必然有交集小了,则可比性变弱。请针对3000支参赛队和125位评审专家,每份作品由5位专家评审的情况,建立数学模型确定最优的“交叉分发”方案,并讨论该方案的有关指标(自己定义)和实施细节。

问题二 在评审中采用标准分(附件1)为基础的排序方法,其假设是不同评审专家评审的作品集合的学术水平分布相同。但在大规模创新类竞赛评审中,通常任意两位专家评审的作品只有小部分是共同的,绝大多数作品是不同的(见问题一),而且每位专家只看到作品集合的很小部分,因此标准分评审方案的假设可能不成立,需要探索新的评审方案。请选择两种或两种以上现有或自己设计的评审方案和题目附件数据,分析每位专家、每份作品原始成绩、调整之后(如取标准分)成绩的分布特点,按不同方案进行排序,并设法比较这些方案的优劣。进而针对大规模创新类竞赛的评审,设计新的标准分(公式)计算模型。另外,一般认为经多位专家协商一致的获奖论文具有最大的可信度,附件2提供的数据1,其第二评审阶段评选出的一等奖作品排序是经专家协商取得一致的,请利用这批数据,改进你们的标准分计算模型。

问题三 “创新类”大赛的特点是“创新性”,即没有标准答案。由于这类竞赛的问题难度较大,一般需要通过创新才能在竞赛期间部分解决。而作品的创新到了什么程度,后续研究的前景如何,很难有一致看法,即使专家面对面的交流,都可能由于各持己见而无法统一。加上研究生的论文表达不到位,评审专家的视角不同,同一份作品的几位专家给出的成绩会有较大的差异(极差)。极差大是大规模创新类竞赛的特点,极差比较大的作品一般处于高分段或低分段。低分段属于淘汰范围,低分段极差大的原因是有专家对违规作品或有重大失误的作品给了很低的分数,或评审专家都认同该作品质量不高,只是其中某位(些)专家更不认同该作品。故这里极差虽大,但属于不获奖范畴,一般不需要调整极差。而高分段作品还要参加权威性较高的第二阶段评审(附件数据表格同一行代表同一个作品在两个阶段的成绩,没有第二阶段评审成绩的作品只参加了第一阶段的评审)。第二阶段评审仍然存在部分极差大的作品,因为是终审,误差可能影响获奖等级,因此对部分极差大的作品,需要复议调整极差(附件的数据中有记录,复议分就是该专家最后给的标准分,用来替换原来的标准分)。第二阶段(注意两个阶段每份作品评审专家人数不同)专家调整“大极差”的规律可以作为建立极差模型的借鉴。  

请根据题目所给的模拟数据2.1和2.2,讨论两阶段的成绩整体的变化和两阶段极差整体的变化,分析两阶段评审方案相比不分阶段评审方案的优劣。注意到极差大和创新性强两大特点之间会有一定的关系,为了发掘创新论文,请建立“极差”模型(含分析、分类、调整等),并针对所给数据,尝试给出第一评审阶段程序化(不需要人工干预)处理非高且非低分段作品的 “大极差”的办法。

问题四 对“创新类”竞赛,给出一个完整的评审模型(提示:例如优化模型),并针对所给的数据研究如何求解?也可对现行的评审方案给出改进的具体建议(包括未来还要收集哪些数据)。

附件:

  1. 极差的定义及标准分的计算方法

    2. 数据1:模拟某大型创新类竞赛的评审数据,其第二阶段被评选为一等奖作品的排序经专家协商取得一致。

    3. 数据2: 模拟某大型创新类竞赛两阶段的评审数据,有两组2.1和2.2。

3 极差的定义及标准分的计算方法

名词解释

极差:是指同一组(本题指同一评审阶段同一份作品的成绩集合)数据中最大值与最小值之差。

仅参加第一阶段评审作品的最终成绩为五位专家给出成绩的标准分的平均值,并据此排序。

参加两个阶段评审作品的最终成绩为第一阶段标准分的平均分加上第二阶段评审时三位专家给出三份成绩转换成三个标准分并进行必要的调整后的和,两阶段评审后按此最终成绩给参加两个阶段评审的作品排序,但始终排在仅参加第一阶段评审的作品之前。

4 题目及数据下载

链接:https://pan.baidu.com/s/1IkJPi_izXM7ZQIztu-0qHw 
提取码:bx3g 
--来自百度网盘超级会员V4的分享

5 思路、代码下载......

回复:华为杯C题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/139056.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

高效畅通的iOS平台S5配置指南

在iOS平台上,使用S5代理ip访问互联网是一种非常有用的技巧。无论是为了保证隐私安全,还是解决网络限制问题,S5代理ip都能为您提供更快、更稳定的互联网访问体验。本文将为您详细介绍如何在iOS平台上配置和使用S5代理ip,让您的网络…

git之撤销工作区的修改和版本回溯

有时候在工作区做了一些修改和代码调试不想要了,可如下做 (1)步骤1:删除目录代码,确保.git目录不能修改 (2)git log 得到相关的commit sha值 可配合git reflog 得到相要的sha值 (3)执行git reset --hard sha值,可以得到时间轴任意版本的代码 git reset --hard sha值干净的代…

【Java 基础篇】Java网络编程实战:P2P文件共享详解

Java网络编程是现代软件开发中不可或缺的一部分,因为它允许不同计算机之间的数据传输和通信。在本篇博客中,我们将深入探讨Java中的P2P文件共享,包括什么是P2P文件共享、如何实现它以及一些相关的重要概念。 什么是P2P文件共享? …

23个销量最高的3D扫描仪【2023】

如果你可以 3D 扫描它,你就可以 3D 打印它。 市场上 3D 扫描仪的种类和质量非常丰富,机器尺寸、功能和价格各异。 这样的选择虽然本身是一件很棒的事情,但也会让从无用的东西中挑选出宝石成为一件苦差事。 推荐:用 NSDT编辑器 快速…

HTTP各版本差异

HTTP1.0 无法复用连接 HTTP1.0为每个请求单独新开一个TCP连接 #mermaid-svg-9N3exXRS4VvT4bWF {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-9N3exXRS4VvT4bWF .error-icon{fill:#552222;}#mermaid-svg-9N3exXRS…

Reinforcement Learning(二)--on-policy和off-policy

1.前言 强化学习(Reinforcement learning,RL)是机器学习的一个分析,特点是概念多、公式多、入门门槛高🥲(别问我怎么知道的)。本篇文章着重讲解RL最重要的概念之一,即on-policy和of…

2023工博会强势回归!智微工业携八大系列重磅亮相

中国国际工业博览会(简称"中国工博会")自1999年创办以来,历经二十余年发展创新,通过专业化、市场化、国际化、品牌化运作,已发展成为通过国际展览业协会(UFI)认证、中国工业领域规模最…

mybatis/mp批量插入非自增主键数据

文章目录 前言一、mp的批量插入是假的二、真正的批量插入1.利用sql注入器处理2.采用自编码,编写xml批量执行生成内容如下: 三 问题问题描述问题原因问题解决粘贴一份,兼容集合替换原有文件 总结自增与非自增区别: 前言 mybatis/mp 在实际开发中是常用的优秀持久层框架,但是在非…

Linux:GlusterFS 集群

GlusterFS介绍 1)Glusterfs是一个开源的分布式文件系统,是Scale存储的核心,能够处理千数量级的客户端.在传统的解决 方案中Glusterfs能够灵活的结合物理的,虚拟的和云资源去体现高可用和企业级的性能存储. 2)Glusterfs通过TCP/IP或InfiniBand RDMA网络链…

【C++】String类基本接口介绍及模拟实现(多看英文文档)

string目录 如果你很赶时间,那么就直接看我本标题下的内容即可!! 一、STL简介 1.1什么是STL 1.2STL版本 1.3STL六大组件 1.4STL重要性 1.5如何学习STL 二、什么是string??(本质上是一个类&#xff0…

【Redis】深入探索 Redis 的数据类型 —— 列表 List

文章目录 一、List 类型介绍二、List 类型相关命令2.1 LPUSH 和 RPUSH、LPUSHX 和 RPUSHX2.2 LPOP 和 RPOP、BLPOP 和 BRPOP2.3 LRANGE、LINDEX、LINSERT、LLEN2.4 列表相关命令总结 三、List 类型内部编码3.1 压缩列表(ziplist)3.2 链表(lin…

Git错误解决:如何处理“could not determine hash algorithm“问题

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

openssl创建CA证书教程

配置生成CA证书 总示意图: (1),通过openssl创建CA证书 第一步:创建一个秘钥,这个便是CA证书的根本,之后所有的东西都来自这个秘钥 # 通过rsa算法生成2048位长度的秘钥 openssl genrsa -out myCA.key 2048 第二步&#…

Android Camera2获取摄像头的视场角(FOV)信息

一、概念 FOV(Field of View)是一个用于描述视野范围的术语。它通常用于计算设备(如摄像机、虚拟现实头显或眼睛)所能捕捉到的可见区域。 水平FOV(Horizontal FOV):描述视野在水平方向上的范围…

JVM面试题-JVM对象的创建过程、内存分配、内存布局、访问定位等问题详解

对象 内存分配的两种方式 指针碰撞 适用场合:堆内存规整(即没有内存碎片)的情况下。 原理:用过的内存全部整合到一边,没有用过的内存放在另一边,中间有一个分界指针,只需要向着没用过的内存…

【最新面试问题记录持续更新,java,kotlin,android,flutter】

最近找工作,复习了下java相关的知识。发现已经对很多概念模糊了。记录一下。部分是往年面试题重新整理,部分是自己面试遇到的问题。持续更新中~ 目录 java相关1. 面向对象设计原则2. 面向对象的特征是什么3. 重载和重写4. 基本数据类型5. 装箱和拆箱6. …

【数据结构】顺序表与ArrayList

作者主页:paper jie 的博客 本文作者:大家好,我是paper jie,感谢你阅读本文,欢迎一建三连哦。 本文录入于《JAVA数据结构》专栏,本专栏是针对于大学生,编程小白精心打造的。笔者用重金(时间和精…

Chinese-LLaMA-AIpaca

文章目录 关于 Chinese-LLaMA-Alpaca一、LLaMA模型 --> HF格式二、合并LoRA权重,生成全量模型权重方式1:单LoRA权重合并方式2:多LoRA权重合并(适用于Chinese-Alpaca-Plus )三、使用 Transformers 进行推理四、使用 webui 搭建界面1、克隆text-generation-webui并安装必…

企业图档加密系统

机械制造行业数据安全 机械制造企业对于设计工艺的能力要求非常高,其生产工业会涉及到大量设计图纸文档信息,一旦发生产品图纸丢失泄密情况,将造成重大损失。如何用技术手段保护企业的核心数据,保证企业的信息资料不会被无意或恶…

Clock Domain Crossing Design Verification Techniques Using System Verilog 学习

重要的设计考虑因素要求仔细构建多时钟设计时钟域交叉 (CDC) 边界。 本文详细介绍了一些最新策略和解决跨 CDC 边界传递一个或多个信号的最佳已知方法。论文中包含与 CDC 验证相关的技术和一个有趣的 2 深 FIFO用于在时钟域之间传递多个控制信号的设计。 虽然设计方法论文中描述…