【二等奖论文】2024年华为杯研赛C题54页成品论文（后续会更新）

您的点赞收藏是我继续更新的最大动力！

一定要点击如下的卡片，那是获取论文的入口！

点击链接获取【2024华为杯研赛资料汇总】：https://qm.qq.com/q/Nr0POlQGc2https://qm.qq.com/q/Nr0POlQGc2

摘要：

随着国民经济发展和社会进步，基于电力电子技术的电能变换（得到迅速发展，尤其是新能源和信息通讯领域。本文将基于数据驱动下磁性元件的磁芯损耗建模。

针对问题一，基于实验数据，提取反映磁通密度分布和波形特征的变量，进而对三种波形（正弦波、三角波、梯形波）进行分类。通过提取磁通密度随时间变化的特征量，建立了一个特征提取机制。随后，采用随机森林分类器作为模型，对这些特征进行分类建模。训练集中的数据用于拟合分类器，而测试集数据用于验证模型的效果。模型成功对三种波形进行了分类，并得到了准确的分类结果。

针对问题二，基于实验数据，修正斯坦麦茨方程，增加温度修正项，以适应不同温度条件下的损耗预测。使用实验数据，分别拟合传统斯坦麦茨方程和修正后的方程，利用最小二乘法（lsqcurvefit）对参数 k1、a、b和温度修正系数c 进行拟合。修正后的斯坦麦茨方程能够更准确地预测不同温度下的磁芯损耗。对比传统斯坦麦茨方程与修正模型，后者的预测误差显著降低，最终模型的均方误差（MSE）也得到了显著改善。

针对问题三，分析这些因素对损耗的独立及协同影响，并找到使磁芯损耗最小的最优条件。采用多元回归模型分析材料、温度、励磁波形和频率对磁芯损耗的影响，模型考虑了独立效应以及两两因素之间的交互作用。通过对不同组合的实验数据进行分析，计算出每种材料和波形在不同温度下的平均损耗。同时，利用可视化工具进一步分析这些因素的交互作用。通过回归模型的预测与分析，找到了使磁芯损耗最小的最优条件：在材料4、温度为90℃、频率为50010Hz、正弦波形下，磁芯损耗最小值。

针对问题四，在磁芯损耗预测的研究中，本文结合多种机器学习模型，包括随机森林、线性回归、梯度提升树、人工神经网络、K-最近邻回归、决策树、贝叶斯回归以及 Lasso 回归，构建了多模型集成的预测框架。首先通过模型在训练集和验证集上的表现，分别计算了各自的均方误差（MSE）和根均方误差（RMSE），然后采用加权平均法对不同模型的预测结果进行了综合。为了进一步提高预测精度，本文基于 fmincon 算法优化了各模型的加权系数，最终得到了更精确的加权预测结果。实验表明，集成模型有效融合了各模型的优势。

针对问题五，针对磁性元件优化设计中的多目标优化问题，本文在考虑磁芯损耗与传输磁能两大核心指标的基础上，提出了一种基于粒子群优化算法（PSO）的优化方案。利用随机森林模型对磁芯损耗进行预测，同时通过频率与磁通密度峰值的乘积衡量传输磁能，并引入变异系数法为两者分配权重。优化模型以最小化磁芯损耗和最大化传输磁能为目标，最终通过 PSO 寻找到最优条件（材料、温度、频率、波形及磁通密度峰值）。

关键词：磁芯损耗预测、传输磁能、随机森林、线性回归、梯度提升树、人工神经网络、KNN、决策树、贝叶斯回归、Lasso 回归、粒子群优化（PSO）、加权平均、多目标优化、变异系数法、磁性元件

一、问题重述..................................................................................................... 7

1.1 问题背景................................................................................................ 7

1.2 问题回顾................................................................................................ 7

二、问题分析..................................................................................................... 8

2.1 数据分析................................................................................................ 8

2.2 问题一分析............................................................................................ 8

2.3 问题二分析............................................................................................ 9

2.4 问题三分析............................................................................................ 9

2.5 问题四分析............................................................................................ 9

2.6 问题五分析.......................................................................................... 10

三、模型假设................................................................................................... 10

四、符号说明.................................................................................................... 11

五、模型的建立与求解................................................................................... 12

5.1 数据预处理.......................................................................................... 12

5.1.1 数据清洗................................................................................... 12

5.1.2 数据转码................................................................................... 14

5.1.3 数据描述性分析....................................................................... 15

5.2 问题一模型的建立与求解.................................................................. 16

5.2.1 分类模型的建立....................................................................... 16

5.2.2 分类结果................................................................................... 20

5.3 问题二模型的建立与求解.................................................................. 23

5.3.1 修正模型的建立....................................................................... 23

5.3.1 修正模型求解........................................................................... 25

5.4 问题三模型的建立与求解.................................................................. 26

5.4.1 回归模型的建立与求解........................................................... 26

5.4.2 交互模型的建立与求解........................................................... 28

5.4.3 极值的求解............................................................................... 31

5.5 问题四模型的建立与求解.................................................................. 31

5.5.1 数据处理................................................................................... 31

5.5.2 预测模型的选择....................................................................... 32

5.5.3 加权预测模型........................................................................... 39

5.5.4 预测结果的比对....................................................................... 43

5.6 问题五模型的建立与求解.................................................................. 44

5.6.1 优化模型的建立....................................................................... 44

5.6.2 优化模型的求解....................................................................... 45

六、模型总结................................................................................................... 51

6.1 模型优点.............................................................................................. 51

6.2 模型缺点.............................................................................................. 51

6.3 模型推广.............................................................................................. 52

七、参考文献................................................................................................... 53

八、附录........................................................................................................... 54

问题重述
1. 问题背景

在现代电力电子和变压器设计中，磁性元件是确保能量高效传递和系统稳定运行的核心组件之一。磁芯作为磁性元件的主要构成部分，其损耗特性直接影响系统的效率和寿命。磁芯损耗是指当磁芯材料暴露在变化的磁场中时，能量被以热的形式消耗掉的现象。这一现象主要由三部分构成：磁滞损耗、涡流损耗以及剩余损耗。随着技术的进步，电力电子设备对高效率、低损耗的需求日益增强，因此深入研究和理解磁芯损耗的机制对于设计和优化这些设备至关重要。

影响磁芯损耗的因素复杂多样，其中频率、磁通密度和温度被广泛认为是最关键的物理量。然而，在实际应用中，磁芯损耗并不仅仅受到这些物理参数的影响，还与励磁波形的形状、磁芯材料的特性及其工作温度息息相关。传统的损耗计算模型（如斯坦麦茨方程，SE）虽然在特定条件下（如正弦波形）表现良好，但在面对复杂工作环境（如非正弦波形和多种材料）时，往往出现较大误差。因此，修正和扩展这些经典损耗模型，使其能够适应更多实际工况，是学术界和工业界广泛关注的问题之一。

在此背景下，本次研究围绕三个核心问题展开：首先是励磁波形的分类。不同的励磁波形（如正弦波、三角波、梯形波）对磁芯的损耗机制影响各异。准确识别和分类这些波形有助于进一步分析其损耗特性。其次是斯坦麦茨方程的修正。该方程作为经典的磁芯损耗计算模型，在正弦波形下被广泛使用，但忽略了温度对磁芯损耗的影响。由于温度变化在实际应用中难以避免，因此将温度因素引入模型并进行修正可以显著提高损耗预测的准确性。最后是磁芯损耗因素分析，即分析温度、波形、磁芯材料等因素如何单独或协同影响磁芯损耗，并探索最优工作条件以最小化损耗。

1. 问题回顾

问题一：励磁波形分类

励磁波形对磁芯的损耗特性有显著影响，波形的不同形态直接塑造了磁芯内部磁通的动态行为，进而导致磁芯的损耗特性发生变化。因此，准确分类不同的励磁波形对于深入理解磁芯损耗机制以及优化磁芯设计具有重要意义。本问题要求对实验数据中的磁通密度随时间变化的数据进行分析，提取相关特征变量，通过这些变量构建分类模型，识别出三种不同的励磁波形（正弦波、三角波、梯形波）。最终模型的分类结果需填入Excel表格，并对特定样本进行分类统计。

问题二：斯坦麦茨方程（Steinmetz Equation）修正

斯坦麦茨方程是传统磁芯损耗计算模型，但它的适用范围主要局限于正弦波形，对于不同材料和温度变化时会产生较大误差。因此，本问题需要在分析传统斯坦麦茨方程的基础上，针对温度对磁芯损耗的影响进行修正，构造一个适用于不同温度条件下的修正模型。通过对实验数据的分析，拟合出包含温度因素的修正方程，并与原始斯坦麦茨方程进行对比，评估两者在损耗预测方面的效果和误差差异。

问题三：磁芯损耗因素分析

磁芯损耗是衡量磁性元件性能的重要指标之一，温度、励磁波形和磁芯材料是影响损耗的三大主要因素。本问题通过数据分析技术，深入研究这三者对磁芯损耗的独立影响以及它们两两之间的协同作用。通过对实验数据进行回归分析，建立温度、励磁波形和材料的损耗影响模型，探索实现最低损耗的最优工作条件。最终的结果需要给出在不同组合下，磁芯损耗的最小值和相应的条件。

问题四：基于数据驱动的磁芯损耗预测模型

传统的磁芯损耗模型在不同工况和材料下的预测精度往往有限，为了弥补这一不足，本问题旨在通过数据驱动的方式构建一个能够广泛适用于不同材料和工况的高精度磁芯损耗预测模型。利用实验数据，构建回归模型或机器学习模型，分析模型的预测精度和泛化能力，并预测给定样本的磁芯损耗。最终的预测结果需要填入Excel表格，并展示特定样本的预测损耗值。该模型不仅有助于提升磁性元件设计的精度，还为工程实践提供了有力的参考依据。

问题五：磁性元件的最优化条件

磁芯损耗是评价磁性元件性能的重要指标之一，但为了实现磁性元件的整体性能优化，必须综合考虑其他指标，如传输磁能。传输磁能可以通过频率与磁通密度峰值的乘积进行衡量。本问题基于问题四中构建的磁芯损耗预测模型，同时考虑传输磁能，通过优化模型分析温度、频率、波形、磁通密度峰值以及磁芯材料的组合条件，找到在损耗最小和传输磁能最大的工作条件。最终给出该最优条件下的磁芯损耗与传输磁能的具体值。

问题分析

2.1 数据分析

缺失值处理：对数据进行初步检查，若数据集中存在缺失值，采用适当的填补方法，如使用均值或中位数进行填充，或删除缺失较多的样本，确保数据完整性。分类变量处理：数据中包含多个分类变量（如材料、励磁波形），这些变量需要转换为计算机可识别的分类变量格式（如使用 MATLAB 中的 categorical 函数），以便后续的建模和分析。特征提取：对于磁通密度数据（包含1024个采样点），通过提取关键特征（如均值、标准差、峰值和峰值位置）将复杂的波形数据转化为有限维度的特征数据，便于后续分类模型的处理。

2.2 问题一分析

磁芯的损耗特性受到励磁波形形态的显著影响，三种不同的励磁波形（正弦波、三角波、梯形波）将导致磁芯内部磁通的不同变化模式，进而影响其损耗。因此，准确识别和分类励磁波形对于深入理解磁芯损耗机制至关重要。根据附件一中的磁通密度数据，首先分析不同波形的磁通密度分布规律和形状特征。通过提取波形的特征变量（如均值、标准差、峰值、峰值位置、上升/下降速率等），将复杂的波形数据转化为有限的特征数据，便于模型处理。

利用提取的特征变量，选择合适的分类算法对三种波形进行分类。随机森林分类器或支持向量机（SVM）等常见的分类算法都可以应用于此。训练集用于拟合模型，测试集用于评估模型的性能。分类模型的合理性和有效性分析：训练分类模型后，使用测试集对其进行验证，计算分类准确率、精度、召回率等指标，确保模型在识别三种励磁波形时具有较高的准确性。根据模型的分类结果，对附件二中的样本进行波形识别，分类结果填入附件四中的相应列中，并对特定样本的结果进行汇总和统计。

2.3 问题二分析

斯坦麦茨方程广泛应用于磁芯损耗的预测，但其主要适用于正弦波形的损耗计算，且忽略了温度对损耗的影响。因此，本问题要求通过对实验数据的分析，修正斯坦麦茨方程，使其适应不同温度下的损耗预测。使用附件一中的实验数据，针对材料1的正弦波形数据，利用最小二乘法拟合参数。通过计算两种模型在不同温度下的损耗预测误差，比较修正模型和原始模型的准确性。计算均方误差（MSE），分析修正方程在预测精度上的提升。

2.4 问题三分析

磁芯损耗是衡量磁性元件性能的重要指标，温度、励磁波形和磁芯材料是影响损耗的三大主要因素。本问题通过实验数据分析，研究这三个因素如何独立及协同作用于磁芯损耗，旨在找出实现最低损耗的最优工作条件。数据分析：根据附件一中的实验数据，提取温度、励磁波形、磁芯材料和磁芯损耗等变量。针对这三大因素，建立多元回归模型，分析它们对磁芯损耗的影响。

协同作用分析：使用回归分析，分别计算温度、波形和材料的独立影响，重点分析两两之间的交互作用（如温度与材料、波形与温度、材料与波形的交互作用）。通过引入交互项，揭示这些因素如何协同影响磁芯损耗。模型求解与最优条件：利用回归模型的系数，计算在不同条件组合下的磁芯损耗，找出使损耗最小的最优条件，并对模型的合理性进行验证。

2.5 问题四分析

在电力电子设备的设计与优化中，磁芯损耗是影响系统效率和稳定性的关键因素之一。然而，由于磁芯材料特性、工作频率、温度等多个因素对磁芯损耗的复杂影响，传统的磁芯损耗模型（如斯坦麦茨方程等）在精度和适用性上存在一定的局限性。因此，本文针对传统模型的不足，利用机器学习方法构建更加准确的磁芯损耗预测模型。

具体而言，本文使用了多个经典的机器学习模型进行磁芯损耗的预测，包括随机森林、线性回归、梯度提升树（GBT）、人工神经网络（MLP）、K-最近邻（KNN）、决策树、贝叶斯回归和 Lasso 回归模型。每个模型根据输入特征（包括材料、温度、频率、励磁波形、磁通密度峰值）来预测磁芯损耗。为了提升整体的预测性能，本文通过加权平均的方式，将多种模型的预测结果进行融合，且基于验证集的表现，采用优化算法（fmincon）来寻找最优的加权系数。通过该方法，不仅可以充分利用不同模型的优势，还可以有效提高预测精度，确保结果的稳健性。

2.6 问题五分析

在磁性元件的设计中，磁芯损耗和传输磁能是两个相互制约的重要指标。虽然低损耗能够提升系统的效率，但高效的磁能传输对于实现设备的高性能运行同样至关重要。因此，在优化磁性元件的设计过程中，既要考虑如何减小磁芯损耗，又要最大化传输磁能，达到整体性能的最优。

为了解决这一多目标优化问题，本文采用了粒子群优化算法（PSO）。优化目标函数设计为在不降低磁芯损耗的前提下，最大化传输磁能（通过频率与磁通密度峰值的乘积衡量）。通过 PSO 优化算法，得到了最优的材料、温度、工作频率、励磁波形和磁通密度峰值组合，达到了磁芯损耗最小化与传输磁能最大化的平衡。分析过程中，模型的输入特征包括材料种类、温度、频率、波形和磁通密度峰值。

模型假设

为了方便模型的建立与模型的可行性，这里首先对模型提出一些假设，使得模型更加完备，预测的结果更加合理。

1、假设给出的数据均为真实数据，真实有效。

2、假设对于一些较为异常的数据的出现具有一定的合理性。

3、磁芯损耗和传输磁能的权衡：在磁性元件的设计中，磁芯损耗和传输磁能是两个关键的、且相互制约的性能指标。题目明确指出，优化设计应同时考虑磁芯损耗最小化和传输磁能最大化，意味着磁芯损耗与传输磁能之间存在相互影响，需要在二者之间寻找平衡。

4、传输磁能的定义：题目给出了简化的传输磁能定义，即通过频率与磁通密度峰值的乘积来衡量传输磁能的大小

5、磁芯材料和工作条件对损耗和传输磁能的影响：题目暗示材料种类、温度、工作频率、励磁波形、磁通密度峰值等输入参数是磁芯损耗和传输磁能的主要影响因素

6、损耗和传输磁能之间的独立性：在优化过程中，假设传输磁能和磁芯损耗之间存在一定的独立性，即在优化传输磁能时不完全依赖于磁芯损耗的变化。

符号说明

为了方便模型的建立与求解过程，这里对使用到的关键符号进行以下说明：

符号	符号说明
F(x)	总目标函数，结合磁芯损耗与传输磁能的优化目标
w1	磁芯损耗在总目标函数中的权重
w2	传输磁能在总目标函数中的权重
x	输入变量（材料、温度、频率、励磁波形、磁通密度峰值）
core_loss (x)	输入变量对应的磁芯损耗
transmission_energy (x)	频率与磁通密度峰值的乘积（传输磁能）
Bm	磁通密度峰值（T）
f	频率（Hz）
T	温度（摄氏度）
m	磁芯材料种类（材料1、材料2、材料3、材料4）
w	励磁波形类型（正弦波、三角波、梯形波）
OOB Error	袋外误差（Out-of-Bag Error），评估随机森林模型的泛化能力
N	样本数目
yi	第(i) 个样本的真实磁芯损耗值
yi	第 (i) 个样本的预测磁芯损耗值
RMSE	均方根误差，用于评估模型的预测精度
PSO	粒子群优化算法（Particle Swarm Optimization）
particles	PSO 中的粒子表示可行解的集合
SwarmSize	粒子群的规模
wopt	优化后的加权系数
fval (x)	验证集上的目标函数值
predictions matrix	各模型在验证集上的预测结果矩阵
min	最优化操作符，表示目标函数最小化
max	最大化操作符，表示目标函数最大化

（注：这里只列出论文各部分通用符号，个别模型单独使用的符号在首次引用时会进行说明。）

模型的建立与求解

5.1 数据预处理

5.1.1 数据清洗

利用matlab的find函数对数据集的缺失值进行查找，得到题目给出数据并没有存在缺失值。对于异常值的判定，题目给出的数据，例如题目中存在极端异常的数据，例如无论是存在极端数据，需对该极端数据进行处理，首先对数据进行正态分布的检验。为了更加直观的观察异常数据，利用matlab绘制了三种指标的数据柱状图如下所示

图1：可视化结果

通过可视化，可以大致看出数据并不服从正态分布，为了进一步验证，需要对题目给出的数据判定其分布方式，这里使用Kolmogorov-Smirnov检验。Kolmogorov-Smirnov检验是一种非参数的统计检验方法，是一种用于检验数据集是否服从某种分布的统计方法，其中最常用的是检验数据集是否服从正态分布。其基本原理是将数据集的累积分布函数与理论分布函数进行比较，通过计算两者之间的最大差距来判断数据集是否符合该理论分布。如果最大差距小于某个临界值，则认为数据集服从该理论分布，单样本的K-S检验是用来检验一个数据的观测经验分布是否是已知的理论分布。当两者间的差距很小时，推断该样本取自已知的理论分布。作为零假设的理论分布一般是一维连续分布F(如正态分布、均匀分布、指数分布等)，有时也用于离散分布（如Poisson分布）[1]。即H:总体X服从某种一维连续分布F。检验统计量为：

Z=nmaxi(Fnxi-1-Fxi,|Fnxi-F(xi)|)

H真，Z依分布收敛于Kolmogorov-Smirnov分布。即，当样本取自一维连续分布F时：

Z→K=sup⁡|B(F(x))|

注:当F是连续分布时，随机变量K的分布不依赖于F。

KS检验的结果通常是一个p值，如果p值小于显著性水平（一般为0.05），则拒绝原假设，即认为两个样本来自不同的分布。

表1：数据预处理

指标名称	频率，Hz	磁芯材料	励磁波形
检验结果	非正态分布	非正态分布	非正态分布

因此，对于不服从正态分布的数据，使用引入了箱型图。箱型图理论无需对数据自身做出限制，不受异常值影响，可以直直观的描述数据的离散分布情况，并且提供了一个识别异常值的标准，即大于箱型图设定的上界或小于下界的数值即为异常值箱型图是利用数据的最小值、第一四分位数、中位数、第三四分位数、最大值进行描述数据的一种方法，利用箱型图无需数据服从正态分布。

将检测数据按照从小到大的顺序依次排序X1,X2,X3