利用可解释性技术增强制造质量预测模型

概述

论文地址:https://arxiv.org/abs/2403.18731
本研究提出了一种利用可解释性技术提高机器学习(ML)模型性能的方法。该方法已用于铣削质量预测,这一过程首先训练 ML 模型,然后使用可解释性技术识别不需要的特征并去除它们,以提高准确性。这种方法有望降低制造成本,提高对 ML 模型的理解。这项研究表明,可解释性技术可用于优化和解释制造业的预测模型。

介绍

铣削是一种加工工艺,通过去除材料来加工出所需的形状或表面光洁度。在这一过程中,被称为铣刀的切削工具高速旋转,在移动工件的同时去除材料。工件固定在一个可以多轴移动的工作台上,可以进行各种方向和角度的加工(Fertig 等人,2022 年)。铣削过程中的能耗会因设置和材料的不同而有很大差异,但通常被认为是一种能源密集型工艺。如果能预测和预防质量问题,就能降低能耗,减少因生产缺陷零件而造成的浪费(Pawar 等人,2021 年)。

机器学习(ML)模型可以识别数据中的模式和结构,并在不受程序直接指导的情况下进行预测。这些模型是预测铣削操作最终质量的有用工具,可以提高制造过程的效率和可靠性(Mundada 和 Narala,2018 年)。然而,铣削操作的实验数据非常昂贵,因此可用数据往往很少,难以训练 ML 模型来预测工件质量(Postel 等人,2020 年)。

此外,在使用复杂的 ML 模型(尤其是深度神经网络模型)时,其内部运作是不透明的,其 "黑箱 "性质可能会造成问题。出现这一问题的原因是这些模型的预测结果难以理解,因此无法被制粉质量预测领域的从业人员和利益相关者完全理解(Kwon 等人,2023 年)。

本研究提出了一种利用可解释性方法来阐明和优化 ML 模型预测机制,从而提高 ML 模型性能的方法。通过使用可解释性方法,可以识别 ML 模型预测中的重要特征并消除不必要的特征,从而有效推进优化工作(Bento 等人,2021 年;Sun 等人,2022 年)。

相关研究

将机器学习(ML)应用于制造和加工任务至少已有十年之久(Kummar,2017)。例如,ML 最初用于优化车削操作(Mokhtari Homami 等人,2014 年)、预测铣削操作的稳定条件(Postel 等人,2020 年)、估算内孔质量(Schorr 等人,2020 年)以及使用 ML 驱动的表面质量控制对缺陷进行分类(Chouhad 等人,2021 年)。Chouhad 等人,2021 年)等。

然而,可解释人工智能(XAI)方法在制造过程中的应用最近才开始受到关注(Yoo 和 Kang,2021 年;Senoner 等人,2022 年)。正在进行的欧洲 XMANAI 项目(Lampathaki 等人,2021 年)旨在评估 XAI 在不同制造领域的能力。特别是,XAI 在故障诊断领域的成功应用潜力已经显现(Brusa 等人,2023 年)。

还有一些研究侧重于数据集的特征选择,而不直接考虑 ML 模型(Bins 和 Draper,2001 年;Oreski 等人,2017 年;Venkatesh 和 Anuradha,2019 年)。本研究探讨了使用 XAI 通过消除不必要的传感器来提高预测模型质量的可能性,尽管通过可解释性方法来提高 ML 模型性能的方法在可解释性 ML 的背景下是众所周知的(Bento 等人,2021 年;Sun 等人,2022 年;Nguy 等人,2022 年)。等人,2022 年;Nguyen 和 Sakama,2021 年;Sofianidis 等人,2021 年),但这是 XAI 首次用于铣削操作的质量预测模型。特别是,通过使用 XAI 方法识别和消除不需要的特征来改进铣削过程质量预测模型的方法非常新颖。

方法论

本研究提出了一种利用可解释性技术提高机器学习(ML)模型性能的方法,具体步骤如下。

1. 训练 ML 模型

首先,使用给定的数据集训练 ML 模型。本研究使用了三种模型:决策树回归、梯度提升回归和随机森林回归。与神经网络相比,这些模型需要的数据更少,也更容易解释。

2. 可解释性方法的应用

将可解释性方法应用于训练好的 ML 模型和数据集,以确定对预测准确性至关重要的特征。这一步骤包括对特征的重要性进行排序,并使用越来越多的重要特征来训练新模型。

3. 特征选择

根据特征的重要性,只使用最重要的特征来训练新模型。这一过程可提高 ML 模型的性能。

机器学习模型

  • 决策树回归模型

决策树回归模型将输入空间划分为不同的区域,并对每个区域内的训练样本拟合一个简单的模型(通常为常数)。 对新输入𝑥 x 的预测 𝑦^表示如下。

其中,𝑐𝑚cm 是拟合区域 𝑅𝑚R m的常数,𝑀 M 是区域数量,𝐼 ⋅I⋅ 是指标函数。

  • 梯度提升回归模型

梯度提升回归模型结合了多个弱模型来优化损失函数。从初始近似值F0(x)开始,通过添加弱模型hmx(x)对其进行如下更新。

其中,𝛼 α 是学习率,hm(x) 是弱学习器,用于纠正前一个模型中的错误。

𝐹𝑚(𝑥)=𝐹𝑚-1(𝑥)+𝛼⋅타𝑚(𝑥)

  • 随机森林回归模型

随机森林回归模型通过训练多棵决策树并取其平均值来做出最终预测。

新输入数据𝑥x � �最终预测结果表达如下

其中,𝑇 T 是树的总数,yt(x)𝑦𝑡(𝑥) 是第 t 棵树的预测值。

𝑦^(𝑥)=1𝑇∑𝑡=1𝑇𝑦𝑡(𝑥)

可解释性技术

  • 特征的排列重要性

特征置换重要性是一种评估模型重要特征的问责方法。它通过随机替换某些特征并监测模型性能的变化来衡量每个特征的重要性。

  • 夏普利值

夏普利值源于合作博弈论,根据每个参与者的边际贡献分配公平值。在机器学习模型中,它量化了每个特征对预测的贡献。

案例研究

本研究使用 ENSAM 生成的数据集来应用所提出的方法。详情如下。

目标

本案例研究的目的是为每个质量指标开发一个预测模型。这不仅包括训练模型,还包括明确预测结果的原因,以及识别和删除不需要的特征。这一步骤旨在通过减少冗余传感器、优化资源和降低成本,最大限度地降低安装和维护成本。

图 1:用于加工工件的铣床

数据预处理

由于本研究处理的是时间序列长度不固定的数据,因此对每个时间序列都计算了方框图值。此外,数据集中的元数据包含各种实验参数。

训练机器学习模型

在本研究中,对决策树回归、梯度提升回归和随机森林模型进行了训练,以预测每个质量指标。模型输入和输出的整体视图如图 2 所示。每个模型的训练都采用了五部分交叉验证法。这种方法将数据分成五个相等的部分,其中四个部分(80%)用于训练,其余一个部分(20%)用于每次迭代测试。这一过程重复五次,五部分中的每一部分都作为测试集。对模型的性能取五次迭代的平均值,以得出更可靠的评估结果。

图 2:ML 预测模型接收箱形图(时域和频域)和机器配置参数,并输出质量指标。

分析

对所提出的方法进行了分析。首先评估了 ML 模型的性能,然后分析了 ML 模型的预测机制,最后评估了去除特征对 ML 模型性能的影响。

评估模型的预测质量

本研究旨在评估梯度提升回归、决策树和随机森林这三种 ML 模型的预测准确性。评估预测质量的主要指标是平均绝对误差率(MAPE)。如果 MAPE 小于 5%,则认为预测质量较高。

  • 设置:使用 100 个样本的预处理数据集。

  • 运行:在预处理数据集上训练了梯度提升回归、决策树和随机森林三种不同的机器学习模型,并使用 k 分割交叉验证法测量了 MAPE。

  • 研究结果:利用这些 ML 技术,我们能够利用一套完整的质量特征对 Rdq 进行预测,误差率低于 5%。具体来说,梯度提升回归模型的误差率为 4.58%,随机森林模型的误差率为 4.88%。

了解 ML 模型的预测机制

研究评估了每个属性在预测质量指标方面的重要性。

  • 设置:侧重于梯度提升回归模型,这些模型在训练后表现出最佳性能。
  • 运行:应用特征的排列重要性和 Shapley 值。
  • 发现:我们发现不同的解释方法显示出不同的原因。例如,与夏普利值相比,排列特征重要性突出显示 fa_ts_max 是更重要的特征(见图 3)。

图 3:使用 FPI(特征排列重要性排列)和 SHAP(夏普利值)方法对 Rdqmaxmean 预测的特征重要性等级进行可视化展示。

提高性能

本实验探索了将可解释性方法整合到 ML 模型开发过程中以提高模型性能的可能性。

  • 设置:ML 模型中的变量根据特征的重要性从高到低进行分类,每次试验都要训练一个新的模型,并改变顶级特征的比例(p)。

  • 运行:尝试只使用重要特征来提高模型的性能。

  • 研究结果:通过将最重要的特征整合到训练数据集中,ML 模型的性能得到了提高。例如,只选择排列重要性最高的 20% 的最重要特征,MAPE 就从约 4.58 提高到了 4.4。

图 4:在 Rdq 预测中根据不同方法使用不同比例的最重要特征。

讨论

本案例研究展示了可解释机器学习(ML)方法对制造质量预测模型的益处。可解释性分数(如特征重要性)用于解释每个特征与模型预测能力的相关性。人类专家可以利用这种解释来分析训练有素的模型,并验证重要性高的特征是否对预测任务有意义。

ML 模型可以揭示输入特征与预测目标之间的新关系,但在质量预测环境中,由于缺乏数据,过度依赖某些特征可能会成为学习错误相关性的指标。可解释性方法可以作为模型验证和人工检查的工具。

此外,研究还表明,可以通过去除低级特征来改进模型。具体来说,如图 4 所示,只保留最重要的特征就能提高模型的准确性。这种方法不仅提高了预测的准确性,还减少了预测所需的传感器数量,从而降低了预测的计算成本。在生产过程中进行实时质量预测以检测潜在缺陷和偏离计划的情况时,重要的是要尽量减少预测所需的时间并提高预测频率。

在设计生产原型机时,同样重要的是在早期阶段对预测模型进行评估,以确定机器的最终传感器组。虽然原型机配备了许多传感器,但只有在对预测模型进行评估后,才会选择相关的传感器。

此外,使用简单且可解释的模型(Breiman,2001 年;Rudin 等人,2022 年)可能有利于制造业质量预测模型的开发。然而,简单性和准确性之间存在权衡(奥卡姆困境):模型越简单,准确性就越低。在案例研究中,简单决策树与更复杂的梯度提升树和随机森林之间的误差差异也体现了这种权衡。使用可解释性技术减少特征数量再次降低了模型的复杂性,并使最终模型更具可解释性。

总结

本研究展示了结合机器学习(ML)和可解释性技术来提高制造业表面质量预测模型性能的潜力。尽管可用数据有限,但基于可解释性技术的特征选择能够利用少量数据提高 ML 模型的有效性。

未来研究的目标是将可解释性方法扩展到铣削以外的制造工艺,并建立一个更全面的预测系统。此外,这些 ML 模型将被用作物理机器的数字孪生模型,并将应用参数优化方法来开发新的开发成果。这种整合不仅能提高模型的准确性,还能对机器操作进行实时微调,从而提高效率并降低成本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1558911.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

安装echarts报错:request to https://registry.npmjs.org/echarts-gl failed

Hello!欢迎各位新老朋友来看小弟博客,祝大家事业顺利,财源广进!! 主题:安装echarts报错:request to https://registry.npmjs.org/echarts-gl failed 第一:报错问题:链接…

Codeforces Round 923 (Div. 3) F. Microcycle

题目 【坑点】:不能先用拓扑排序去掉“线头”,然后找权重最小的边所在的环。因为去掉线头后,可能有的边不在环内。 e.g.有六条无向边 1 - 2 , 2 - 3, 1 - 3, 4 - 5, 5 - 6, 4 - 6, 1 - 4, 边1 - 4不在环内 wa代码: #include &…

【FPGA开发】Modelsim仿真精度的坑

问题所在 最近在使用黑金的AXU3EG板卡对着正点原子ZYNQ7020的例程进行移植学习。但在编写tb代码以及使用modelsim进行仿真时出了问题,发现我的实际波形与正点的对不上,仔细测量一下波形发现,我的系统时钟是6ns周期,而不是理想中的…

儿童(青少年)可以参加哪些含金量高的比赛?

随着素质教育的推进,越来越多的家长和老师开始关注如何培养孩子的综合素质和能力。而参加各类比赛,不仅可以锻炼孩子的思维、动手能力和团队合作精神,还能帮助孩子在学习的过程中找到兴趣点和成就感。尤其是一些含金量高的比赛,不…

QT实现QMessageBox中文按钮

这是我记录Qt学习过程心得文章的第二篇,主要是为了方便QMessageBox弹出框的使用,通过自定义的方式,将其常用的功能,统一封装成一个函数,还是写在了Skysonya类里面。 实现代码: //中文提示对话框 bool Sky…

DAMA数据管理知识体系(第12章 元数据管理)

课本内容 12.1 引言 图12-1 语境关系图:元数据概念理解 元数据的信息范围很广,不仅包括技术和业务流程、数据规则和约束,还包括逻辑数据结构与物理数据结构等。它描述了数据本身(如数据库、数据元素、数据模型)&#x…

noexcept

作用 性能优化:当一个函数声明为noexcept时,编译器可以假设该函数不会抛出异常,从而避免生成与异常处理相关的额外代码。这可以减少程序的运行时开销,特别是在那些不使用异常的代码路径上。 使用 通const一样,声明和…

java动态规划背包问题

代码功能 在不超过给定背包容量(capacity)的前提下,从一系列具有特定重量(weights)和价值(values)的物品中选择若干物品,使得这些物品的总价值最大化。 类定义:定义了一…

C++实现AVL树增删查

目录 1. AVL的概念 (1)名字的由来 (2)什么是AVL树 (3)实现方法 (4)为什么高度差是1 (5)对比二叉搜索树 2. AVL树的结构 3. AVL树的功能 (1…

芝法酱学习笔记(0.7)——harbor与项目容器化部署

前言 之前我们主要讲的jar包部署。使用jar包部署可能导致不同服务互相争抢资源(隔离性),不同服务可能需要不同的jdk环境,有时也会造成困扰。故在微服务时代,我们通常使用docker部署 一、docker安装 docke相关的知识…

新硬盘第一次使用需要怎样做?

无论是组装新电脑,还是给现有电脑增加存储空间,我们需要进行一些安装硬盘和设置硬盘的操作。对于没有相关经验的用户来说,对于拿到手的新硬盘会感到手足无措,不知道应该从哪里开始。今天小编详细介绍一下新硬盘第一次使用时的流程…

Qt-窗口布局按钮输入类

1. 窗口布局 Qt 提供了很多摆放控件的辅助工具(又称布局管理器或者布局控件),它们可以完成两件事: 自动调整控件的位置,包括控件之间的间距、对齐等; 当用户调整窗口大小时,位于布局管理器内的…

AI没有是非观的原因

人工智能没有价值观的原因主要可以归结为只有数据驱动的被动性相关算法,没有主动干预性及其反事实关系: (1)数据被动驱动 AI的学习、分析、预测只依赖于大量的数据,并通过模式识别和统计分析建立关联。而这些数据本身可…

【算法】链表:2.两数相加(medium)+模拟

系列专栏 《分治》 《模拟》 《Linux》 目录 1、题目链接 2、题目介绍 3、解法 (模拟) 4、代码 1、题目链接 2. 两数相加 - 力扣(LeetCode) 2、题目介绍 3、解法 (模拟) 理解题目要求: 我们有两个链表,每个链表代表一个…

51单片机-第十四节-AD/DA(XPT2046触摸屏)

一、AD/DA介绍: AD:模拟-数字转换,将模拟信号转换为计算机可操作的数字信号。 DA:数字-模拟转换,将计算机输出的数字信号转换为模拟信号。 二、运算放大器: 1.介绍: (1&#xf…

给网站加加速!下一代CDN(EdgeOne/边缘安全加速)使用与配置体验

随着访问量的增加和用户需求的多样化,服务器的带宽有限,面对一些图片数据,显得“力不从心”。CDN技术,就很好的解决了这个问题,但是价格也是用户思考的问题。 EdgeOne不仅继承了传统CDN的核心优势,更在速度…

uni-app 开发的应用快速构建成鸿蒙原生应用

uni-app 是一个使用 Vue.js 开发所有前端应用的框架,它支持编译到 iOS、Android、小程序等多个平台。对于 HarmonyOS(鸿蒙系统),uni-app 提供了特定的支持,允许开发者构建鸿蒙原生应用。 一、uni-app 对 HarmonyOS 的支…

【用户管理 添加用户 超级用户 用户和组】

用户管理 添加用户超级用户用户和组 添加用户 介绍用户的管理操作 比如,添加一个用户 sudo useradd -m test1 其中,sudo表示管理员身份运行 修改用户密码 sudo passwd test1 删除用户 sudo userdel test 超级用户 1.首次使用时,需要给roo…

以光塑形:光固化3D打印机原理图文解析

公众号端: 光固化打印机介绍https://mp.weixin.qq.com/s?__bizMzkwMjc0MTE3Mw&mid2247484073&idx1&sn0d0fd026b373b06cd7c340ec8f56a006&chksmc0a1af73f7d62665a632baebbde4e5e00ffb9c6bd31bf547b4a86855d5524535619a6175a428#rd 光固化打印机…

IDEA上Mybatis介绍和使用

MyBatis是一款优秀的持久层框架,用于简化JDBC的开发。 创建项目 在springboot项目中添加Mybatis和MySQL依赖项。 找到数据库选项,点击新建 -> 数据库源,选择MySQL。 输入完成信息后,可以先进行测试,可以成功连接再…