探索基于知识图谱和 ChatGPT 结合制造服务推荐前沿

0.概述

论文地址:https://arxiv.org/abs/2404.06571
本研究探讨了制造系统集成商如何构建知识图谱来识别新的制造合作伙伴,并通过供应链多样化来降低风险。它提出了一种使用制造服务知识图谱(MSKG)提高 ChatGPT 响应准确性和完整性的方法。该研究整合了来自北美小型制造商数字足迹的结构化和非结构化数据,以开发制造服务知识图谱。知识图谱和学习图谱嵌入向量用于解决数字供应链网络中的复杂查询,以提高可靠性和可解释性。这种方法可扩展地形成全球制造服务知识网络图,将跨行业、跨地域和跨业务领域的知识图谱整合在一起。已发布的数据集包含 13000 多个制造商网络链接、制造服务、认证和位置实体类型。

1. 介绍

随着数字化程度的不断提高,制造业正越来越多地采用数据驱动的方法。特别是,制造系统集成商正在寻找有效的方法来识别新的制造合作伙伴,并通过供应链多样化来降低风险。制造服务知识图谱(MSKG)是为满足这些需求而开发的工具,可为复杂查询提供可靠性和可解释性。

1.1 制造服务知识图谱 (MSKG) 概览

MSKG 是通过整合北美小型制造商数字足迹中的结构化和非结构化数据而建立的。该知识图谱包括制造商的网络链接、制造服务、认证和地点等数据,并将这些数据联系在一起,为供应链优化和风险管理提供支持。

图 1. ChatGPT 与 MSKG 增强型 ChatGPT 响应的比较

1.2 研究的背景和目标

本研究旨在利用 MSKG 提高 ChatGPT 响应的准确性和完整性。具体来说,它旨在解决制造系统集成商面临的以下挑战

  1. 确定新的生产合作伙伴。
  2. 供应链多样化
  3. 降低风险

为了应对这些挑战,我们使用了知识图谱和学习图谱嵌入向量。这允许在数字供应链网络中进行复杂查询,并提高了可靠性和可解释性。

1.2 方法的可扩展性

本研究提出的方法具有可扩展性,可形成一个全球制造服务知识网络图,将多个行业、地理边界和业务领域的知识图谱整合在一起。这种可扩展性使其适用于其他地区和行业,并有望作为更广泛的数字生态系统的一部分发挥作用。

2. 相关研究

知识图谱(KG)用于连接医学、社交网络和化学等领域的概念;知识图谱嵌入模型将实体和关系转化为低维向量,并保留知识图谱结构。这些模型适用于聚类和链接预测等机器学习任务;Mohamed 等人探索了知识图谱嵌入在药物目标预测和聚类中的应用,Wang 等人则将其用于药物推荐。

虽然从结构化数据中构建 KG 的方法已经成熟,但由于提取不可靠和缺乏数据集,从文本和多媒体等非结构化数据中构建 KG 仍然具有挑战性。最近的尝试包括 COVID-KG(来自科学文献)和来自中国汽车行业文本的行业 KG。由于噪音和旧的 HTML 结构,从网站中提取准确信息非常困难;自然语言处理(NLP)和主题标签生成(TLP)技术,如 BERT 和 GPT-4 对于处理大型非结构化文本非常重要。

工业领域的知识映射对于知识、数据和关系的可视化非常重要;LangChain 和 LlamaIndex 等方法使用 LLM 进行数据处理,并辅以工业本体基金会和工业 4.0制造本体,并辅以本体驱动的方法。这些构成了制造服务发现和设备查询等服务的基础,以支持工业问题的解决和决策。此外,Siddharth 等人还致力于从专利中提取工程知识。然而,关于实时制造数据的映射、整合和分析还缺乏文献。造成这一空白的原因是,当前基于 LLM 的方法在行业知识映射以实现不断发展的制造数据集成方面存在局限性。

问答(QA)系统结合了信息检索和基于知识的方法来提供准确的答案。基于知识的问答系统使用知识库检索答案,而图嵌入则将知识库数据转换为向量,以帮助人工智能和神经网络进行推理。基于知识的问答提供了结构化的上下文,从而提高了 LLM 生成和解释更准确、更符合上下文的答案的能力。

最近的一些研究强调了如何将 KG 和 LLM 结合起来以改进质量保证系统;Daull 等人探讨了 KG 如何帮助改进 LLM 和减少错误;Truong 和 Coleen 强调了结合 KG 以生成准确的答案;Linyao 等人探讨了如何将 KG 和 LLM 结合起来以改进质量保证系统。这些发展表明,改进质量保证系统是大有可为的。虽然这些发展显示了改进质量保证系统和准确性的前景,但应用这些方法的研究还很有限,尤其是在制造业的供应采购方面。将这些集成方法专门用于制造业,可以大大改善服务发现和供应链流程优化。

3.算法架构

本节描述了制造服务知识图谱(MSKG)和 ChatGPT 的集成架构,旨在增强制造服务发现功能。制造业客户与 ChatGPT 之间的交互是通过 QA 进行的。在收到客户输入的问题后,应用程序会将问题转发给 OpenAI GPT-4 端点,并请求将其转换为可在图数据库中使用的查询语句。中检索相关的制造能力,并用查询语句做出响应。检索到的数据有助于建立一个全面的答案,以解决客户的初始问题。

图 2 显示了使用 MSKG 增强 ChatGPT 的架构。

图 2:用 MSKG 丰富 ChatGPT 的架构

此外,MSKG 还由众多制造商网站进行近乎实时的更新。在制造领域采用 Schema.org 词汇扩展后,制造商可以使用 HTML 标签将特定的制造服务标签附加到其网站上。当制造商在其网站上添加这些标签时,这些标签就会与 MSKG 本体相关联,从而使查询搜索结果更及时、更准确。

4. 工作流程

本节介绍了在 ChatGPT 中建立 MSKG 和加强 QA 的整体程序。该流程由四个主要部分组成。文本知识提取、KG 设计、图表嵌入和知识驱动的质量保证。

图 3 显示了通过根据互联网信息设计的知识图谱(KG)来增强问答(QA)系统的工作流程。

图 3:从互联网信息到知识图谱 (KG),旨在增强问题解答 (QA) 系统
  1. 文本知识提取:从制造商网站和其他数据源中进行信息提取,以获得要导入 MSKG 的数据;在批量导入后,以从 Wikidata 中提取的实体为指导构建 MSKG;从 MSKG 中进行学习。根据图嵌入向量,进行降维和多标签分类。
  2. KG 设计:包括四种节点标签和四种关系标签的 KG。给出了节点和关系类型的示例。
  3. 图嵌入:使用图嵌入技术(Node2Vec 和 GraphSAGE)从 MSKG 子图中学习嵌入向量。嵌入向量用于下游的制造商推荐和多标签分类任务。
  4. 知识驱动的质量保证:建立基于 MSKG 的质量保证系统,以解决制造服务发现方面的复杂问题;通过 P@N 和 MRR 指标对质量保证系统进行评估,以便向制造商提出建议。

5. 数据整合与丰富

该流程旨在对收集到的数据进行标准化和整合,以建立知识图谱。这一过程包括以下步骤:

  1. 数据标准化

    • 将从不同来源收集的数据转换成一致的格式。这可确保数据的一致性。数据标准化包括统一数据格式、转换单位和整合数据字段。例如,统一日期格式和转换数字数据单位。
  2. 实体匹配

    • 它可以匹配和合并同一实体上不同来源的数据。这样可以消除重复数据,提高数据完整性。实体匹配使用名称相似性、地址匹配性和产品 ID 共通性等标准进行。例如,将从不同来源收集的同一制造商的数据合并为单一实体。
  3. 丰富生活:

    • 从外部数据源获取更多信息来丰富数据。这就扩展了知识图谱节点和边中包含的信息。丰富数据可增加公司财务信息、行业报告、专利数据等。这使得知识图谱更加详细和全面。

表 1 显示了提取的实体类型。

表 1 提取的实体类型

表 2 显示了服务提取的样本。

表 2:服务提取样本

6. 知识图谱构建

综合数据用于构建知识图谱。知识图谱由节点(实体)和边(关系)组成,包含制造商、产品、服务、认证和地理位置等信息。

  1. 生成节点

    • 制造商、产品、服务、认证和地理位置等实体作为节点生成。这样可以单独识别每个实体,并明确它们之间的相互关系。节点生成根据数据属性识别实体,并将每个实体定义为单独的节点。
  2. 边缘生成

    • 实体之间的关系用边来表示。例如,制造商与其提供的服务之间的关系。边的生成基于实体间的交互和依赖关系来定义关系。例如,如果制造商 A 提供服务 X,那么 A 和 X 之间就形成了一条边。

图 4 显示了 MSKG 的总体结构。

图 4. 典型 MSKG 的结构

表3 显示了 KG 实体和关系的总数。

表 3:KG 实体和关系总数

7. 嵌入式图形

图嵌入模块可学习节点之间的关系,并将节点嵌入高维向量空间。这有助于计算节点的相似性,并提高对复杂查询的响应精度。

  1. 使用 node2vec

    • 基于 Grover 和 Leskovec(2016 年)的方法,node2vec 可捕捉随机行走中节点的邻近信息,并生成嵌入向量。这样就能高效地学习节点特征。
  2. 使用图卷积网络(GCN)

    • 基于 Kipf 和 Welling(2017 年)的方法,GCN 通过整合节点特征及其邻近节点信息来提高预测精度。GCN 是一种针对图结构数据的深度学习方法,它将节点属性和邻近节点信息结合在一起。这提高了节点分类和链接预测的准确性。

8.知识驱动的质量保证

8.1 背景

要建立一个发现制造服务的质量保证系统,就必须解决制造业复杂多变的问题。主要挑战是将详细的行业特定数据整合到 KG 中,并不断更新以反映新的发展和市场趋势。此外,还需要对制造供应链中的复杂关系进行精确建模。制造业对准确性和可靠性的要求很高,再加上获得专有数据的途径有限,因此建立有效的质量保证系统具有挑战性。

8.2评估方法

评估质量保证系统有多种方法,包括平均互易等级 (MRR)、N 倍精度 (P@N)、召回率 (Recall)、F1 分数和人工评估。P@N 衡量推荐系统返回的前 N 个回复中正确回复的比例。精度在 N (P@N) 的指标(N=10,100,300)用于评估制造商推荐器的性能和评价系统的能力。P@N 表示为:推荐器系统返回的前 N 个回复中正确回复的百分比;制造商返回的前 N 个回复中正确回复的百分比;以及制造商返回的前 N 个回复中正确回复的百分比:

其中,NrelevantN_{relevant}Nrelevant是前 N 个结果中与目标制造商相关的服务数量,NtopN_{top}Ntop是前 N 个结果所提供的服务数量。MRR 表示为

其中,rank_i 是第 i 个查询的第一个相关制造商的排名。

之所以选择这些指标,是因为它们要求在发现制造商时提供准确且排名靠前的答案;P@N 评估的是顶级推荐的准确性,而 MRR 评估的是系统首先识别最相关制造商的有效性。

8.3 建立质量保证系统

本研究采用索引方法对从制造商网站检索到的文本进行分类和组织,该方法基于 KG 构建过程中使用的一些技术。主要贡献如下

  1. 我们提出了一种从小型制造商的独立网站中提取和组织特定领域文本的机制。这将使他们能够与特定技术领域的文本进行自然交互。

  2. 将不断发展的 KG 集成到 LLM 中提供了一种新的解决方案,可改变制造能力识别和制造商建议的格局。

  3. 本文介绍了一种自下而上的本体构建与先进机器学习模型的新整合方法,可从结构化和非结构化数据源中高效构建 MSKG。这种方法简化了各种数据的整合,提高了KG的准确性和相关性。

  4. 这是一个基于图形的高级质量保证系统,旨在解决与数字供应链网络相关的复杂问题,它结合了 KG 和图形嵌入技术,可提供深入分析和定制的、高度准确的、基于相似性的建议。

8.4 系统性能

图 5 显示了结合 MSKG 和 ChatGPT 解决一个简单问题的示例。

图 5. 结合使用 MSKG 和 ChatGPT 解决易级问题

图 6 举例说明了如何将 MSKG 和 ChatGPT 结合起来解决疑难问题。

图 6:结合 MSKG 和 ChatGPT 解决难级问题

9.总结

9.1 验证文本提取结果

文本提取结果表明,由于制造商网站主页上缺乏文本信息,负面类别的数量可能高于正面类别的数量。 计算 ROC 曲线和 PR 曲线以显示模型的可靠性。性能。其中,认证提取模型的 AUC-ROC 分数最高,而位置提取模型的性能最低。

图 7:ROC 和 PR 曲线。

针对每种数据类型,对特定数据提取模型的准确性、可重复性和计算 F1 分数的临界值进行了优化。这种方法提高了数据提取的整体性能,增加了用于建立 MSKG 的数据的可靠性。

9.2 图形嵌入及其下游任务成果

根据 Node2Vec 和 GraphSAGE 的嵌入结果得到 100 维向量空间,并使用 T-SNE 进行降维。图 8 和图 9 比较了具有服务相关属性的制造商的聚类性能;GraphSAGE 显示出比 Node2Vec 更好的聚类定义,能够更清晰地区分服务特征。

图 8. 使用 GraphSAGE 对制造商的服务相关属性进行 T-SNE 可视化分析

图 9. 使用节点 2Vec 对制造商的服务相关属性进行 T-SNE 可视化分析

Node2Vec 生成的嵌入向量被用于多标签分类任务。使用 MLP 模型对这些向量进行了训练和评估。训练准确率为 98.90%,而多标签预测准确率、F1 分数、召回率和精确率分别为 98.72%、94.62%、99.93% 和 89.85%。

9.3 评估基于 MSKG 的质量保证

附录详细分析了与制造服务发现相关的问题及其相应的 MSKG 回答与 GPT-4 回答的比较。对于简单的问题,GPT-4 或 MSKG 都可以回答,但对于 Q13 和 Q14 等更复杂的问题,MSKG 和 GPT-4 的整合至关重要。

表 5 显示了制造商推荐的评估结果,GraphSAGE 在第 13 季度略微领先于 Node2Vec,而 Node2Vec 则在第 14 季度更胜一筹。这表明,推荐功能的性能因制造商提供的服务数量而异。

表 5:制造商建议的额定值

9.4 结论

研究采用了自下而上的方法,从制造商网站收集原始数据,并构建了包含四种实体类型及其相应关系的知识图谱(KG)。然而,由于一些网站缺乏基本的搜索引擎优化代码,只能从 17,000 家公司中提取 13,000 多家公司的信息。未来的挑战包括扩展 MSKG 和整合其他相关数据。

该报告指出,未来的研究将扩展当前的框架,旨在通过法律硕士培训和培训前战略来提高对幼稚园背景的了解。

本文介绍了一个利用近乎实时更新的知识图谱(KG)来识别制造服务和加强制造商推荐的框架。构建的 MSKG 有四种实体类型和相应的关系类型,其中包括制造服务,共有 13,240 个实体和 58,521 个关系,包括来自北美一些制造商的文本内容。

知识图谱和训练有素的图嵌入向量支持 ChatGPT 中的质量保证,并利用人类自然语言和图查询语言之间的转换来回答制造业客户的问题。评估结果表明,所提出的基于 MSKG 的质量保证能有效解决制造业服务发现中的复杂问题。

MSKG 的规模可以扩大到包括与制造供应链和特定工业供应链相邻的领域。未来的框架将致力于整合 LLM 和知识模型,以实现更丰富的搜索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1549357.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

yolox训练自己的数据集

环境搭建 gpu按自己情况安装 nvidia-smi 查看自己的版本 CUDA和cudnn 按自己的安装,我的驱动551.76,注意不要用最新的,官网只要求驱动是大于等于,可以用低版本的cuda,我安装的是CUDA 11.1 cuda下载后&#xff0c…

py 元组,列表,函数的学习和使用

代码 下面两个Python脚本&#xff0c;分别解决问题。 1. 脚本 test1.ipynb # 创建一个元组 t1 和一个空列表 list1 t1 (1, 2, R, py, Matlab) list1 [] # 使用 while 循环&#xff0c;将 t1 中的元素添加到 list1 i 0 while i < len(t1): list1.append(t1[i]) …

实时监控图像中的人脸识别:理解人脸识别技术指南

点击下方卡片&#xff0c;关注“小白玩转Python”公众号 在当今的数字时代&#xff0c;人脸识别技术已经成为一个关键技术&#xff0c;它正在从安全到个性化体验等多个领域进行革新。从门禁控制到考勤系统&#xff0c;再到走失儿童的检测&#xff0c;人脸识别的应用非常广泛&am…

MySQL的安装(环境为CentOS云服务器)

卸载内置环境 我们初期使用root账号&#xff0c;后期再切换成普通账号 使用 ps axj | grep mysql 查看系统中是否有MySQL相关的进程 使用 systemctl stop mysqld 关停进程 使用 rpm -qa | grep mysql 查看MySQL相关的安装包 使用 rpm -qa | grep mysql | xargs yum -y remo…

基于php的酒店管理系

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏&#xff1a;Java精选实战项目…

力扣 滑动窗口最大值

滑动窗口最大值 题目描述 题目分析 维护一个定长窗口的最大值&#xff0c;每当窗口滑动时都有一个新的元素进入和一个原有的元素离开。 比较简单的方法就是用一个优先队列维护窗口最大值 但是堆的计算成本时最坏时是 O ( n log ⁡ n ) O(n\log n) O(nlogn) 优化&#xff1a;…

MySQL 性能剖析全攻略

在使用 MySQL 数据库的过程中&#xff0c;性能问题往往是让开发者和管理员头疼的难题。为了有效地解决这些问题&#xff0c;我们需要对 MySQL 进行性能剖析。那么&#xff0c;如何在 MySQL 中进行性能剖析呢&#xff1f;本文将为你详细介绍。 一、为什么要进行性能剖析&#x…

实施自动化测试的五个条件

摘要&#xff1a; 谈到什么是组成一次自动化测试的“恰当实施”经常会关注你需要用的工具&#xff0c;但是那仅仅是等式的一部分。巴斯 迪杰斯特拉详细说明了你需要考虑的其他四件事&#xff0c;他们如何致力于你的自动化测试的成功&#xff0c;以及关联到不能适当关注它们中任…

MNIST手写数字数据集

数据集 官网链接失效&#xff0c;我找到数据集后&#xff0c;上传到码云&#xff0c;并在这里分享。 打开链接&#xff0c;进入如下目录&#xff0c;即可找到如下八个文件&#xff1a; 下面是一些可有可无的介绍。 Mnist数据集介绍 Mnist数据集包含70000张手写数字图片&#x…

5G NR 协议规范表(对应3GPP 协议编号)

文章目录 5G NR 协议规范表&#xff08;对应3GPP 协议编号&#xff09;5G 架构相关协议5G 新空口相关协议无线接入网相关协议终端相关协议 5G NR 协议规范表&#xff08;对应3GPP 协议编号&#xff09; 5G 架构相关协议 5G 新空口相关协议 无线接入网相关协议 终端相关协议

Woocommerce怎么分类显示产品?如何将Shopify的产品导入到Woocommerce?

WooCommerce作为WordPress的一个电子商务插件&#xff0c;功能强大、使用简洁&#xff0c;能够轻松集成到WordPress网站中&#xff0c;为用户提供了一个完整的在线商店解决方案&#xff0c;在国外还是挺受欢迎的。 Woocommerce怎么分类显示产品&#xff1f; 在Woocommerce中&a…

[ComfyUI]Flux:太美了!古风华服与现代DJ演绎。灼灼荷花瑞,亭亭出水中

大家好我是安琪&#xff01;&#xff01;&#xff01; F.1-汉服人像艺术-国风-氛围感 简介 今天介绍一款Flux LORA模型&#xff1a;F.1-汉服人像艺术-国风-氛围感-liangyi&#xff0c;这是一款以古代汉服女性写真为主题的Flux LORA模型。属于人物主体&#xff0c;增加中国传统…

国庆头像制作小程序相关代码

↓↓ 点击下方搜索开始制作您的专属头像 ↓↓ 发现-》搜一搜-》最美易飞证件照制作 国庆头像自定义头像制作、微信头像直接获取制作小程序源码 index.wxml文件代码 // pages/userPhoto/userPhoto.js//获取应用实例const app getApp()import { Router} from ../../utils/ro…

23款奔驰E300立标升级23P智能辅助驾驶案例分享

《23 款奔驰 E300 立标升级 23P 智能辅助驾驶案例》 在汽车科技不断进步的今天&#xff0c;越来越多的车主开始追求更加智能、安全的驾驶体验。今天&#xff0c;我们就为大家带来一款 23 款奔驰 E300 立标升级 23P 智能辅助驾驶的精彩案例。 这辆 23 款奔驰 E300 立标原本就散…

C# Blazor Server 调用海康H5Player播放摄像头画面

目标 调用海康综合安防平台api&#xff0c;通过摄像头的cameraIndexCode调用【获取监控点预览取流URLv2】api&#xff0c;得到websocket 的url&#xff0c;然后在blazor server中使用htplayer.js播放摄像头实时画面。 步骤 根据摄像头名字&#xff0c;调用【查询监控点列表v2…

Python编码系列—Python命令模式:将请求封装为对象

&#x1f31f;&#x1f31f; 欢迎来到我的技术小筑&#xff0c;一个专为技术探索者打造的交流空间。在这里&#xff0c;我们不仅分享代码的智慧&#xff0c;还探讨技术的深度与广度。无论您是资深开发者还是技术新手&#xff0c;这里都有一片属于您的天空。让我们在知识的海洋中…

CentOS8.5.2111(3)实验之DHCP服务器架设

一、实验目标 1&#xff0e;掌握DHCP服务器的主配置文件各项申明参数及操作及其含义 2. 具备DHCP 服务器、中继服务器的配置能力 3. 具备测试客户端正常获取服务器分配地址的能力 4. 具备DHCP服务器故障排除能力 二、实训原理/流程 &#xff08;一&#xff09;项目背景 …

python爬虫案例——抓取链家租房信息(8)

文章目录 1、任务目标2、分析网页3、编写代码1、任务目标 目标站点:链家租房版块(https://bj.lianjia.com/zufang/) 要求:抓取该链接下前5页所有的租房信息,包括:标题、详情信息、详情链接、价格 如: 2、分析网页 用浏览器打开链接,按F12或右键检查,进入开发者模式;因…

首屏优化之:SSR(服务端渲染)

引言 今天我们来聊一下首屏优化之SSR-服务端渲染&#xff08;Server-Side Rendering&#xff09;。 可能很多朋友并不了解什么是 SSR&#xff0c;包括在工作中写的网站是什么类型的也不太清楚&#xff0c;是 CSR 还是 SSR&#xff1f;作者在阅读过大量的文章之后&#xff0c;…

一文上手SpringSecurity【二】

书接上回,我们直接引入了spring security的依赖,之后啥也没有干,在访问接口的时候, 就需要认证之后才能访问了 ,咱们没有主动干啥,那肯定有人帮助我们干啥了,这一切都利益出spring boot自动装配机制,下面咱们就看看spring security的自动装配,帮助我们干啥了. 一、Spring Secur…