大语言模型在构建UNSPSC 分类数据中的应用

        UNSPSC 是联合国标准产品和服务代码。UNSPSC由联合国开发计划署(UNDP)和Dun & Bradstreet公司(D & B)于1998年联合制定,自2003年以来一直由GS1 US管理。GS1 US 将在 2024 年底前将 UNSPSC 的管理权移交给 UNDP。

        本文主要研究如何使用mongoDB数据库,nodeJS的javascript程序,大语言模型(chatGPT)生产UNSPSC 分类系统的数据。

下载unspsc 文档

        首先下载 unspsc  分类EXCEL 文档,unspsc 官网(https://www.unspsc.org/)上无法下载,大概要成为unspsc 的subscriber  之后才可以,但是我不知道如何能够成为unspsc 的订阅者。

        国内的道客巴巴上有个中文翻译文档,结果下载下来才发现编码与描述不对版,也许是早期的东西吧,白瞎了34元。我是在康奈尔大学的网站上下载了一个英文的unspsc 文档,在联合国全球市场网下载了一个中文的文档。

     有读者告诉我正确的方法,请在评论区留言。

下载unspsc 分类

从康奈尔大学的网站上下载了一个unspsc 文档,包含的商品大约149851个.

https://finance.cornell.edu/procurement/buyers/unspsc

文档格式

Segment,Family,Class,Commodities 是分成三个表。

下载 中文文档

        我们希望下载一个中文的unspsc 文档,最终在联合国全球采购市场网站上下载了中文unspsc 文档,但是在中国联合国全球采购网站上却没有。这个·文档中只有13000多种商品,部分标题没有被翻译

https://www.ungm.org/Public/UNSPSC

文档格式

转储

        下一步将unspsc 到mongoDB 数据库中。

第一种方法(以unspsc 为基础)

        unspsc.xlsx 文档另存为cvs 文件,Segment.cvs,Family.cvs,Class.cvs,Commodity.cvs 几个文件,我们通过一个javascript 程序unspscStore.js 将cvs 文档存储到mongoDB 中。成为4 个collection。

第二种方法(以unspsc_chinese 为基础)

   将unspsc中文文档(删除前11行,A,B 列)转储到mongodb 中。由此生成Segment,Family,Class,Commodity 四个Collection。

最后,我们决定先使用中文的数据构建项目的内容。

构建产品的特性模型

       对所有Commodity 的商品,构建商品的Properties ,存储在Property Collection。

    基本方法是采用chatGPT 自动生成商品的特征。

实验(KIMI)

商品定义

商品特征

 KIMI提问:

请给出如下商品的特征参数: “动态随机存取储存器DRAM”,JSON格式输出,格式为 {Property:[{Name:"属性的名称",Value:"属性的值”}]

 KIMI 回答:

{"Property": [{"Name": "类型","Value": "动态随机存取存储器"},{"Name": "容量","Value": "多种容量选项,如1GB, 2GB, 4GB等"},{"Name": "速度","Value": "以兆赫兹(MHz)为单位的速度等级"},{"Name": "时钟周期","Value": "存储器的时钟周期时间"},{"Name": "刷新周期","Value": "必需的刷新间隔时间"},{"Name": "数据访问时间","Value": "CAS延迟时间"},{"Name": "模块类型","Value": "如DIMM, SODIMM, RDIMM等"},{"Name": "电压","Value": "操作电压,如1.5V, 1.35V等"},{"Name": "接口类型","Value": "如DDR, DDR2, DDR3, DDR4等"},{"Name": "散热解决方案","Value": "如散热片安装或无散热片"},{"Name": "端到端可靠性","Value": "如奇偶校验或ECC支持"}]
}

文心一言

提问(商品定义):

请用一句话给出如下商品的定义 “腹膜透析仪和腹膜循环仪”

回答

腹膜透析仪和腹膜循环仪是用于辅助腹膜透析过程,通过机械方式促进腹膜透析液在腹腔内循环与交换,以清除体内代谢废物和多余水分的医疗设备。

 提问(商品特征):

请给出如下商品的特征参数: “动态随机存取储存器DRAM”,JSON格式输出,格式为 {Property:[{Name:"属性的名称",Value:"属性的值”}]

回答

{  "Property": [  {  "Name": "类型",  "Value": "动态随机存取储存器(DRAM)"  },  {  "Name": "数据存储方式",  "Value": "动态存储,需要定期刷新数据以保持信息不丢失"  },  {  "Name": "访问速度",  "Value": "相对较快,适合作为计算机的主存储器"  },  {  "Name": "容量范围",  "Value": "从几兆字节到数百吉字节不等,具体取决于型号和技术"  },  {  "Name": "电压需求",  "Value": "低电压设计,通常在1.2V至1.5V之间"  },  {  "Name": "接口类型",  "Value": "包括DDR, DDR2, DDR3, DDR4, LPDDR等,每种类型具有不同的数据传输速率和功耗"  },  {  "Name": "封装类型",  "Value": "如BGA, TSOP, FBGA等,影响安装和散热性能"  },  {  "Name": "延迟时间",  "Value": "用CAS延迟(CL)等指标衡量,影响数据访问的响应时间"  },  {  "Name": "工作频率",  "Value": "通常以MHz或GHz为单位,影响数据传输速率"  },  {  "Name": "错误检测和纠正",  "Value": "部分DRAM支持ECC(错误纠正码)功能,提高数据完整性和可靠性"  }  ]  
}

 总的来看,使用大语言模型生成商品的描述换比较好,但是产品的特征输出的质量并不高。

源代码(待补充)

浏览

编写一个nodeJS 程序unspscServer.mjs 能够浏览unspsc 的分类和商品Commodity 的特征。

界面
源代码

结束语

       该项目主要研究如何将chatGPT作为一种生产力工具,提高生成结构化数据的生产力方式。

    第一步使用chatGPT 生成商品的描述和数据特征(Properties)。这项工作如果人工完成是非常巨大的工程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1550352.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

胤娲科技:揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

当AI遇上“乔丹打篮球”,真相竟然藏在动画里? 想象一下,你向一位AI大模型轻声询问:“迈克尔・乔丹从事的体育运动是……”几乎在瞬间,它就自信满满地回答:“篮球!” 这一刻,你是否曾…

跨境电商新风尚:一键解锁中国电商的全球代购奇迹

在全球化日益加深的今天,跨境电商成为了连接中国与世界消费者的桥梁,尤其是为国外客户代购中国电商商品的服务,正以一种前所未有的方式改变着国际购物体验。本文将深入探讨跨境电商代购系统的基本功能,揭示其背后的技术魅力与商业…

C#绘制动态曲线

前言 用于实时显示数据动态曲线,比如:SOC。 //用于绘制动态曲线,可置于定时函数中,定时更新数据曲线 void DrawSocGraph() {double f (double)MainForm.readData[12]; //display datachart1.Series[0].Points.Add(f);if (ch…

如何在云端地球建模云平台利用无人机航拍照片进行三维建模?

第一步:导入照片 进入云端地球工作台,选择【场景建模】将航拍的照片组导入。 输入模型名称(若无则无法上传),点击【上传】,将照片上传到云端服务器。 第二步:创建任务 上传成功后点击开始处理…

生成模型常见的条件融合方式

生成模型常见的条件融合方式 目前生成模型主要有4中常见的条件融合方式以实现可控生成:条件归一化层,Decoupled Cross-Attention,self-attention层进行融合,特征值逐元素求和。本文首先介绍下各种方法现,然后进行总结&…

华为云LTS日志上报至观测云最佳实践

华为云LTS简介 华为云云日志服务(Log Tank Service,简称 LTS),用于收集来自主机和云服务的日志数据,通过海量日志数据的分析与处理,可以将云服务和应用程序的可用性和性能最大化,为您提供实时、…

三维立体自然资源“一张图”

随着信息技术的发展,自然资源管理迎来了新的机遇与挑战。在众多技术中,“三维立体自然资源‘一张图’”的概念尤为引人注目。它不仅代表了地理信息科学领域的最新成果,也为自然资源的有效管理和可持续利用提供了强有力的支持。本文将探讨这一…

同元软控受邀出席2024第四届国际自主无人系统大会

9月19-21日,2024第四届国际自主无人系统大会在沈阳召开。辽宁省副省长高涛,沈阳市委副书记、市长吕志成出席并致辞。 本届大会由中国科学院沈阳自动化研究所、国防科技大学、西北工业大学、南京理工大学、中国航空学会共同主办,以“自主无人…

Webpack 特性探讨:CDN、分包、Tree Shaking 与热更新

文章目录 前言包准备CDN 集成代码分包Tree Shaking原理实现条件:解决 treeShaking 无效方案:示例代码: 热更新(HMR) 前言 Webpack 作为现代前端开发中的核心构建工具,提供了丰富的特性来帮助开发者优化和打…

【sw2024】solidworks2024双击setup.exe无反应管理员运行也没反应解决方法

第一步 官网下载xxclean,打开xxclean最新版本,登录。官网xxclean.com或者自己浏览器搜。 第二步 点击扩展功能,点击 运行sw2024安装程序无反应 右边的开始 第三步 进度百分之百之后去双击setup就有界面了。

unix中的exec族函数介绍

一、前言 本文将介绍unix中exec族函数,包括其作用以及使用方法。当一个进程调用fork函数创建一个新进程后,新进程可以直接执行原本正文段的其他内容,但更多时候,我们在一个进程中调用fork创建新的进程后,希望新进程能…

ApiSix 插件开发

版本 3.0.1 创建插件目录和文件 cd ./example/ mkdir -p apisix/plugins cd apisix/plugins touch my_plugin.lua结构如下: 编写脚本 local core require("apisix.core")local plugin_name "my_plugin"local schema {type "obje…

MySQL约束:外键约束

下面先创建两张表用来作为实验样例 1.创建dept表 create table dept(id int auto_increment comment ID primary key,name varchar(50) not null comment 部门名称 ) comment 部门表;INSERT INTO dept (id, name) VALUES (1, 研发部), (2, 市场部), (3, 财务部), (4, 销售部…

基于服务网格的集群访问控制

随着容器化、云原生等概念的火热,越来越多的应用都开始选择支持云原生部署,但是对于大型企业应用来说,各种为服务的拆分会导致集群运维的压力越来越大,尤其是服务之间的安全通信至关重要。 在容器化集群中,传统的基于…

同元软控参展2024超临界二氧化碳动力循环与多能互补系统国际会议

9月20-23日,2024超临界二氧化碳动力循环与多能互补系统国际会议(简称ICSPC2024)在上海召开。会议由中国科学院工程热物理研究所、中国工程热物理学会主办,华北电力大学、西安热工研究院有限公司为联合主办单位。同元软控携核反应堆…

7.3树形查找

7.3.1二叉排序树 1.定义 目的:提供查找删除,插入关键字的速度 二叉排序树的特性: 左子树<根节点<右子树左右字数也分别是一棵二叉树 对二叉排序树进行中序遍历,可以得到一个递增的有序序列 2.二叉排序树的查找 查找从根节点开始,沿分支逐层向下比较的过程 二叉排序…

foxmail登录不了hotmail的解决办法

foxmail登录不了hotmail 由于hotmail的信息安全保护&#xff0c;9.16号就在foxmail登录不了&#xff0c;因为习惯了foxmail&#xff0c;且微软改了验证方式&#xff0c;换要他们的客户端才行&#xff0c;就感觉好麻烦。 在foxmail输入原密码报错 修改验证方式 也是会报错 解决…

第十三届蓝桥杯真题Java c组C.纸张尺寸(持续更新)

博客主页&#xff1a;音符犹如代码系列专栏&#xff1a;蓝桥杯关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ 【问题描述】 在 ISO 国际标准中定义了 A0 纸张的大小为 1189mm 841mm&#…

LLM推理需要多大GPU?背完再去面试

在实际工作中&#xff0c;经常有人问&#xff0c;7B、14B 或 70B 的模型需要多大的显存才能推理&#xff1f;如果微调他们又需要多大的显存呢&#xff1f; 为了回答这个问题整理一份训练或推理需要显存的计算方式。如果大家对具体细节不感兴趣&#xff0c;可以直接参考经验法则…

original多因子图绘制

成品参考 首先导入数据 设置过程 设置X轴 设置图 双击空白部分设置图层宽度&#xff08;也需要设置高度&#xff09; 颜色配置 1.删除边框 合适的参数与颜色&#xff08;设置为单色&#xff09;