两个指令反过来说大模型就理解不了啦?或许该让第三者插足啦 -通过引入中间LLM预处理用户输入以提高多任务处理能力

今天就遇到有点儿dt的问题,利用大模型顺利通了自定义的工具调用(并没有用到tools功能,而是通过prompt强制输出),单个单个的没问题哈,但是多个一起就出现问题了

我说“关闭电脑PC1, 打开第2台电脑” 它看不懂了,但我反过来说“打开第2台电脑,关闭电脑PC1”,它倒是很机智,顺利找到了对应的主机id并调用了正确的工具,反正我是一脸懵逼,这到底是个什么鬼?毕竟是个黑盒,找到原因可能难但问题必须解决撒,只能另辟蹊径(PS这个不是恶作剧,而是一个云桌面的运维后台,我正研究如何利用AI提升效率)

1 问题背景:自然语言指令处理中的困境 

在多任务处理的场景下,用户可能会提出一些包含多个动作的指令,比如:

  • “关闭电脑PC1,打开第2台电脑。”
  • “打开第四台电脑,关闭电脑PC1。”

通过实际测试,发现模型在面对这些复杂指令时,有时无法正确理解和执行所有任务。例如:

  • 当用户要求“关闭电脑PC1,打开第2台电脑”时,模型可能无法正确调用两个工具来分别执行这两个操作。
  • 但当指令顺序被调整为“打开第四台电脑,关闭电脑PC1”时,模型能够正确地按顺序调用工具,并且完成了用户的需求。

这种现象提示我们,模型在解析和执行指令时受到指令语序和结构的影响。因此,我们需要一种方法来更好地解析用户的复杂指令,并将其转换为具体的可执行操作。

2 解决方案:通过 LLM 解析层进行指令分解

为了让 LLM 更好地处理这些复杂的自然语言指令,建议增加一个专门的解析层,用于将原始的自然语言需求转换为多个明确的、可执行的步骤。该解析层可以通过 LLM 来实现,具体功能如下:

1. 分解复杂指令为多个步骤

用户的自然语言指令往往包含多个动作,这些动作有时是并行的,有时是按顺序执行的。通过 LLM 解析层,我们可以将复杂的指令进行拆解。例如:

  • 用户输入:“关闭电脑PC1,打开第2台电脑。”
  • 解析层输出:
    • Step 1: 关闭电脑PC1
    • Step 2: 打开第2台电脑

通过这种方式,每一个步骤都变得更加明确,可以独立执行,并且避免了模型对多个并列任务的混淆。

2. 明确操作类型与对象识别

解析层可以帮助模型更好地理解每个指令中的动词(如“关闭”或“打开”)及其作用对象(如“电脑PC1”或“第2台电脑”)。例如:

  • 用户输入:“打开第四台电脑,关闭电脑PC1。”
  • 解析层输出:
    • Action 1: 打开 -> 电脑PC4
    • Action 2: 关闭 -> 电脑PC1

通过这种明确的操作类型和对象识别,模型可以清晰地理解每个操作需要作用的目标,并根据目标生成正确的操作命令。

3. 处理任务的依赖关系

在复杂的任务环境中,某些操作之间存在依赖关系。例如,可能需要先关闭一台电脑再打开另一台。这时,解析层可以识别这些依赖关系,并为模型生成有序的执行步骤。对于顺序不明的任务,解析层可以判断是否需要并行执行任务,或者是否需要调整任务的顺序。

4. 自然语言转为工具命令

通过解析层,模型可以将复杂的自然语言指令转化为系统所需的结构化工具命令。以关闭和打开电脑为例,经过解析的步骤最终可以生成具体的 API 调用或命令行操作,如:

  • Command 1: 关闭(PC1)
  • Command 2: 打开(PC2)

这种方法将自然语言需求转化为明确的系统命令,使得多任务处理更加高效且可控。

3 实践示例

假设用户发出了如下复杂指令:

  • 用户输入:“请先关闭PC3,然后开启PC1和PC4,最后关掉PC2。”

通过 LLM 解析层,这个复杂的需求可以被拆解为多个明确的任务步骤:

  1. Step 1: 关闭 PC3
  2. Step 2: 开启 PC1
  3. Step 3: 开启 PC4
  4. Step 4: 关闭 PC2

模型再根据这些步骤依次执行任务,或者将并行任务(如开启PC1和PC4)同时处理,最终确保任务按预期完成。

4 如何设计解析层

要设计一个高效的 LLM 解析层,需要注意以下几个关键点:

  1. 鲁棒的指令拆解能力:解析层需要能够理解复杂的自然语言指令,并准确提取出任务的关键动词和作用对象。比如,“关闭”“打开”等动词以及“PC1”“PC4”等对象的识别必须准确无误。

  2. 任务依赖关系的识别:解析层必须能够处理任务之间的依赖关系,确保前后顺序的合理性。在需要时,能够区分并行任务与串行任务。

  3. 应对模糊指令的能力:用户的自然语言可能包含模糊表达,如“打开所有电脑”,解析层需要能够处理这种模糊需求,推理出上下文中的具体执行对象。

  4. 灵活性与适应性:解析层还需要能够应对不同领域的任务需求,具有足够的灵活性来解析不同语境下的指令。

5 总结

通过增加一个 LLM 解析层,可以极大提高多任务处理场景中指令解析的准确性和执行效率。它不仅可以将复杂的自然语言指令拆解为多个明确的操作步骤,还能够根据任务间的依赖关系调整顺序,生成具体的工具命令,确保任务的正确执行。

新的一天开始了,倒杯茶就开始上班吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/144491.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

安卓实现导入Excel文件

使用简化版的jar包 api files(libs/poi-3.12-android-a.jar) api files(libs/poi-ooxml-schemas-3.12-a.jar) 导入遇到了两个兼容问题 1.build.gradle文件里面 android { 要添加 packagingOptions {exclude META-INF/INDEX.LIST } 2.加载大文件要在清单文件里面加androi…

网络变压器HR911130C的使用注意点

HR911130C的使用,需要2个注意点: 1)数据线data0、data2、data3是相邻的引脚,但是data1是 不相邻的两个引脚,注意看下面的电路图,所以绘图时需要注意 2)LED灯的连接 11脚、12脚,连…

快手可灵AI全球升级1.5模型:引入“运动笔刷”功能 画质大幅提升

9月19日,快手公司宣布其可灵AI模型进行了全球范围内的重磅升级,推出了1.5版本。新版本在多个方面实现了显著提升,包括视频画质、动态效果、美学表现、运动合理性以及语义理解等。 新升级的1.5模型支持在高品质模式下直接输出1080p高清视频&am…

【CSS】一行三个盒子 每个盒子都是16:9

padding-top 属性接受百分比值时,其百分比是基于父元素的宽度来计算的,而不是自身元素的宽度 aspect-ratio 更方便&#xff0c;但存在兼容性问题 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name&quo…

字符设备驱动 — 4 异常与中断

异常与中断 中断属于异常的一种 异常会直接打断 CPU 的运行&#xff0c;而各种中断会被传到中断控制器&#xff0c;由中断控制器来选择优先级最高的中断并通知 CPU 处理流程 arm 对异常&#xff08;中断&#xff09;处理流程&#xff1a; 初始化&#xff1a; 设置中断源&…

水经微图PC版5.0.0即将内测

让GIS更简单高效&#xff01; 水经微图&#xff08;以下称“微图”&#xff09;PC版5.0.0即将内测&#xff0c;这是一个基于WeMapEngine开发的全新版本。 关于什么是WeMapEngine&#xff0c;请从《WeMapEngine可快速构建的GIS应用功能》一文中了解。 微图5.0.0功能界面 水经…

【分享】“可恶”的运算放大器电容负载

他们说如果使用放大器驱动电容负载(图 1、CLOAD)&#xff0c;一个不错的经验是采用一个 50 或 100 欧的电阻器 (RISO) 将放大器与电容器隔开。这个附加电阻器可能会阻止运算放大器振荡。 图 1.支持电容负载的放大器可能需要在放大器输出与负载电容器之间连接一个电阻器。 使用…

STM32—I2C通信外设

1.I2C外设简介 STM32内部集成了硬件I2C收发电路&#xff0c;可以由硬件自动执行时钟生成、起始终止条件生成、应答位收发、数据收发等功能&#xff0c;减轻CPU的负担支持多主机模型&#xff08;可变多主机&#xff09;支持7位/10位地址模式&#xff08;11110......)支持不同的通…

JavaWeb JavaScript 11.XML —— 配置文件

生活想埋没我&#xff0c;没想到我是颗种子 —— 24.9.19 一、XML 1.什么是XML XML是EXtensible Markup Languge的缩写&#xff0c;翻译过来就是可扩展标记语言。所以很明显&#xff0c;XML和HTML一样都是标记语言&#xff0c;也就是说它们的基本语法都是标签 可扩展 三个字…

OpenCV基础入门30讲(Python)——第二讲 图像色彩转换

常见的几种颜色类型介绍 1、彩色图像&#xff08;Color Image&#xff0c;BGR&#xff09; 数据类型&#xff1a;uint8通道数&#xff1a;3&#xff08;BGR&#xff1a;蓝色、绿色、红色&#xff09;描述&#xff1a;彩色图像有三个通道&#xff0c;每个通道的值范围是 0 到 …

【图书推荐】《Autodesk Inventor 2024入门与案例实战(视频教学版)》

本书重点 配套示例文件、PPT课件、教学视频、电子教案、课程标准、骄婿大纲、模拟试题、作者微信群答疑服务。 内容简介 《Autodesk Inventor 2024入门与案例实战&#xff1a;视频教学版》以Autodesk Inventor 2024为平台&#xff0c;重点介绍Autodesk Inventor 2024中文版的…

洗衣机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型

洗衣机制造业作为传统制造业的重要组成部分&#xff0c;通过引入5G智能工厂物联数字孪生平台&#xff0c;加速推进自身的数字化转型进程。这一创新模式不仅极大地提升了生产效率&#xff0c;还深刻改变了产品的设计、生产、管理及运维流程&#xff0c;为行业带来了前所未有的竞…

[数据集][目标检测]手机识别检测数据集VOC+YOLO格式9997张1类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;9997 标注数量(xml文件个数)&#xff1a;9997 标注数量(txt文件个数)&#xff1a;9997 标注…

saltstack企业实战

saltstack官网最新文档 saltstack架构设计 saltstack 高可用方案&#xff1a;Salt官网是有 HARebalance minion配置里写多个master地址 failover&#xff08;syndic&#xff09; 架构 操作系统&#xff1a;CentOS7.6salt版本&#xff1a;3000.3 多master https://www.cn…

【贪心算法】贪心算法一

贪心算法一 1.柠檬水找零2.将数组和减半的最少操作次数3.最大数4.摆动序列 点赞&#x1f44d;&#x1f44d;收藏&#x1f31f;&#x1f31f;关注&#x1f496;&#x1f496; 你的支持是对我最大的鼓励&#xff0c;我们一起努力吧!&#x1f603;&#x1f603; 1.柠檬水找零 题目…

【2023工业异常检测文献】SimpleNet

SimpleNet:ASimpleNetworkforImageAnomalyDetectionandLocalization 1、Background 图像异常检测和定位主要任务是识别并定位图像中异常区域。 工业异常检测最大的难题在于异常样本少&#xff0c;一般采用无监督方法&#xff0c;在训练过程中只使用正常样本。 解决工业异常检…

无人机黑飞打击技术详解

随着无人机技术的普及&#xff0c;无人机“黑飞”&#xff08;未经授权或违反规定的飞行&#xff09;现象日益严重&#xff0c;对公共安全、隐私保护及重要设施安全构成了严重威胁。为有效应对这一挑战&#xff0c;各国政府和安全机构纷纷研发并部署了一系列无人机黑飞打击技术…

光控资本:沪指涨0.59%,酿酒板块大幅拉升,数字货币概念等活跃

19日早盘&#xff0c;两市首要指数全线拉升&#xff0c;深证成指、创业板指涨约1%&#xff1b;场内超4800股飘红。 截至午间收盘&#xff0c;沪指涨0.59%报2733.38点&#xff0c;深证成指涨1.25%&#xff0c;创业板指涨0.99%&#xff0c;两市估计成交4263亿元。 盘面上看&…

C++ 9.19

练习&#xff1a;要求在堆区申请5个double类型的空间&#xff0c;用于存储5名学生的成绩。请自行封装函数完成 1> 空间的申请 2> 学生成绩的录入 3> 学生成绩的输出 4> 学生成绩进行降序排序 5> 释放申请的空间 主程序中用于测试上述函数 #include<ios…

google map小叉号不显示

背景需求 需要在uniapp中接入google地图,研究了一番,都没有找到合适的,现在说一下教程。 效果图 前期工作 这两点缺一不可,否则你啥也看不到。 1、电脑安装L-O-U梯 用于访问G-OO-G-LE的API或者创建google map key。 2、手机安装L-O-U梯 用于显示google地图。我就是手…