RoNID:通过生成可靠标签与聚类友好型表征来实现新意图的发现

论文地址:https://arxiv.org/abs/2404.08977

原文地址:intents-are-not-going-away-ronid-is-a-new-intent-discovery-framework

2024 年 4 月 26 日

Robust New Intent Discovery(RoNID)框架致力于在开放域场景中识别已知意图并合理推断新意图组。

问题

传统的聊天机器人系统严重依赖意图。意图完全基于预先定义的(通常是经过深思熟虑的)假设,即用户想要进行的对话。

因此,传统意图的能力有限,只能识别预定义和受限的意图类别。解决聊天机器人这一问题的尝试包括域外检测和知识库回退,这些方法最近已演变成 RAG 方法。

新的用户意图不断从面向客户的实施中出现,这些新意图通常来自向组织引入的新产品和服务。或者系统故障、产品缺陷或产品或服务上线问题等等。

这些新的意图需要动态地发现和聚集。 RoNiD 旨在创建一个框架,其中通过弱监督包括 RLHF,在该框架中识别新意图并确认伪标签。

介绍

该研究的重点是建立可靠的伪标签并获得聚类友好的判别表示。

使用的两个模型是:

  1. 可靠的伪标签生成模块
  2. 聚类友好的表示学习模块。

文本描述了一个名为 RoNID 的过程,它生成可靠的合成标签和聚类友好的表示。

简单来说,这意味着 RoNID 创建准确的标签并以更易于理解的方式组织数据。这是通过两个主要步骤完成的:

标签生成

RoNID通过解决特定问题为数据分配准确的标签;这有助于为进一步分析提供明确的指导。

表征学习

RoNID 组织数据,以便相似的项目被分组在一起(聚类紧凑性),而不同的组被很好地分开(聚类间分离)。此步骤可以更轻松地查看数据中的模式和差异。

通过重复这些步骤,RoNID 创建了一个具有准确标签和组织良好的数据的可靠模型。测试表明,该方法大大优于以前的技术,在各种基准测试中将结果提高了 1 到 4 个点。

意图与对话

准确理解和识别用户意图对于下游面向任务的对话系统非常重要,它直接影响用户体验。如果意图识别不正确,则呈现给用户的对话流与用户的意图不匹配。

随后,用户试图从一个流程转移到另一个流程;如果没有计划好这种转移,用户会感到更加沮丧。

Out-Of-Domain

上面的场景(a)展示了已知意图和新意图是如何被分组的。而场景(b)展示了RoNID方法,其中已知意图和新的/未知的意图是基于可靠的伪标签和聚类表征被分离的。

NID

半监督 NID 通常采用 k-means 算法进行伪标签分配并学习判别意图特征。

RoNID 框架通过在一个步骤中解决特定问题来获得可靠的伪标签,在另一个步骤中,它通过组合不同类型的损失来学习以一种易于理解的方式组织数据。

最后

在这项研究中,研究人员引入了针对 NID 问题的 EM-optimised RoNID 框架。它由两个主要部分组成:可靠的伪标签生成模块和聚类友好的表示学习模块。

伪标签生成模块通过解决特定问题分配精确的伪标签来确保准确的监督。表示学习模块通过关注簇内和簇间差异来提高表示的质量。这有助于区分已知意图和新意图。

他们的实验表明 RoNID 是有效的,并且比以前最先进的方法表现得更好。

RoNID 使用迭代方法通过创建可靠的伪标签并将数据组织到集群中来提高模型性能。

该方法包括三个主要步骤:

  1. 首先,使用标记和未标记数据预训练特征提取器,以实现更好的知识迁移。
  2. 然后,通过解决特定问题来提高伪标签的准确性。
  3. 最后,引入簇内和簇间对比学习,为已知和新颖的意图创建不同的表示簇。

为了给表示学习模块提供高质量的监督信号,该研究提出生成可靠的伪标签来指导模型训练,从而将无监督训练样本转化为伪监督样本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1410336.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

韩国云主机安装AMP环境要求科普

AMP环境,即Apache、MySQL和PHP的组合,是许多网站开发者和运维人员常用的环境配置。在韩国云主机上安装AMP环境,需要满足一定的要求以确保顺利运行和高效性能。下面我们将对韩国云主机安装AMP环境的要求进行科普。 首先,韩国云主机…

Vue Canvas图片水印的绘制 图片加水印

效果 定义画布 <canvas width"800" height"800" ref"cn" ></canvas>绘制水印 draw(){const img new Image()img.srchttps://img1.baidu.com/it/u3035183739,1826404114&fm253&fmtauto&app138&fJPEGimg.onload(()…

java版数据结构:深入理解栈和队列:数据结构与应用(vector,stack,queue)

目录 前言 动态数组类&#xff08;vector&#xff09; 特点&#xff1a; 应用&#xff1a; 栈&#xff08;Stack&#xff09; 栈的基础概念&#xff1a; 栈的常用方法&#xff1a; 模拟栈操作&#xff1a; 队列&#xff08;Queue&#xff09; 队列的基础概念 队列的常…

20240502给NanoPi的NEO core开发板编译移远的4G模块的上网程序quectel-CM

20240502给NanoPi的NEO core开发板编译移远的4G模块的上网程序quectel-CM 2024/5/2 16:29 1、默认编译为AMD64/INTEL的x64架构的可执行文件&#xff1a; rootrootrootroot-ThinkBook-16-G5-IRH:~$ rootrootrootroot-ThinkBook-16-G5-IRH:~$ unzip Quectel_QConnectManager_Lin…

如何配置和使用Apollo的component里的plugin

关于如何使用Apollo的Component里的plugin&#xff0c;在Apollo的文档里只有如果和开发的说明却没有找到一个清楚完整说明怎么把plugin跑起来的说明&#xff0c;例如我想把lidar_detection_filter按我们的需求对目标过滤算法作修改然后编译完后&#xff0c;执行 cyber_launch …

2024年【浙江省安全员-C证】考试及浙江省安全员-C证找解析

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2024年【浙江省安全员-C证】考试及浙江省安全员-C证找解析&#xff0c;包含浙江省安全员-C证考试答案和解析及浙江省安全员-C证找解析练习。安全生产模拟考试一点通结合国家浙江省安全员-C证考试最新大纲及浙江省安全…

12 Junit单元测试、反射、注解

单元测试 介绍 Junit单元测试是做什么的&#xff1f; 就是针对最小的功能单元(方法)&#xff0c;编写测试代码对其进行正确性测试。 Junit单元测试框架 可以用来对方法进行测试&#xff0c;它是由Junit公司开源出来的 Junit单元测试的优点是什么&#xff1f; 可以灵活的…

智能消费记账|基于SSM+vue的大学生智能消费记账系统(源码+数据库+文档)

智能消费记账目录 基于SSMvue的大学生智能消费记账系统 一、前言 二、系统设计 三、系统功能设计 1 用户列表 2 预算信息管理 3 预算类型管理 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍&#xff1…

JavaScript百炼成仙自学笔记——3

外门小比 JavaScript运算符 var a 10; var b 2; var s1 a b; var s2 a - b; var s3 a * b; var s4 a / b; var a 10; var b a; var console.log(b); 同理还有a&#xff0c;就是先对a本身进行运算&#xff0c;然后再用a的值 var a 1; var b; var sum (b a--a) a--…

【Excel】excel连接数字和符号

使用“&”对数字和符号进行连接 示例&#xff1a; 将“2.6”和“&#xff0c;”连成“2.6&#xff0c;” 连接公式为&#xff1a; V3&W3 V3和W3分别是"2.6"和“&#xff0c;”在excel中的位置

Word文件导出为PDF

Word文件导出为PDF 方法一、使用Word自带另存为PDF功能 打开需要转换为PDF格式的Word文件&#xff0c;依次点击【文件】➡【另存为】➡选择文件保存类型为.PDF 使用这种方法导出的PDF可能存在Word中书签丢失的情况&#xff0c;在导出界面点击&#xff0c;选项进入详细设置 勾…

ICode国际青少年编程竞赛- Python-1级训练场-for循环入门

ICode国际青少年编程竞赛- Python-1级训练场-for循环入门 1、 for i in range(4):Dev.step(4)Dev.turnLeft()2、 for i in range(3):Dev.step(6)Dev.turnRight()3、 for i in range(3):Dev.turnRight()Dev.step(2)Dev.turnLeft()Dev.step(-3)4、 for i in range(4):Dev…

GPT-1

GPT 系列是 OpenAI 的一系列预训练模型&#xff0c;GPT 的全称是 Generative Pre-Trained Transformer&#xff0c;顾名思义&#xff0c;GPT 的目标是通过 Transformer&#xff0c;使用预训练技术得到通用的语言模型。目前已经公布论文的有 GPT-1、GPT-2、GPT-3。 最近非常火的…

数据结构学习/复习4--链表的实现/链表练习题/二级指针与一级指针在链表实现中的运用

一、链表的实现&#xff08;写法不唯一&#xff0c;此处多处用二级指针&#xff09; 二、链表实现总结 1.二级指针存储一级指针 2.改变一级指针需要用到二级指针&#xff0c;本次使用二级指针进行修改 注意写法不唯一&#xff0c;也有不用二级指针写法 3.链表的结构体(节点)内…

第13章 软件测评相关标准

一、标准化概述 &#xff08;一&#xff09;概念 1、标准 一定范围内获得最佳秩序&#xff0c;经协商一致并由公认机构批准共同使用和重复使用的一种规范性文档&#xff0c;是标准化活动的核心产物。 2、标准化 一定范围内获得最佳秩序&#xff0c;对现实问题和潜在问题制…

ShellScript脚本编程(一)

什么是Shell Shell 是一个用 C 语言编写的程序&#xff0c;它是用户使用 Linux 的桥梁。Shell 既是一种命令语言&#xff0c;又是一种程序设计语言 Shell 是指一种应用程序&#xff0c;这个应用程序提供了一个界面&#xff0c;用户通过这个界面访问操作系统内核的服务 为什么…

基于Spring Boot的校园疫情防控系统设计与实现

基于Spring Boot的校园疫情防控系统设计与实现 开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/idea 系统部分展示 管理员登录首页界面图&#xff0c;管理员进入校园疫…

数据分析:基于DESeq2的转录组功能富集分析

介绍 DESeq2常用于识别差异基因&#xff0c;它主要使用了标准化因子标准化数据&#xff0c;再根据广义线性模型判别组间差异&#xff08;组间残差是否显著判断&#xff09;。在获取差异基因结果后&#xff0c;我们可以进行下一步的富集分析&#xff0c;常用方法有基于在线网站…

## CSDN创作活动:缓解工作压力:程序员的健康之道

缓解工作压力&#xff1a;程序员的健康之道 在当今快节奏的社会中&#xff0c;程序员作为一个高度专业化和技术密集的群体&#xff0c;往往需要面对持续的工作压力和创新挑战。在如此高强度的工作环境下&#xff0c;如何有效缓解工作压力&#xff0c;保持工作效率和个人健康成…

Java线程池的七大参数说明

线程池中的七大参数如下&#xff1a; &#xff08;1&#xff09;corePoolSize&#xff1a;线程池中的常驻核心线程数。 &#xff08;2&#xff09;maximumPoolSize&#xff1a;线程池能够容纳同时执行的最大线程数&#xff0c;此值大于等于1。 &#xff08;3&#xff09;keepAl…