基于自动反馈的大语言模型纠错策略综述

本文“Automatically Correcting Large Language Models: Surveying the landscape of diverse self-correction strategies”主要探讨了大语言模型(LLMs)的自我纠正策略,具体内容如下:

  1. 引言
    • LLMs的发展与问题:LLMs在NLP任务中表现出色,但存在如幻觉、推理不忠实、生成有害内容和不遵循规则等问题,这些问题阻碍了其在实际中的应用。
    • 自我纠正策略的兴起:为解决这些问题,一种流行的策略是让LLMs从反馈中学习,其中利用自动化反馈的自我纠正方法备受关注,因为它能减少对人工反馈的依赖,使基于LLM的解决方案更实用。
  2. 自动反馈纠正LLMs的分类法
    • 概念框架:提出了一个概念框架,将纠正LLMs的过程类比为医疗过程,涉及语言模型(患者)、评论模型(医生和诊断)和优化模型(治疗)三个部分。并基于此框架,从五个关键维度对现有方法进行分类,包括纠正的问题、反馈的来源和格式、反馈的使用时间以及如何用反馈纠正模型。
    • 具体分类
      • 纠正的问题:主要包括幻觉、推理不忠实、有毒有害内容和代码缺陷等四类错误。
      • 反馈的来源:分为人类反馈和自动化反馈,本文重点关注自动化反馈,其又可分为自反馈(来自LLM自身)和外部反馈(来自外部模型、工具或知识源)。
      • 反馈的格式:通常为标量值信号或自然语言,标量值反馈便于集成到训练/解码过程,但信息性较弱;自然语言反馈表达力更强,但收集难度较大。
      • 反馈的使用时间:分为训练时纠正、生成时纠正和事后纠正。训练时纠正理想但受限于实际情况;生成时纠正可在生成过程中利用反馈引导模型;事后纠正灵活性高,能利用自然语言反馈,增强解释性。
      • 用反馈纠正模型的方式:包括自我训练、生成后排序、反馈引导解码等多种具体策略,将在后续章节详细介绍。
  3. 训练时纠正
    • 从人类反馈中学习
      • 直接优化人类反馈:通过收集人类对模型输出的反馈,直接优化模型参数,但仅使用正数据进行微调可能限制模型识别和纠正错误的能力。
      • 奖励建模和RLHF:训练奖励模型来模拟人类反馈,然后使用强化学习算法优化模型,如RLHF及其变体在使LLMs更有益和减少有害性方面已被证明有效。
    • 利用自动化反馈学习
      • 外部指标指导:利用外部指标提供的反馈进行训练时纠正,多数方法采用非可微训练技术,如最小风险训练等,但可能导致模型对某些指标的鲁棒性不足。
      • 自我训练:利用语言模型自身的输出来提供反馈,如STaR、Huang等人的研究,通过选择正确答案的推理路径进一步微调LLM,或采用批判-修订-监督学习策略来减少有害响应,还有如AlpacaFarm、ReST等研究展示了LLMs通过自我训练实现自我改进的能力。
  4. 生成时纠正
    • 生成后排序:LLM生成多个候选输出,评论模型根据反馈选择最佳输出,常与思维链提示法结合用于复杂推理任务,不同作品中提出了多种评论模型,如DIVERSE、Weng等人、RR、LEVER、CodeT等。
    • 反馈引导解码:为解决生成后排序的局限性,该策略在生成过程中利用步级反馈提供细粒度指导,通过评论模型在每个推理步骤提供反馈,采用搜索算法引导解码过程,相关作品在获取评论模型的方法上有所不同,包括使用人类反馈、训练验证器、外部指标、外部知识和自我评估等,同时采用不同策略控制解码过程,如Tree-of-Thought采用广度优先搜索和深度优先搜索,GRACE和Xie等人采用波束搜索,CoRe和RAP采用蒙特卡洛树搜索。
  5. 事后纠正
    • 自我纠正:使用LLM生成反馈并改进自身输出,如Self-Refine、Clinical Self-Verification、Reflexion等研究,此策略对模型能力要求较高,较小的开源模型可能难以有效改进输出,SelFee提出通过训练模型模拟自我纠正过程。
    • 模型/工具作为反馈
      • 代码解释器:在代码生成中,常用程序执行器作为反馈源来改进初始代码,如Self-Edit、Self-Debug、ALGO等研究,还用于软件的形式验证。
      • 逻辑推理器:如Logic-LM和Baldur利用外部工具增强LLMs推理的准确性,通过将问题转换为逻辑形式并使用外部符号求解器进行推理,或利用现有搜索证明助手作为反馈源。
      • 外部知识:外部知识可用于检测和修正LLM输出中的事实性错误,如RARR、REFEED、LLM-Augmenter、FACTOOL等研究,通过检索证据来调查和修正输出。
      • 训练模型:微调专门的模型用于生成反馈,如CodeRL、REFINER、RL4F等研究,这些批评模型可与其他语言模型配对,在迭代优化循环中提供反馈。
      • 集成多种工具:CRITIC将多种工具集成在统一框架中,提供更全面的反馈。
    • 多智能体辩论:多个LLM实例相互提出和辩论各自的回答,以得出共同的最终答案,如Du等人、PRD、LM vs LM、Fu等人的研究,此方法在推理任务、检测事实性错误和模拟现实任务等方面具有应用潜力。
  6. 应用领域
    • 事实性纠正:许多自动化纠正策略可用于事实性检测和纠正,是LLM-based事实纠正或检查系统的基础。
    • 推理任务:LLMs在推理任务中需要识别和纠正中间推理错误,现有方法包括基于LLM的辩论技术和自优化技术,以及利用外部反馈的技术,但在更广泛的推理任务中的应用仍有待探索,尤其是归纳和溯因推理。
    • 代码合成:代码生成中纠正至关重要,LLMs可通过读取编译器错误等反馈进行自我纠正,也有研究利用更细粒度的反馈,如程序解释和与参考程序比较,但自我修复在反馈阶段存在瓶颈,且关于其在不同模型中的适用性存在疑问。
    • 其他应用
      • 开放式生成:用于纠正生成文本的主观质量,如有毒/有害输出、增强故事生成的叙事质量和优化对话中的回复生成,常依赖自然语言反馈和迭代优化策略。
      • 机器翻译:事后自我纠正概念在机器翻译中称为自动后期编辑(APE),已有多种方法用于训练模型修复翻译错误,包括学习人类校正数据或合成训练数据,以及利用LLMs的上下文学习能力进行后期编辑,同时训练时和解码时的纠正方法也被采用。
      • 总结:自动化模型纠正常用于确保生成摘要的事实性,包括训练时施加事实性约束和事后编辑纠正错误,近期研究还探索了使用强化学习来优化模型。
  7. 研究空白与未来方向
    • 理论依据:LLMs的自我纠正能力缺乏理论解释,未来研究可探索其与元认知意识和校准的关系,以及反馈信号整合与语言模型对齐的问题,包括如何有效生成提示指令等。
    • 自我纠正能力的测量:当前缺乏定量指标来理解和评估LLMs的自我纠正能力,未来需建立全面的评估框架和诊断基准,考虑任务复杂性、初始错误程度和自我纠正后的质量改进等因素。
    • 持续自我改进:LLMs在实际应用中需要持续自我改进,类似于持续学习,但目前自我训练研究集中于单次纠正,持续自我改进的稳定性和鲁棒性未知,未来可探索如何整合不同的自我纠正技术,如利用事后纠正收集训练数据,指导训练时纠正。
    • 结合模型编辑的自我纠正:模型编辑技术可实现细粒度纠正,避免大规模重新训练,将其纳入LLM自我纠正过程是未来研究方向,有助于理解自我纠正机制和减少副作用。
    • 多模态自我纠正:现有自我纠正策略多限于文本模态,未来可探索多模态LLMs的自我纠正能力,包括视觉反馈的纳入和通过自我纠正改进视觉-语言任务,但目前在多模态环境中的应用还不广泛,需深入理解其在不同模态中的通用性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/18892.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

视频智能分析软件LiteAIServer视频智能分析平台玩手机打电话检测算法

在当今这个数字化时代,智能手机已成为我们日常生活中不可或缺的一部分,它极大地便利了我们的沟通与学习。然而,当这份便利被不恰当地带入到如工厂生产线、仓库以及学校课堂等特定的工作和学习环境中时,其潜在的危害便逐渐显露出来…

【pytest】pytest注解使用指南

前言:在 pytest 测试框架中,注解(通常称为装饰器)用于为测试函数、类或方法提供额外的信息或元数据。这些装饰器可以影响测试的执行方式、报告方式以及测试的组织结构。pytest 提供了多种内置的装饰器,以及通过插件扩展…

gvim添加至右键、永久修改配置、放大缩小快捷键、ctrl + c ctrl +v 直接复制粘贴、右键和还原以前版本(V)冲突

一、将 vim 添加至右键 进入安装目录找到 vim91\install.exe 管理员权限执行 Install will do for you:1 Install .bat files to use Vim at the command line:2 Overwrite C:\Windows\vim.bat3 Overwrite C:\Windows\gvim.bat4 Overwrite C:\Windows\evim.bat…

一文快速掌握 AMD FPGA IO约束 常用电平标准

FPGA开发中IO约束是不可缺少的部分,正确的电平约束是确保电路稳定运行与兼容性的关键所在。 今天分享下IO约束中常用的电平标准,帮助大家快速理解和掌握。 一、 LVTTL系列 LVTTL全称为Low - Voltage Transistor - Transistor Logic,是一种…

没钱买KEGG怎么办?REACTOME开源通路更强大

之前搜集免费生物AI插图时简单提到了通路数据库Reactome(https://reactome.org/), 那些精美的生物插图只能算是该数据库附赠的小礼品,他的主要功能还是作为一个开源的通路数据库,为相关领域的研究者提供直观的可视化生…

ubuntu显示管理器_显示导航栏

ubuntu文件管理器_显示导航栏 一、原始状态: 二、显示导航栏状态: 三、原始状态--->导航栏状态: 1、打开dconf编辑器,直接在搜索栏搜索 dconf-editor ------如果没有安装,直接按流程安装即可。 2、进入目录:org …

mysql的基本操作

各位小伙伴们,好久不见呀!最近博主也因为个人原因,实在是太忙,才导致最近的文章一直没更新,当然本篇文章依旧还是会给大家带来知识点的学习,闲话少叙,我们直接进入正题。 目录 数据库的创建及使…

6.k8s:devops

目录 一、devOps整体流程 二、GitLab 1.GitLab安装 2.GitLab基础配置 (1)修改密码 (2)不启用头像 (3)关闭用户注册功能 (4)开启webhook外部访问 (5) 设置中文 3.配置secret 4.卸载gitlab 三、Harbor镜像仓库 1.安装好docker-compose 2.安装harbor 四、…

分布式IO模块:智慧楼宇的“智慧眼”与“智慧手”

在现代化的城市建设中,智慧楼宇作为一种集成了建筑、通信、计算机和控制等多方面技术的新型建筑,正逐渐成为城市发展的重要驱动力。智慧楼宇不仅提高了建筑设备的运行效率,降低了能源消耗,还提供了更加安全、舒适和便捷的生活办公…

【IOS】编译缓存错误Library/Caches/com.apple.mobile.installd.staging

项目场景: xcode ios 问题描述 Failed to load Info.plist from bundle at path /var/installd/Library/Caches/com.apple.mobile.installd.staging/temp.FOrCHQ/extracted/xxxxModule_Example.app/Frameworks/Foundation.framework; Extra info about "/va…

ARM64环境部署EFK8.15.3收集K8S集群容器日志

环境规划 主机IP系统部署方式ES版本CPU架构用户名密码192.168.1.225Ubuntu 22.04.4 LTSdockerelasticsearch:8.15.3ARM64elasticllodyi4TMmZD ES集群部署 创建持久化目录(所有节点) mkdir -p /data/es/{data,certs,logs,plugins} mkdir -p /data/es/certs/{ca,es01}服务器…

【网络安全 | 漏洞挖掘】邮件HTML注入

文章目录 Email 中的 HTML 注入漏洞漏洞挖掘过程1. 初步信息收集2. 发现私信功能3. 功能测试与 HTML 注入测试测试步骤请求拦截与分析4. 绕过防护机制绕过方法附加威胁漏洞影响漏洞报告与奖励Email 中的 HTML 注入漏洞 HTML 注入是一种安全漏洞,攻击者通过将任意 HTML 标签注…

《自定义类型:结构体》

1. 结构体回顾 结构体的声明 结构体的初始化 2. 结构体的特殊声明 匿名结构体: 不需要给结构体名字,但是只能使用一次。 这里的使用一次具体是什么意思呢,刚开始学的时候我自己的理解是有误解的,下面给出一个示例; 注意&…

基于Java Springboot城市公交运营管理系统

一、作品包含 源码数据库设计文档万字PPT全套环境和工具资源部署教程 二、项目技术 前端技术:Html、Css、Js、Vue、Element-ui 数据库:MySQL 后端技术:Java、Spring Boot、MyBatis 三、运行环境 开发工具:IDEA/eclipse 数据…

【杂谈】无人机测绘技术知识

无人机测绘技术知识 随着科技技术的不断进步和低空经济的快速推进,无人机技术已经从最初的军事侦察、航拍娱乐,逐渐深入到各个行业领域,其中无人机测绘技术(航空摄影测量)更是凭借其高效、精准、灵活的特性&#xff0…

数据挖掘复习

一、绪论 分类 classify 上涨或跌 回归 regression 描述具体数值 分类模型评估 1.混淆(误差)矩阵 confusion matrix 2.ROC曲线 receiver operating characteristic curve 接收者操作特征曲线 3.AUC面积 area under curve ROC曲线下与坐标轴围成的面…

Springboot 整合 Java DL4J 构建股票预测系统

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…

ZSTD 内存泄漏问题

优质博文:IT-BLOG-CN Zstandard(简称zstd)是一种无损压缩算法,由Facebook开发并开源。它旨在提供高压缩比和高解压速度的平衡,适用于多种数据压缩需求。 特点 【1】高压缩比: zstd能够在保持较高压缩比的…

嵌入式硬件电子电路设计(五)LDO低压差线性稳压器全面详解

引言: LDO(Low Dropout Regulator,低压差线性稳压器)是一种常用的电源管理组件,用于提供稳定的输出电压,同时允许较小的输入电压与输出电压之间的差值。LDO广泛应用于各种电子设备中,特别是在对…

D3基础:绘制圆形、椭圆形、多边形、线、路径、矩形

在D3.js中&#xff0c;可以通过SVG元素来创建各种几何图形。以下是D3.js中常用的几何图形及其简单的创建方法&#xff1a; 1. 圆形 (Circle) 圆形是最基本的形状之一&#xff0c;可以通过<circle>标签来创建。 <!DOCTYPE html> <html> <head><met…