大语言模型入门(四)——检索增强生成(RAG)

一、什么是检索增强生成

        检索增强生成(Retrieval-Augmented Generation,RAG)由Facebook AI Research(FAIR)团队于2020年首次提出,这是一种结合了信息检索技术与语言生成模型的人工智能技术。它通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLM),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG技术的优势在于它能够提供更加准确、丰富且符合用户需求的文本内容。它允许开发人员为生成模型提供最新的研究、统计数据或新闻,从而保持信息的时效性和相关性,缓解知识截止问题(模型的知识仅限于训练时的数据)和模型幻觉(模型生成不准确或虚假的信息)。

二、RAG的流程

        RAG的工作流程通常包括以下几个步骤:

        1、检索(Retrieval):根据用户的查询,从预先构建的知识库中检索出相关的信息。这些信息通常被转换成向量形式存储在数据库中,通过计算查询与数据库中向量的相似度来检索最相关的信息。

        2、增强(Augmentation):将检索到的信息与原始查询结合起来,形成增强的提示词,这个增强的提示词包含了查询的上下文信息。

        3、生成(Generation):利用增强的提示词作为输入,大语言模型生成回答或完成特定的语言任务。

三、如何应用RAG

1、Kimi等智能助手

        最直接可以体验RAG优势的就是Kimi智能助手了(也有一些其他的智能助手支持联网),它支持可调节的网络访问,你可以选择让Kimi联网或者不联网响应你的需求,只需要在对话框的左下角点击按钮即可。联网模式下,对于有的需求,Kimi会自动联网搜索并生成回复,而有的需求并不会这样,这取决于上下文以及Kimi的判断逻辑。不过,当你需要它搜索的时候,可以尝试在提示词中强制它联网搜索(虽然有时候会失败):

e125603e03324ded9b4cc7c9d9cf425b.png

2、LangChain

        LangChain 是一个开源框架,用于构建由大型语言模型(LLM)驱动的应用程序。它通过提供工具和抽象,使开发人员能够将语言模型与外部数据源连接,这相当于给LLM配备了一个小型的专属数据库,它可以随时检索数据库中的知识来回答你的问题。LangChain 的工作流程通常包括以下步骤:

  • 用户提出问题。

  • 问题被转换成向量表示,用于在向量数据库中进行相似性搜索。

  • 从向量数据库中提取相关信息块,并将其输入给语言模型。

  • 语言模型生成答案或执行操作。

四、总结

        检索增强生成的概念很简单,复杂的是如何实现检索增强生成的这个流程。目前网上诸多跟LangChain类似的开源解决方案,但其中还有很多细节值得关注。例如,如何最大化压缩存储空间,如何提高检索速度,如何让大模型更好地应用检索到的知识或者信息等等,这些我们后面再逐一探究。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1556443.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

分词的艺术:为AI拆解文本

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

Koa学习

Koa 安装与配置 1. 初始化项目 在终端中执行以下命令: # 创建项目文件夹 mkdir koa cd koa# 初始化并安装依赖 npm init -y npm install koa npm install nodemon --save-dev2. 修改 package.json 在 package.json 文件中进行如下修改: {"type…

LabVIEW提高开发效率技巧----点阵图(XY Graph)

在LabVIEW开发中,点阵图(XY Graph) 是一种强大的工具,尤其适用于需要实时展示大量数据的场景。通过使用点阵图,开发人员能够将实时数据可视化,帮助用户更直观地分析数据变化。 1. 点阵图的优势 点阵图&…

RabbitMQ 集群

文章目录 集群搭建使用 Docker-Compose 镜像队列搭建步骤工作原理镜像策略主从同步 同步延迟 集群搭建 参考: docker中安装并启动rabbitMQ Docker中搭建RabbitMQ集群 使用 Docker-Compose 这里提供一个脚本来使用 docker-compose 完成RabbitMQ集群的配置及启动…

【含开题报告+文档+PPT+源码】基于SSM + Vue的养老院管理系统【包运行成功】

开题报告 随着社会的发展和经济的进步,人口老龄化问题逐渐凸显。统计数据显示,全球范围内的老龄人口比例正在逐年上升,养老需求也随之增长。养老院作为提供专业养老服务的机构,承担着照料老人、提供医疗保健和社交活动等责任。传…

分享量化策略以及股票期货高频行情数据获取

**一、引言**在量化投资的世界中,回测是策略开发的关键环节。通过将策略应用于历史数据,我们可以模拟其表现并作出相应的调整。以下是一些实际案例,帮助我们更好地理解回测的重要性。 二、数据源 银河数据库(yinhedata.com) 提供…

线上线下融合:开启商业新时代

在数字化时代,线上线下融合成为商业发展的重要趋势。 一、全渠道体验 线上线下融合实现了不同渠道无缝连接。如消费者可在实体店试穿后线上购买,线上买的也能在实体店退换货。同时,通过整合数据,为消费者提供个性化服务。像根据购…

【NLP自然语言处理】01-基础学习路径简介

目的:让大家能够在 AI-NLP 领域由基础到入门具体安排: NLP介绍 文本预处理RNN 及其变体(涉及案例)Transformer 原理详解迁移学习 和 Bert 模型详解 (涉及案例)特点: 原理 实践每个文章会有练习…

UART驱动学习二(TTY体系)

目录 一、TTY体系中设备节点的差别1. 傻傻分不清 /dev/tty*2. 要讲历史了2.1 电传机teletype2.2 计算机需要控制2.2.1 使用teletype2.2.2 teletype被淘汰了2.2.3 个人电脑和虚拟终端 3. tty相关设备节点3.1 各类设备节点的差别3.2 /dev/ttyN(N1,2,3,..., 63)3.3 /dev/tty03.4 /…

C语言入门指南:为大一新生准备

C语言入门指南:为大一新生准备 C语言是许多编程语言的基础,许多现代编程语言(如C、Java、Rust等)都从C语言中汲取了灵感。因此,学习C语言不仅能帮助你掌握编程的基本概念,还能为学习其他编程语言打下坚实的…

Android一个APP里面最少有几个线程

Android一个APP里面最少有几个线程 参考 https://www.jianshu.com/p/92bff8d6282f https://www.jianshu.com/p/8a820d93c6aa 线程查看 Android一个进程里面最少包含5个线程,分别为: main线程(主线程)FinalizerDaemon线程 终结者守护线程…

详解正确创建好SpringBoot项目后但是找不到Maven的问题

目录 问题 解决步骤: 找到File->Project Structure... 设置SDK 设置SDKs 问题 刚刚在使用IDEA专业版创建好SpringBoot项目后,发现上方导航栏的运行按钮是灰色的,而且左侧导航栏的pom.xml的图标颜色也不是正常的,与此同时我…

Network - Telnet协议

Telnet 是一种网络协议,允许用户使用基于文本的界面通过网络与远程设备通信。它在早期的网络应用中被广泛用于远程管理和故障诊断,使用户能够连接到远程机器和服务,通常是通过 TCP/IP 网络。 Telnet is a network protocol that allows a use…

详细分析Spring Security OAuth2中的JwtAccessTokenConverter基本知识(附Demo)

目录 前言1. 基本知识2. Demo3. 实战 前言 java框架 零基础从入门到精通的学习路线 附开源项目面经等(超全)【Java项目】实战CRUD的功能整理(持续更新) 1. 基本知识 JwtAccessTokenConverter 是 Spring Security OAuth2 中的一…

如何创建免费版本的ABP分离模块?

由于ABP最近官方大改革,我们打开ABP.IO 官方会发现通过Cli创建模板的时候不能创建Trered类型的了 就是创建一个分层的解决方案,其中Web和Http API层在物理上是分开的。如果不勾选,则创建一个分层的解决方案,它不那么复杂&#xf…

Taipy:AI应用全栈开发神器

Taipy 是一个免费使用的 Python 库,任何具备基本 Python 技能的人都可以使用。它是数据科学家、机器学习工程师和 Python 程序员的得力工具。使用 Taipy,你可以轻松地将数据和机器学习模型转换为功能齐全的 Web 应用程序。在我们生活的瞬息万变的世界中&…

SpringBoot:让开发更加简单

文章目录 前言什么是 SpringBoot快速启动一个 SpringBoot 项目开发一个登录功能小结 前言 有一天,你脑海中闪现了一个想法:“学了 Java 好像还没怎么使用,今天要不用 Java 开发一个自己的网站?” 你想着不禁激动起来,…

棋牌灯控计时计费系统软件免费试用版怎么下载 佳易王计时收银管理系统操作教程

一、前言 【试用版软件下载,可以点击本文章最下方官网卡片】 棋牌灯控计时计费系统软件免费试用版怎么下载 佳易王计时收银管理系统操作教程 棋牌计时计费软件的应用也提升了顾客的服务体验,顾客可以清晰的看到自己的消费时间和费用。增加了消费的透明…

NASA:GES DISC 的 ATMOS L1 光谱和运行日志 V3 (ATMOSL1)大气痕量分子光谱(ATMOS)1 级产品

目录 简介 变量 代码 引用 网址推荐 0代码在线构建地图应用 机器学习 ATMOS L1 Spectra and Runlogs V3 (ATMOSL1) at GES DISC 简介 这是第三版大气痕量分子光谱(ATMOS)1 级产品,包含 netCDF 格式的光谱和运行日志(即 &…

Codeforces Round 977

这场比赛是晚上vp的,太逆天了自己,给我自己都菜笑了,第二题当时差了一个那个循序渐进的点没想到,关键细节都想到了,当时以为是错的就没写,第二题没做出来确实好久没遇到过了,裂开 话不多说&…