一些优化RAG思路

一些优化RAG思路

lang/2024/9/20 20:18:35/文章来源:https://blog.csdn.net/qq_40244755/article/details/142389579

什么是RAG

RAG 是预训练的 LLM 与外部（可搜索的）知识库的组合。在推理时，我们可以在此知识库中搜索相关的文本上下文，并将其添加到 LLM 的提示词中。然后，LLM 可以使用其上下文学习能力来利用这个添加的上下文并产生更真实/更扎实的输出。

RAG步骤

加载文件
读取文本
文本分割
文本向量化
问句向量化
在文本向量中匹配出与问句向量最相似的 top k 个
匹配出的文本作为上下文和问题一起添加到 prompt 中
提交给 LLM 生成回答

这种简单的方法有效，但构建高性能的 RAG 应用程序需要更多。以下是我们可以通过几种途径来完善我们的 RAG。

优化RAG

读取文本，额可以对文本做一些处理，用于 RAG 的数据可能来自不同格式的多个来源（例如 pdf、markdown 等），这可能会导致噪声（例如，徽标、图标、特殊符号和代码块）从而使 LLM 感到困惑。我们可以通过创建数据预处理(NLP)来解决这个问题。
文本切割：设置适当的块间重叠、多粒度文档块切分、基于语义的文档切分、文档块摘要。
在检索阶段使用混合搜索：归根结底，RAG 的检索组件只是一个搜索引擎。因此，我们可以通过使用搜索中的想法来大幅改进检索。例如，我们可以执行词法和向量检索（即混合检索），以及通过重排模型重新排序以检索最相关的数据。
提示工程：优化模板增加提示词约束、提示词改写
数据收集：我们部署了 RAG 应用程之后序，我们就可以开始收集可用于改进应用程序的数据。例如，我们可以在具有相关文本块的输入查询对上微调检索模型，根据高质量输出微调 LLM。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/144947.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

数据结构修炼——顺序表和链表的区别与联系

数据结构修炼——顺序表和链表的区别与联系

目录一、线性表二、顺序表2.1 概念及结构2.2 接口实现2.3 一些思考以及顺序表的缺点三、链表3.1 概念及结构3.2 链表的分类3.3 链表的实现3.3.1 无头单向非循环链表3.3.2 带头双向循环链表四、顺序表和链表的区别一、线性表线性表（linear list）是n…

阅读更多...

叶片检测系统源码分享

叶片检测系统源码分享

叶片检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Vision …

阅读更多...

地平线4登录xbox后提示需要登录档案怎么解决

地平线4登录xbox后提示需要登录档案怎么解决

这个游戏是真nt（在联机上），典型搞联机2小时游玩半小时，多半时间都花费在联机上了，不是为了联机和朋友跑车，早给他卸载了。本人的游戏问题：看了一些视频感觉没什么作用，我的现象就是…

阅读更多...

【UE5】将2D切片图渲染为体积纹理，最终实现使用RT实时绘制体积纹理【第一篇-原理】

【UE5】将2D切片图渲染为体积纹理，最终实现使用RT实时绘制体积纹理【第一篇-原理】

如果想直接制作，请看【第二篇】内容这次做一个这样的东西，通过在2DRT上实时绘制，生成动态的体积纹理，也就是可以runtime的VDB 设想的文章流程: 对原理进行学习制作体积渲染制作实时绘制第一篇（本篇）是对“…

阅读更多...

Java面试——集合篇

Java面试——集合篇

1.Java中常用的容器有哪些？ 容器主要包括 Collection 和 Map 两种，Collection 存储着对象的集合，而 Map 存储着键值对(两个对象)的映射表。如图： 面试官追问：说说集合有哪些类及他们各自的区别和特点？ S…

阅读更多...

Web+Mysql——MyBatis

Web+Mysql——MyBatis

MyBatis 目标能够完成Mybatis代理方式查询数据能够理解Mybatis核心配置文件的配置 1，Mybatis 1.1 Mybatis概述 1.1.1 Mybatis概念 MyBatis 是一款优秀的持久层框架，用于简化 JDBC 开发 MyBatis 本是 Apache 的一个开源项目iBatis, 2010年这个项目由…

阅读更多...

idea启动oom了解决

idea启动oom了解决

解决 Error:java: java.lang.OutOfMemoryError: WrappedJavaFileObject[org.jetbrains.jps.javac.InputFileObject[file:///D:/mingan/pb/backend/src/main/java/com/cy/backend/service/impl/StorageServiceImpl.java]]pos36199: WrappedJavaFileObject[org.jetbrains.jps.j…

阅读更多...

nodejs 012:Babel（巴别塔）语言转换与代码兼容

nodejs 012:Babel（巴别塔）语言转换与代码兼容

这里写目录标题安装 Babel配置presets配置：常见的 Babel Presetsplugins配置：以 plugin-transform-class-properties 的类中属性为例index.jsx Babel 是一个独立的 JavaScript 编译器，主要用于将现代 JavaScript 代码转换为旧版本的 JavaScr…

阅读更多...

Jira Cloud涨价5%-20%，钉钉项目Teambition成优选替代

Jira Cloud涨价5%-20%，钉钉项目Teambition成优选替代

近日，Jira再次宣布涨价，Cloud版涨幅达到5%-20%，这一消息来源于Atlassian官方面向合作伙伴发布的2024年最新涨价通知。 Atlassian旗下核心产品，包括Jira、Confluence、JiraServiceManagement等的Cloud版本价格将有所提高&#xff…

阅读更多...

使用k8s搭建mariadb+nginx+wordpress

使用k8s搭建mariadb+nginx+wordpress

前期准备 1.启动docker进程 2.拉取三个镜像 mariadb:latest wordpress:latest nginx:alpine 3.保存三个镜像 docker save -o wordpress.tar wordpress:latest 4.上传到其他的节点主机 scp wordpress.tar root 192.168.118.88:~ 5.切换到node01和node02两个节点上 ctr…

阅读更多...

【最新华为OD机试E卷】报文响应时间(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

【最新华为OD机试E卷】报文响应时间(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围，一枚热爱算法的程序员 💻 ACM金牌🏅️团队｜大厂实习经历｜多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和喜欢�…

阅读更多...

谷歌女高管被裁员，3份兼职越干越开心！55岁正是闯的年纪！

谷歌女高管被裁员，3份兼职越干越开心！55岁正是闯的年纪！

在职场的金字塔顶端，那些大龄女性高管正在面对一场无形却深刻的危机。曾经，她们凭借坚定的决心和无畏的勇气，在职场中披荆斩棘，闯出了一片天地。现代职场的年轻化和技术更新正将她们逐渐推向边缘。裁员通知的突如其来&#xff0…

阅读更多...

Leetcode面试经典150题-97.交错字符串

Leetcode面试经典150题-97.交错字符串

给定三个字符串 s1、s2、s3，请你帮忙验证 s3 是否是由 s1 和 s2 交错组成的。两个字符串 s 和 t 交错的定义与过程如下，其中每个字符串都会被分割成若干非空子字符串 ： s s1 s2 ... snt t1 t2 ... tm|n - m| < 1交错是…

阅读更多...

好的头戴式降噪耳机一定很贵吗？四款热门头戴耳机盘点及推荐！

好的头戴式降噪耳机一定很贵吗？四款热门头戴耳机盘点及推荐！

在快节奏的现代生活中，噪音无处不在，它常常干扰着我们的工作、学习与休闲时光。而一款高性价比的降噪蓝牙耳机，就如同一个贴心的伙伴，能为我们营造出一片宁静的听觉空间。如今，耳机市场蓬勃发展，想要好的头…

阅读更多...

第161天：安全开发-Python-红队项目漏扫调用API推送微信任务自动添加并启动

第161天：安全开发-Python-红队项目漏扫调用API推送微信任务自动添加并启动

目录案例一：Python-红队项目-Xray调用推送微信案例二：Python-红队项目-Awvs 调用自动添加案例三： Python-红队项目-SQLMAP 调用自动添加案例一：Python-红队项目-Xray调用推送微信首先本地测试调用api发送信息给微信 api…

阅读更多...

面试复盘与 AI 大模型学习

面试复盘与 AI 大模型学习

面试相关一、面试公司与岗位信息面试公司：顺丰科技面试岗位：AI 方向产品经理工作地点：深圳面试结果：通过，但放弃了该 offer 二、面试过程整体情况整个暑期实习面试之旅包含三轮，其中两轮是专业面试…

阅读更多...

OpenAI o1解决了Quiet-STaR的挑战吗？（下）

OpenAI o1解决了Quiet-STaR的挑战吗？（下）

随着OpenAI o1近期的发布，业界讨论o1关联论文最多之一可能是早前这篇斯坦福大学和Notbad AI Inc的研究人员开发的Quiet-STaR，即让AI学会先安静的“思考”再“说话” ，回想自己一年前对于这一领域的思考和探索，当初也将这篇论文进行…

阅读更多...

选择Alluxio来解决AI模型训练场景数据访问的五大理由

选择Alluxio来解决AI模型训练场景数据访问的五大理由

在AI模型训练尤其是大模型领域，存储系统的性能和稳定性直接决定了模型训练、推理、部署任务的效率和成本。随着全球AI行业的爆发带来的数据规模的快速增长，如何高效管理和利用这些数据成为AI模型训练中的一大挑战。 AI模型训练场景面临的五大难题 1. 数…

阅读更多...

Yolov8-pose关键点检测：一种新的自适应算法轻量级通道分割和变换(ALSS)模块，解决红外检测场景存在严重遮挡和重叠目标时的局限性

Yolov8-pose关键点检测：一种新的自适应算法轻量级通道分割和变换(ALSS)模块，解决红外检测场景存在严重遮挡和重叠目标时的局限性

💡💡💡本文解决什么问题：红外检测场景存在严重遮挡和重叠目标时的局限性的问题点。 💡💡💡提出了一种新的自适应算法轻量级通道分割和变换(ALSS)模块。该模块采用自适应信道分裂策略优化特征提取，并集成信道变换机制增强信道间的信息交换。这改善了模糊特征的提…

阅读更多...

小阿轩yx-SaltStack部署与应用基础

小阿轩yx-SaltStack部署与应用基础

小阿轩yx-SaltStack部署与应用基础前言当今数字化时代，大规模 IT 系统的管理已经成为一个复杂而繁琐的任务。为了提高系统管理的效率和准确性，自动化工具成为各企业不可或缺的一部分。Saltstack 作为一款强大的自动化和配置管理工具，在业…

阅读更多...

最新文章