AIGC: 从两个维度快速选择大模型开发技术路线

在当今人工智能飞速发展的时代,大模型开发技术路线的选择至关重要。本文将从两个维度出发,为大家快速介绍不同的大模型开发技术路线,帮助你在开发过程中做出明智的决策。

在这里插入图片描述

一、两个维度解析

  1. 传入大模型的信息
    • 低要求:传入的信息相对简单、基础,不需要过多的复杂处理。
    • 高要求:传入的信息丰富、详细,可能需要进行特定的整理和预处理。
  2. 对大模型能力的要求
    • 低要求:期望大模型完成较为简单的任务,对其性能和功能要求不高。
    • 高要求:需要大模型具备强大的能力,能够处理复杂的任务和问题。

二、技术路线介绍

  1. 提示工程

    • 简介:提示工程是一种通过设计合适的提示来引导大模型生成特定输出的技术。它通常使用简单的文本提示,让大模型根据提示进行回答或生成内容。
    • 维度适配说明:两个维度要求都低。因为提示工程使用的提示通常比较简单,对传入大模型的信息要求不高;同时,它主要用于生成相对简单的回答或内容,对大模型能力的要求也较低。
    • 应用开发例子:例如在智能客服中,可以使用提示工程让大模型根据用户的问题快速给出简单的回答。
  2. RAG(Retrieval-Augmented Generation)

    • 简介:RAG 是一种结合检索和生成的技术。它首先从外部知识库中检索相关信息,然后将这些信息传入大模型进行生成。
    • 维度适配说明:对传入大模型的信息要求高,因为需要从外部知识库中检索高质量的信息;对大模型能力要求低,因为主要依赖检索到的信息进行生成,对大模型自身的能力要求相对较低。
    • 应用开发例子:在知识问答系统中,可以使用 RAG 技术从大量的文档中检索相关信息,然后让大模型根据这些信息回答用户的问题。
  3. AGENT

    • 简介:AGENT 是一种具有自主决策和行动能力的智能体。它可以根据环境的变化和任务的要求,自主地选择行动方案,并与环境进行交互。
    • 维度适配说明:对两个维度都是高要求。因为 AGENT 需要处理复杂的环境和任务,所以对传入大模型的信息要求高;同时,它需要具备强大的决策和行动能力,对大模型的能力要求也很高。
    • 应用开发例子:在智能游戏中,可以使用 AGENT 技术让游戏角色根据游戏场景和任务要求自主地做出决策和行动。
  4. 大模型微调

    • 简介:大模型微调是在已有的预训练大模型的基础上,通过少量的特定任务数据进行微调,使其适应特定的任务和领域。
    • 维度适配说明:对传入大模型的信息要求低,因为主要是在预训练模型的基础上进行微调;对大模型能力要求高,因为需要通过微调让大模型在特定任务上表现出更好的性能。
    • 应用开发例子:在医疗领域,对于医学影像诊断任务,可以利用大模型微调技术。首先使用预训练的大模型,然后收集特定的医学影像数据集,对大模型进行微调,使其能够准确地识别和诊断各种医学影像中的疾病。又如在金融领域的风险评估任务中,通过收集金融市场数据和企业财务数据等特定任务数据,对预训练大模型进行微调,使其能够更准确地评估金融风险。

三、不同技术结合适配更多场景

在实际应用中,单一的技术路线可能无法满足复杂的场景需求。不同技术的结合可以发挥各自的优势,适配更多的场景。

例如,AGENT 和 RAG 的结合可以在复杂的信息检索和决策场景中发挥强大的作用。AGENT 具有自主决策和行动能力,可以根据任务要求主动探索环境并获取信息。而 RAG 可以从外部知识库中检索相关信息,为 AGENT 的决策提供更多的依据。

在智能推荐系统中,AGENT 可以代表用户进行探索和交互,根据用户的兴趣和行为不断调整推荐策略。同时,RAG 可以从大量的商品信息和用户评价中检索相关内容,为 AGENT 提供更准确的推荐依据。这样的结合可以提高推荐系统的准确性和个性化程度,更好地满足用户的需求。

四、总结

不同的大模型开发技术路线适用于不同的场景和需求。如果你对传入大模型的信息和对大模型能力的要求都比较低,可以选择提示工程;如果你需要从外部知识库中检索信息并进行生成,可以选择 RAG;如果你需要处理复杂的任务和环境,对大模型的能力要求很高,可以选择 AGENT;如果你需要在特定任务上提高大模型的性能,可以选择大模型微调。而不同技术的结合可以适配更多的复杂场景,为大模型的开发和应用带来更多的可能性。在实际应用中,你可以根据具体的需求和情况,选择合适的技术路线或技术组合,以实现最佳的开发效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1550663.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

RabbitMQ 高级特性——TTL

文章目录 前言TTL设置消息的 TTL设置队列的 TTL 前言 对于前面讲到的重试机制中,当确认策略为 MANUAL 手动确认的时候,如果消费者出现了程序逻辑错误,那么消息就无法被争取处理,那么就会执行 basicNack 方法,如果我们…

Java 网络编程和多线程

欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:Java 目录 👉🏻实现客户端和服务端交互1. 基本概念2. 常用类3. 简单示例客户端代码服务器代码 4. 注意事项 👉&#x1f3…

文献阅读——电力系统安全域边界通用搜索模型与近似方法

文章标题 DOI:10.13334/j.0258-8013.pcsee.190884 ©2020 Chin.Soc.for Elec.Eng. 4411 文章编号:0258-8013 (2020) 14-4411-19 中图分类号:TM 74 电力系统安全域边界通用搜索模型与近似方法 姜涛,李晓辉,李雪*&a…

一站式大语言模型API调用:快速上手教程

智匠MindCraft是一个强大的AI工具及开发平台,支持多种大语言模型和多模态AI模型。本文将详细介绍如何通过API调用智匠MindCraft中的大语言模型,帮助开发者快速上手。 注册与登录 访问智匠MindCraft官网,注册并登录账号。 进入开发者平台&…

常见字符函数和字符串函数(下)

1. strncpy 函数的使用 将源的前 number 个字符复制到目标。如果在复制 num 个字符之前找到源 C 字符串的末尾(由 null 字符表示),则目标将填充零,直到写入总数 num 个字符为止。如果 source 长于 num,则不会在 destin…

《向量数据库指南》——非结构化数据迁徙战:向量数据库的挑战与突破

在深入探讨非结构化数据在向量数据库间迁移所面临的挑战时,我们不得不正视这一领域所独有的复杂性与特殊性。随着人工智能、大数据技术的迅猛发展,向量数据库作为处理高维、非结构化数据的核心工具,其重要性日益凸显。然而,与成熟的关系型数据库迁移相比,向量数据库之间的…

扫盲接口测试,有些知识是需要了解和掌握的(建议收藏)

扫盲内容: 1.什么是接口? 2.接口都有哪些类型? 3.接口的本质是什么? 4.什么是接口测试? 5.问什么要做接口测试? 6.怎样做接口测试? 7.接口测测试点是什么? 8.接口测试都要掌…

02-指针代码示例

视频地址: 数组作为函数参数_哔哩哔哩_bilibili 指针是一个变量,用来存放其他变量的地址. 一、语法角度说: 需要用整形变量的指针,去存储一个整形变量的地址. 二、代码部分: (一) 1.指针赋值 int main(int argc, const char* argv[]) {int a;int* p;//这里要…

王道-操作系统

3 下列说法正确的是_____ 答案:A 解析: A 正确。如链接文件可以顺序存取,但不能随机存取。连续文件可随机存取,也可顺序存取。 B 错误。一个 FCB 就是一个文件目录项。在引入索引节点后,每个文件的目录项只保留文件名和指向该文件对应的索引节点指针,而索引节点的有关信息…

AD导出gerber文件(光绘文件)

第一步: 英寸 2:5 勾选你想显示的层 默认默认 第二步: 第三步: 默认

每日OJ_牛客_NC95数组中的最长连续子序列_排序+模拟_C++_Java

目录 牛客_NC95数组中的最长连续子序列_排序和模拟 题目解析 C代码 Java代码 牛客_NC95数组中的最长连续子序列_排序模拟 数组中的最长连续子序列_牛客题霸_牛客网 题目解析 排序 模拟。但是要注意处理数字相同的情况,还要注意去重。 排序后使用一个变量cou…

【预备理论知识——1】深度学习:概率论概述

简单地说,机器学习就是做出预测。 概率论 掷骰子 假设我们掷骰子,想知道看到1的几率有多大,而不是看到另一个数字。 如果骰子是公平的,那么所有六个结果{1,…, 6}都有相同的可能发生, 因此我们可以说 1 发生的概率为1…

软件设计(实验三):经典软件体系结构风格(二)

实验目的: 本实验旨在帮助学生理解和实现两种常见的软件体系结构风格:事件的隐式调用软件体系结构、层次软件体系结构。通过编写具体的代码,学生将能够掌握这两种风格的基本原理,并能够评估它们在不同场景下的适用性和优劣。 基…

string类的使用(上)

目录 1.string类的概念 2.string的构造函数(实现初始化) 3.对string类容量获取和操作 4.string类对象的访问和遍历 4.1operator[] 4.2begin和end 4.3 rbegin 和 rend 4.4迭代器分类 4.5范围for(自动实现遍历) 5.string类…

http请求过程 part-2

http请求过程 http应用层 实体 实体分为实体首部和实体主体,实体首部是用来描述主体的 实体部分是可选的,它被用来运送请求或者响应的数据 传输层-TCP HTTP连接是建立在TCP连接的基础上 以流形式通过一条已经打开的TCP连接,按顺序进行…

next 从入门到精通

next 从入门到精通 相关链接 演示地址 演示地址 源码地址 源码地址 获取更多 获取更多 hello 大家好,我是 数擎科技,今天来跟大家聊聊 Next.js 如果你遇到任何问题,欢迎联系我 m-xiaozhicloud 什么是 Next.js Next.js 是一个基于 Reac…

27 C 语言标准库 <stdio.h> 中的两个字符串函数:sprintf、sscanf,不同编码方式的中文字符长度

目录 1 sprintf 1.1 函数原型 1.2 功能说明 1.3 案例演示 1.4 注意事项 2 sscanf 2.1 函数原型 2.2 功能说明 2.3 案例演示 2.4 使用 %s 解析字符串的易错点 2.4.1 空白符问题 2.4.2 顺序问题 2.4.3 中文字符长度问题 2.5 注意事项 1 sprintf 1.1 函数原型 spri…

求恰好为k 的区间数量(滑动窗口进阶版)

前言:之前做的滑动窗口都是可以直接一遍过,然后每次右边确定了以后,左边不断缩小寻找最优解 但是这个题目呢我们不仅要保证我们的辅音字母的个数恰好为k,其他元音字母的个数只要每个都出现了就行,这个就导致我们不能用…

【IEEE PDF eXpress】格式不对

目录 一、问题二、解决方法 一、问题 word的文档,用IEEE PDF eXpress网站生成pdf后,提交论文出现错误: Document validation failed due to the following errors: Content exceeds IEEE template margins for its format (Page 1:Bottom).…

Java_TestNg

TestNg 前言支持特性 使用步骤1.引入库 常用注解Test注解BeforeSuite AfterSuiteAfterClass BeforeClassAfterTest BeforeTestAfterGroups BeforeGroupsBeforeMethod AfterMethodDataProviderFactoryListenersPatameters断言相等 不相等true/falsenull / !nullequals / !equals…