LLM大模型：开源RAG框架汇总

LLM大模型：开源RAG框架汇总

news/2024/10/6 17:08:43/文章来源:https://blog.csdn.net/AAI666666/article/details/142727026

前言

本文搜集了一些开源的基于LLM的RAG（Retrieval-Augmented Generation）框架，旨在吸纳业界最新的RAG应用方法与思路。如有错误或者意见可以提出，同时也欢迎大家把自己常用而这里未列出的框架贡献出来，感谢~

RAG应用框架

RAGFlow

项目地址：https://github.com/infiniflow/ragflow
简介：RAGFlow 是一款基于深度文档理解构建的开源 RAG（Retrieval-Augmented Generation）引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程，结合大语言模型（LLM）针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
特性：OCR、内置多种文档切分模板、文档切分可视化并且可修改、兼容多种文档数据类型
架构：
硬件要求：CPU >= 4 核、RAM >= 16 GB、Disk >= 50 GB、Docker >= 24.0.0 & Docker Compose >= v2.26.1

QAnything

项目地址： https://github.com/netease-youdao/QAnything
简介：QAnything ( Q uestion based on Anything ) 是贡献支持任何格式文件或数据库的本地知识库问答系统，可断网安装使用。您的任何格式的本地文件都可以往里扔，即可获得准确、快速、靠谱的问答体验。
特性：支持离线安装使用、跨语种问答、粗排和精排的二阶段召回
架构：
硬件要求：最低CPU即可；使用GPU环境需要NVIDIA GPU Memory >= 4GB (use OpenAI API) & Docker Desktop >= 4.26.1（131620）

open-webui

项目地址：https://github.com/open-webui/open-webui
简介：Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 WebUI，旨在完全离线操作。它支持各种 LLM 运行程序，包括 Ollama 和 OpenAI 兼容的 API。
特性：原生支持Ollama、支持安装和卸载模型、支持多模态模型、支持切换模型、多用户管理
架构：
硬件要求：最低CPU即可，使用GPU环境需要NVIDIA GPU Memory >= 4GB (取决于使用Ollama的模型大小)

FastGPT

项目地址：https://github.com/labring/FastGPT
简介：FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！
特性：支持应用编排、免登录分享、支持接入飞书、企业微信等应用
架构：
硬件要求：CPU >= 2 核、RAM >= 4 GB用于安装数据库，GPU取决于使用的模型

Langchain-Chatchat

项目地址：https://github.com/chatchat-space/Langchain-Chatchat
简介：基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。
特性：算是比较早期的RAG框架了，使用的基本全是python的框架。该项目是一个可以实现完全本地化推理的知识库增强方案, 重点解决数据安全保护，私域化部署的企业痛点。支持市面上主流的本地大语言模型和Embedding模型，支持开源的本地向量数据库。本开源方案采用Apache License，可以免费商用，无需付费。
架构：
硬件要求：对GPU要求较高

MaxKB

项目地址：https://github.com/1Panel-dev/MaxKB
简介：MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base，旨在成为企业的最强大脑。
特性：开箱即用，支持直接上传文档、自动爬取在线文档；支持零编码快速嵌入到第三方业务系统；支持对接主流的大模型，包括 Ollama 本地私有大模型以及API调用
架构：
前端：Vue.js
后端：Python / Django
LangChain：LangChain
向量数据库：PostgreSQL / pgvector
大模型：Azure OpenAI、OpenAI、百度千帆大模型、Ollama、通义千问、Kimi、智谱 AI、讯飞星火
硬件要求：
操作系统：Ubuntu 22.04 / CentOS 7 64 位系统
CPU/内存：推荐 2C/4GB 以上
磁盘空间：100GB

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
- L3.2 MetaGPT
- L3.3 ChatGLM
- L3.4 LLAMA
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1555879.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

【Python】数据可视化之聚类图

【Python】数据可视化之聚类图

目录 clustermap 主要参数参考实现 clustermap sns.clustermap是Seaborn库中用于创建聚类热图的函数，该函数能够将数据集中的样本按照相似性进行聚类，并将聚类结果以矩阵的形式展示出来。 sns.clustermap主要用于绘制聚类热图，该热图通…

阅读更多...

训练验证器解决数学应用题

训练验证器解决数学应用题

人工智能咨询培训老师叶梓转载标明出处数学问题解决不仅要求模型能够理解问题的语言表述，还要求其能够准确地执行一系列数学运算，每一步的准确性都至关重要。遗憾的是，现有的语言模型在这一领域的性能远远未能达到人类的水平，它…

阅读更多...

[C#]使用onnxruntime部署yolov11-onnx实例分割模型

【官方框架地址】 https://github.com/ultralytics/ultralytics.git 【算法介绍】在C#中使用ONNX Runtime部署YOLOv11-ONNX实例分割模型，涉及到模型的加载、数据预处理、模型推理和后处理几个关键步骤。首先，需要确保已经安装了ONNX Runtime的NuGe…

阅读更多...

站岗放哨树形dp

站岗放哨树形dp

前言：好久没有写树上dp了，这儿题目还是挺有意思的题目地址 #include<bits/stdc.h> #include<iostream> using namespace std;//#define int long long int n; const int N (int)1e510; int e[N],ne[N],h[N],idx 0; int dp[2][N];void add…

阅读更多...

FLUX1.1PRO震撼来袭：蓝莓揭开神秘面纱，4网站体验，6倍卓越速率和更高质量，竞技场角逐超越所有模型，Elo最高分

FLUX1.1PRO震撼来袭：蓝莓揭开神秘面纱，4网站体验，6倍卓越速率和更高质量，竞技场角逐超越所有模型，Elo最高分

大家好我是安琪！！！ FLUX 1.1 PRO震撼来袭：蓝莓揭开神秘面纱，4网站体验，6倍卓越速率和更高质量，竞技场角逐超越所有模型，Elo最高分在人工智能领域，图像生成与反推技术的…

阅读更多...

登 Nature 子刊！论文一作详解蛋白质语言模型的小样本学习方法，解决湿实验数据匮乏难题

登 Nature 子刊！论文一作详解蛋白质语言模型的小样本学习方法，解决湿实验数据匮乏难题

在「Meet AI4S」系列直播第三期中，我们有幸邀请到了上海交通大学自然科学研究院 & 上海国家应用数学中心博士后周子宜， 他所在的上海交通大学洪亮课题组研究方向主要为 AI 蛋白和药物设计、分子生物物理。该课题组研究成果颇丰，截止目前共…

阅读更多...

Steamdeck SteamOs 安装单机版冒险岛079

Steamdeck SteamOs 安装单机版冒险岛079

Steamdeck SteamOs 安装单机版冒险岛079 复制资源到SteamDeck添加游戏到Steamdeck![请添加图片描述](https://i-blog.csdnimg.cn/direct/4e18b0e9b6a84a07851c7d75c452a048.png) 复制资源到SteamDeck 链接：https://pan.baidu.com/s/1CGCthOcfbYRS6y150HAuzw?pwdap…

阅读更多...

Semantic Communications With AI Tasks——面向图像分类任务的语义传输系统

Semantic Communications With AI Tasks——面向图像分类任务的语义传输系统

论文链接： 2109.14170 (arxiv.org)https://arxiv.org/pdf/2109.14170 1. 背景无线网络从“万物互联”向“智能互联”转变的范式变化，这与香农和韦弗关于通信演变的预言相一致。传统的无线网络侧重于信号的准确传输（技术层面）&…

阅读更多...

从0到1：企事业单位知识竞赛答题小程序迭代开发笔记一

从0到1：企事业单位知识竞赛答题小程序迭代开发笔记一

背景调研企事业单位知识竞赛答题小程序，在信息技术迅猛发展的时代，企业和事业单位在提升员工素质和知识水平方面面临着新的挑战。为了增强员工的学习积极性、提高团队凝聚力和整体素质，越来越多的单位开始组织知识竞赛活动。传统的知识竞赛…

阅读更多...

【全球顶级域名后缀】

【全球顶级域名后缀】

数据时间: 2024.10.6 广告: 五分钟申请SSL证书 (手机电脑都能用) ["aaa","aarp","abarth","abb","abbott","abbvie","abc","able","abogado","abudhabi","ac"…

阅读更多...

GemFilter：基于早期层压缩加速长文本LLM推理

GemFilter：基于早期层压缩加速长文本LLM推理

GemFilter 是一种用于加速长文本输入的 LLM 推理并降低内存消耗的新型 AI 方法，其利用 LLM 早期层识别关键信息的能力，从而显著压缩输入序列，并在保持性能的同时，实现高达 2.4 倍的加速和 30% 的内存使用减少。论文介绍大型语…

阅读更多...

从代码到语言：CoreGen 助力自动化提交信息生成

从代码到语言：CoreGen 助力自动化提交信息生成

1.概述源代码与自然语言之间的语义鸿沟是生成高质量代码提交信息的一个重大挑战。代码提交信息对于开发者来说非常重要，因为它们简明扼要地描述了代码更改的高层次意图，帮助开发人员无需深入了解具体实现即可掌握软件的演变过程。手动编写高质量的提交信…

阅读更多...

融资、投流、造血，大模型「新星」开启变现竞速

融资、投流、造血，大模型「新星」开启变现竞速

被称为“AI大模型应用元年”的2024年已过半，行业变化太快，充斥着各种声音。原本漫长的技术发展周期，在大模型身上被装上了加速键。从卷参数、到卷应用，短短两年时间，玩家“百模大战”、资本烈火烹油，都在…

阅读更多...

模型 SECI(知识的创造)

模型 SECI(知识的创造)

系列文章分享模型，了解更多👉 模型_思维模型目录。知识创造的螺旋转化模型。 1 SECI的应用 1.1 Tech Innovations移动应用创新 Tech Innovations是一家软件开发公司，致力于开发创新的移动应用程序。为了提升团队的知识共享和创新能力&…

阅读更多...

论文选题没思路？用这7个GPT提示词10分钟确定论文选题

论文选题没思路？用这7个GPT提示词10分钟确定论文选题

选题是论文写作的第一步，也是至关重要的一步。毕业论文选题都是让大学生头疼的大事。没有灵感、方向不清、信息太多，常常让人无从下手。现在有了ChatGPT这样的AI写作辅助工具，它可以帮你快速生成丰富的选题思路，轻松解决选题难题。…

阅读更多...

fiddler抓包18-2_导出jmeter、postman脚本(带请求头)

fiddler抓包18-2_导出jmeter、postman脚本(带请求头)

课程大纲 1. Fiddler导出请求为curl脚本选中请求，“文件” - “导出会话” - “选中的会话” - “cURL Script”。 2. 导入jmeter ① 复制curl脚本。 ② 打开jmeter，“工具” - “import from cURL”，粘贴脚本，勾选“Add cooki…

阅读更多...

【百度文心智能体】想开发爆款智能体？来看看万圣节之夜探秘者智能体开发流程大揭秘

【百度文心智能体】想开发爆款智能体？来看看万圣节之夜探秘者智能体开发流程大揭秘

目录前言一. 创作灵感二. 智能体中Prompt如何设计 2.1 头像 && 聊天背景 2.2 智能体简介 && 角色定位与目标 2.3 思考路径 && 个性化 2.4 开场白 && 自动追问 2.5 插件选择三. 总结前言从2022年11月底ChatGPT …

阅读更多...

Github优质项目推荐-第四期

Github优质项目推荐-第四期

文章目录 Github优质项目推荐 - 第四期一、【Umi-OCR】，26.1k stars - 文字识别工具二、【AFFiNE】，41k stars - 知识库平台三、【NocoBase】，12k stars - 无代码/低代码平台四、【neovim】，82.3k stars - 改良版VIM五、【generat…

阅读更多...

构建llama.cpp并在linux上使用gpu

构建llama.cpp并在linux上使用gpu

使用gpu构建llama.cpp 更多详情参见https://github.com/abetlen/llama-cpp-python，官网网站会随着版本迭代更新。下载并进入llama.cpp 地址：https://github.com/ggerganov/llama.cpp 可以下载到本地再传到服务器上 git clone https://github.com/gg…

阅读更多...

linux安装mysql显示公钥尚未安装：mysql-community-libs-8.0.39-1.el7.x86_64.rpm 的公钥尚未安装

linux安装mysql显示公钥尚未安装：mysql-community-libs-8.0.39-1.el7.x86_64.rpm 的公钥尚未安装

linux安装mysql显示公钥尚未安装 mysql-community-libs-8.0.39-1.el7.x86_64.rpm 的公钥尚未安装如题，当执行 yum install -y mysql-community-server 报错解决办法命令行执行 yum install -y mysql-community-server --nogpgcheck 也就是在原来的命令后面…

阅读更多...

最新文章