书生·浦语大模型全链路开源开放体系-笔记

推理能力领先

与社区开源模型相比,InternLM2的性能提升了20%,这表明模型在处理复杂推理任务时更加高效和准确。

支持100万字上下文

该模型能够理解和精确处理长达100万字的文本,这在开源模型中处于领先地位。这种能力对于处理长篇文章、学术论文和大型文档至关重要。

自主规划和搜索完成复杂任务

AI模型通过信息搜索和整合,能够撰写专业回答,针对复杂问题提供解决方案。这种自主规划和搜索的能力使得处理效率提升了60倍。

模型能力飞升

当前模型
数据过滤智能评估:模型能够智能评估和过滤数据,以提高训练质量。
指令生成辅助标注:通过生成指令来辅助数据标注,提高数据标注的效率和准确性。
持续迭代:模型通过持续迭代不断优化自身性能。
预训练数据:利用大量预训练数据来提升模型的初始性能。
对齐数据:确保数据的一致性和准确性,以提高模型的泛化能力。

核心技术思路

高质量合成数据
基于规则的数据构造:使用规则来构造数据,如代码、公式和数学题解。
基于模型的数据扩充:通过模型生成的数据来扩充训练集。
基于反馈的数据生成:根据用户反馈生成数据,以提高数据的相关性和质量。
融合多种数据合成方案:结合多种数据合成方法,提升合成数据的整体质量。

InternLM2.5-7B大海捞针效果

在文档中不同位置的平均深度分数显示,InternLM2.5-7B在处理长文档时的性能优于其他模型,如GLM4-9B-Chat-1M和Qwen2-7B-Instruct。

基于规划和搜索解决复杂问题

人的解决思路
用户需求:明确用户的需求。
问题分析:分析问题的核心。
思维路径拆解:将问题拆解为可管理的部分。
相关信息检索:检索相关信息。
内容整合:整合检索到的信息。
问题回复:给出问题的答案。
书生·浦语 2.5的解决思路
用户需求:明确用户需求。
规划器:规划解决问题的步骤。
问题分析:分析问题。
思维路径拆解:拆解问题。
内容整合:整合信息。
检索器:使用搜索引擎检索信息。
搜索引擎:利用搜索引擎获取海量搜索结果。
筛选精读:筛选并精读搜索结果。
问题回复:给出问题的答案。
多智能体协作:通过多个智能体协作来提高处理效率,如单次浏览100+网页。

数据与应用

MindSearch:思索式开源搜索应用。
Lagent:首个支持代码解释器的智能体框架。
书生·万卷:基于专业知识库的群聊助手。
MinerU:高效文档解析工具。
HuixiangDou:基于专业知识库的群聊助手。
InternEvo:性能超过国际主流训练框架。
OpenCompass:社区最全面的开源评测体系。
DeepSpeed:系列模型。
XTuner:多种微调和偏好对齐算法。
LMDeploy:支持千亿参数+百万上下文。
LLaMA-Factory:LLM。
LLaMA:支持千亿参数+百万上下文。
LM Studio:Hugging Face。
TensorRT-LLM:MLX。
LangChain:LlamaIndex。
llamafile:ollama。

数据提取

Miner U
一站式开源高质量数据提取工具:支持多格式(PDF/网页/电子书),智能萃取,生成高质量预训练/微调语料。
复杂版面/公式精准识别:性能超过商业软件。

Label LLM
专业致力于LLM对话标注:通过灵活多变的工具配置与多种数据模态的广泛兼容,为大模型量身打造高质量的标注数据。
支持指令采集、偏好收集、对话评估:多人协作、任务管理、源码开放可魔改。

Label U
轻量级开源标注工具:自由组合多样工具,无缝兼容多格式数据,同时支持载入预标注,加速数据标注效率。
支持图片、视频、音频多种数据标注:小巧灵活,AI标注导入二次人工精修。

全链条开源开放体系微调 XTuner

高效微调框架 XTuner
InternLM:增量预训练,多模态微调,Alignment。
支持算法:QWen BaiChuan,Sequence Parallel,DeepSpeed ZeRO,Flash Attention,Pytorch FSDP。
适配多种硬件:训练方案覆盖 NVIDIA 20系以上所有显卡,最低只需 8GB显存即可微调 7B模型。
适配多种生态
多种微调算法:覆盖各类应用场景。
适配多种开源生态:支持加载HuggingFace、ModelScope模型或数据集。
自动优化加速:开发者无需关注复杂的显存优化与计算加速细节。
大语言模型的局限性与智能体
大语言模型的局限性
最新信息和知识的获取:大语言模型在获取最新信息和知识方面存在局限性。
回复的可靠性:需要提高回复的可靠性。
数学计算:需要加强数学计算能力。
工具使用和交互:需要提高工具使用和交互能力。

LLM智能体

Agent:LLM智能体通过Plan-Act Iteration、Observations等机制,提高大语言模型的交互和执行能力。
PythonExecutor:执行器,提高模型的执行能力。
Plan-then-Act:规划后执行,提高模型的规划和执行能力。
LLM Reflexion:反射机制,提高模型的自我反思能力。

智能体 Lagent

轻量级智能体框架 Lagent
支持多种类型的智能体能力:ReAct,ReWoo,AutoGPT。
灵活支持多种大语言模型:GPT-3.5/4,InternLM,Hugging Face,Llama,Transformers。
简单易拓展:支持丰富的工具,如Rapid API,文生图搜索,出行API,计算器,文生语音,财经API等。
计划拆分:通过DAG等机制,提高智能体的计划和执行能力。

LMDeploy

LMDeploy是一个高效的推理和部署平台,具有以下特点:

高效的推理:提供可靠的量化和卓越的兼容性。
便捷的服务:支持Python推理接口、RESTful接口和gRPC接口。
有状态的推理:允许模型在推理过程中保持状态。
量化:支持Weight-only量化和K/V Cache量化。
引擎:使用TurboMind推理引擎和PyTorch推理后端。
服务:支持类OpenAI服务、Gradio和Triton推理服务。
LLMs
以下是一些大型语言模型(LLMs)的列表:

Llama:7B-65B参数
Llama2:7B-70B参数
Llama3:8B, 70B参数
Llama3.1:8B, 70B参数
InternLM:7B-20B参数
InternLM2:7B-20B参数
InternLM2.5:7B参数
QWen:1.8B-72B参数
QWen1.5:0.5B-110B参数
QWen1.5-MoE:0.5B-72B参数
QWen2:0.5B-72B参数
Baichuan:7B参数
Baichuan2:7B-13B参数
Code Llama:7B-34B参数
ChatGLM2:6B参数
GLM4:9B参数
CodeGeeX4:9B参数
Falcon:7B-180B参数
YI:6B-34B参数
Mistral:7B参数
DeepSeek-MoE:16B参数
DeepSeek-V2:16B, 236B参数
Mixtral:8x7B, 8x22B参数
Gemma:2B-7B参数
Dbrx:132B参数
StarCoder2:3B-15B参数
Phi-3-mini:3.8B参数
VLMs
以下是一些视觉语言模型(VLMs)的列表:

LLaVA:1.5, 1.6版本,7B-34B参数
InternLM-XComposer2:7B, 4khd-7B参数
InternLM-XComposer2.5:7B参数
QWen-VL:7B参数
DeepSeek-VL:7B参数
InternVL-Chat:v1.1-v1.5版本
InternVL2:1B-40B参数
MiniGeminiLlama:7B参数
CogVLM-Chat:17B参数
CogVLM2-Chat:19B参数
MiniCPM-Llama3-V-2:未提供参数
Phi-3-vision:4.2B参数
GLM-4V:9B参数

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1549148.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

html+css+js实现Pagination 分页

效果图 HTML部分 <body><div class"pagination"><button class"prev"><</button><ul><li class"active">1</li><li>2</li><li>3</li><li>4</li><li>5…

解压视频素材下载网站推荐

在制作抖音小说推文或其他短视频时&#xff0c;找到合适的解压视频素材非常重要。以下是几个推荐的网站&#xff0c;可以帮助你轻松下载高质量的解压视频素材&#xff1a; 蛙学网 蛙学网是国内顶尖的短视频素材网站&#xff0c;提供大量4K高清无水印的解压视频素材&#xff0c;…

Midjourney中文版:解锁AI艺术创作的无限潜能

在数字化时代&#xff0c;艺术创作与科技的融合正以前所未有的速度推进&#xff0c;而Midjourney中文版正是这一趋势下的璀璨明星。作为一款专为中文用户设计的AI绘图工具&#xff0c;它不仅集成了最先进的深度学习技术&#xff0c;还通过本地化优化&#xff0c;为国内设计师和…

心理咨询展示网站建设渠道拓展

心理问题长期以来都受到关注&#xff0c;每个城市里也都有相关服务商家&#xff0c;除了进店外&#xff0c;线上也可以开展咨询服务&#xff0c;对需求者来说需要找到靠谱的品牌&#xff0c;而商家也需要触达到更多客户获取转化。 网站是品牌线上工具&#xff0c;利于商家通过…

昇思MindSpore进阶教程-优化器

大家好&#xff0c;我是刘明&#xff0c;明志科技创始人&#xff0c;华为昇思MindSpore布道师。 技术上主攻前端开发、鸿蒙开发和AI算法研究。 努力为大家带来持续的技术分享&#xff0c;如果你也喜欢我的文章&#xff0c;就点个关注吧 模型训练过程中&#xff0c;使用优化器更…

什么是期望最大化算法?

一、期望最大化算法 期望最大化&#xff08;EM&#xff09;算法是一种在统计学和机器学习中广泛使用的迭代方法&#xff0c;它特别适用于含有隐变量的概率模型参数估计问题。在统计学和机器学习中&#xff0c;有很多不同的模型&#xff0c;例如高斯混合模型&#xff08;GMM&…

LeetCode讲解篇之3. 无重复字符的最长子串

文章目录 题目描述题解思路代码实现 题目描述 题解思路 因为我们需要求无重复字符的最长子串&#xff0c;这个我们首先需要想到使用滑动窗口&#xff0c;窗口内记录无重复的子串的所有字符&#xff0c;移动窗口的右边界时&#xff0c;发现当前字符在窗口内已经出现&#xff0c…

unreal engine5制作动作类游戏时,我们使用刀剑等武器攻击怪物或敌方单位时,发现攻击特效、伤害等没有触发

UE5系列文章目录 文章目录 UE5系列文章目录前言一、问题分析二、使用步骤2.玩家角色碰撞设置3.怪物角色碰撞预设 最终效果 前言 在使用unreal engine5制作动作类游戏时&#xff0c;我们使用刀剑等武器攻击怪物或敌方单位时&#xff0c;发现攻击特效、伤害等没有触发。检查动画…

二叉树进阶oj题【二叉树相关10道oj题的解析和c++代码实现】

目录 二叉树进阶oj题1.根据二叉树创建字符串2.二叉树的层序遍历3.二叉树的层序遍历 II4.二叉树的最近公共祖先5.二叉搜索树和双向链表6.从前序与中序遍历序列构造二叉树7.从中序和后序遍历序列来构造二叉树8.二叉树的前序遍历&#xff0c;非递归迭代实现9.二叉树中序遍历 &…

烟雾污染云层检测系统源码分享

烟雾污染云层检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer…

ssh方式连接上GitHub(超详细的哦)

目录 先检查本地有无生成过SSH key 生成 SSH Key&#xff08;如果没有的话&#xff09; 查看新生成的 SSH 公钥 添加新的 SSH Key 测试 SSH 连接 先检查本地有无生成过SSH key ls -al ~/.ssh终端输入以上命令查看 如果有应该能看到以下列表 id_rsa id_rsa.pub id_ed2551…

端侧Agent系列 | 端侧AI Agent任务拆解大师如何助力AI手机?(详解版)

引言 简介 Octo-planner 规划和执行Agent框架 规划数据集 基准设计 实验设计 结果 全量微调与LoRA 多LoRA训练与合并 不同基础模型的全量微调 不同数据集大小的全量微调 总结 实战 英文 中文示例1&#xff1a; 中文示例2&#xff1a; 0. 引言 人生到处知何似…

PREDATOR: Registration of 3D Point Clouds with Low Overlap

Abstract 这篇文章介绍了一种新的点云配准模型-Predator。该模型专注于处理低重叠的点云对&#xff0c;它更加关注于重叠区域的处理&#xff0c;其新颖之处在于一个重叠的注意块&#xff0c;作用是用于两个点云的潜在编码之间的早期信息交换。该模型大大提高了低重叠场景下的配…

【博弈强化学习】——UAV-BS 的联合功率分配和 3D 部署:基于博弈论的深度强化学习方法

【论文】&#xff1a;Joint Power Allocation and 3D Deployment for UAV-BSs: A Game Theory Based Deep Reinforcement Learning Approach 【引用】&#xff1a;Fu S, Feng X, Sultana A, et al. Joint power allocation and 3D deployment for UAV-BSs: A game theory based…

C++深入学习string类成员函数(3):访问与修饰

引言 在 C 中&#xff0c;std::string 提供了丰富的成员函数来访问和修改字符串中的字符。通过这些函数&#xff0c;程序员可以灵活地处理字符串中的各个元素&#xff0c;无论是读取特定位置的字符&#xff0c;还是修改字符串的内容。此外&#xff0c;std::string 类还确保了访…

农牧场可视化管理:精准监测与优化运营

利用图扑可视化技术实现农牧场的实时数据监测和分析&#xff0c;优化资源配置&#xff0c;提高生产效率和可持续发展能力。

无需安装移动端的互传工具“快速分享”

本文首发于只抄博客&#xff0c;欢迎点击原文链接了解更多内容。 前言 前不久给大家介绍过 Windows 自带的 Nearby Sharing 附近分享&#xff0c;只需要在手机上安装个 App 就可以与 Windows 进行互传。而今天介绍的“快速分享”正好相反&#xff0c;是在 Windows 上安装 Goog…

tomcat安装与部署

一、基础准备 1. 节点规划 IP 主机名 节点 192.168.200.70 tomcat Tomcat 2. 环境准备 准备一台虚拟机&#xff0c;镜像为CentOS-7-x86_64&#xff0c;下载两个软件包&#xff0c;apache-tomcat-9.0.95.tar.gz&#xff1b;zrlog WAR包。 二、安装Tomcat 1.基础环境配…

【C++篇】从零实现 `list` 容器:细粒度剖析与代码实现

文章目录 从零实现 list 容器&#xff1a;细粒度剖析与代码实现前言1. list 的核心数据结构节点结构分析 2 迭代器设计与实现2.1 为什么 list 需要迭代器&#xff1f;2.2 实现一个简单的迭代器2.3 测试简单迭代器解释&#xff1a; 2.4 增加后向移动和 -> 运算符关键点&#…

多模态——基于XrayGLM的X光片诊断的多模态大模型

0.引言 近年来&#xff0c;通用领域的大型语言模型&#xff08;LLM&#xff09;&#xff0c;如ChatGPT&#xff0c;已在遵循指令和生成类似人类的响应方面取得了显著成就。这些成就不仅推动了多模态大模型研究的热潮&#xff0c;也催生了如MiniGPT-4、mPLUG-Owl、Multimodal-G…