比肩 GPT-4o 的 Llama 3.1 本地部署快速体验的方法

比肩 GPT-4o 的 Llama 3.1 本地部署快速体验的方法

flyfish

Llama 3.1模型简介

Llama 3.1是一系列大型语言模型,包含以下几种规模:

8B 参数:模型中有80亿个参数
70B 参数:模型中有700亿个参数
405B 参数:模型中有4050亿个参数
这些模型的分词器(Tokenizer)3和3.1版本使用的是TikToken-based,而之前的版本使用的是Sentencepiece。

主要特点

405B参数模型:

Llama 3.1的405B参数模型是首个公开可用的超大规模模型,在一般知识、可控性、数学能力、工具使用和多语言翻译方面都表现出色,能够与顶级人工智能模型相媲美。

8B和70B参数模型:

这两个模型具有多语言能力,并且能够处理长达128K个词元的上下文,意味着它们可以处理非常长的文本段落。这使得它们在工具使用和推理能力方面非常先进,支持长篇文本摘要、多语言对话代理和编程助手等应用。

改进和许可

许可协议修改:Meta修改了许可协议,允许开发者使用Llama模型(包括405B参数模型)的输出来改进其他模型。

模型评估

性能评估:Meta对超过150个基准数据集进行了测试,覆盖了多种语言。还进行了大量人工评估,将Llama 3.1与其他竞争模型在实际应用中进行比较。结果表明,Llama 3.1的旗舰模型在许多任务上与领先的基础模型(如GPT-4、GPT-4o和Claude 3.5 Sonnet)表现相当。较小规模的模型在参数数量相似的情况下也能与封闭源码和开源模型竞争。

总的来说,Llama 3.1系列模型展示了在多种任务上的强大能力,并且由于其开放许可的性质,开发者们可以更加自由地使用这些模型来创建新的应用程序和服务。

开头这段文字 来自 https://ai.meta.com/blog/meta-llama-3-1/

参数

“model size” 通常指的是模型中参数的数量。参数(或称为权重)是模型在训练过程中学习并用于生成输出的核心数据。以下是关于 8B、70B 和 405B 的具体含义:

8B:代表模型有 80 亿个参数。
70B:代表模型有 700 亿个参数。
405B:代表模型有 4,050 亿个参数。

参数数量是衡量模型容量和复杂性的一个关键指标。更多的参数通常意味着模型能够捕捉和表示更复杂的模式和关系,从而提升其在生成和理解语言上的表现。不过,更多的参数也意味着需要更多的计算资源和存储空间,以及更长的训练和推理时间。

128K的上下文长度

Context Length"(上下文长度)是指模型能够处理的最大连续文本长度。对于 Llama 模型来说,如果它的上下文长度是 128K,这意味着该模型可以接受最多 128,000 个词元(tokens)作为输入。128K 的上下文长度是非常大的,这意味着Llama 3.1模型可以处理非常长的文本段落

词元(tokens)

“token” 是指被模型作为处理单位的最小语言片段。这个片段可以是一个单词、一个子词,甚至是一个字符,具体取决于使用的分词方法。将 “token” 翻译成 “词元” 是为了强调它是语言的基本单元。

具体来说,“token” 可以是:
单词:在最简单的分词方法中,一个单词被视为一个token。
子词:使用如BPE(Byte Pair Encoding)或WordPiece等方法时,一个单词可以被分成多个子词token。例如,“unhappiness” 可以分成 “un”, “happi”, “ness” 三个子词token。
字符:在某些分词方法中,每个字符都可以是一个token。
举例说明:
假设有一句话 “I love machine learning!”,根据不同的分词方法,这句话可以分成不同的tokens:

单词级别分词:[“I”, “love”, “machine”, “learning”, “!”]
子词级别分词(如BPE):[“I”, “love”, “mach”, “ine”, “learn”, “ing”, “!”]
字符级别分词:[“I”, " ", “l”, “o”, “v”, “e”, " ", “m”, “a”, “c”, “h”, “i”, “n”, “e”, " ", “l”, “e”, “a”, “r”, “n”, “i”, “n”, “g”, “!”]

tokenizer

tokenizer 是将文本转换为 token(词元)的工具。不同的 tokenization 方法和库在处理文本时有各自的特点和优点。这里提到的 Sentencepiece 和 TikToken 是两种常见的 tokenizer。

Sentencepiece

Sentencepiece 是一个独立于语言的子词(subword)tokenization 工具,常用于处理各种语言的文本。它的主要特点包括:
语言无关性:Sentencepiece 不依赖于任何特定语言的词汇表,可以处理任何语言的文本。
子词单元:将单词拆分成更小的子词单元(subwords),这有助于处理未见过的词汇和拼写错误。比如,“unhappiness” 可能会被拆分为 “un”, “happi”, “ness”。
BPE 和 Unigram:支持 Byte Pair Encoding (BPE) 和 Unigram Language Model 这两种子词分割方法,提供了灵活的 tokenization 选择。

TikToken

TikToken 是一种基于特定平台或应用的 tokenization 方法。虽然具体实现和特性可能会有所不同,但一般来说,TikToken 关注以下方面:

专为高性能和低延迟需求的应用设计,确保在大规模处理时仍能快速执行。通常与特定平台(如社交媒体应用、消息传递应用等)集成良好,优化了特定使用场景下的文本处理需求。可能包括针对特定语言或应用场景的优化,如处理社交媒体文本中的缩写、表情符号等。

快速使用

https://ollama.com/
下载安装之后,执行 ollama run llama3.1
请添加图片描述
在这里插入图片描述

可用的命令

在这里插入图片描述

还可以与anythingllm配合使用

https://anythingllm.com/

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1487993.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

深入理解MySQL锁机制与性能优化:详解记录锁、间隙锁、临键锁及慢SQL查询分析

1. 事务隔离和锁机制详解 记录锁 第一种情况,当我们对于唯一性的索引(包括唯一索引和主键索引)使用等值查询,精准匹配到一条记录的时候,这个时候使用的就是记录锁。 比如 where id = 1 4 7 10。 间隙锁 第二种情况,当我们查询的记录不存在,无论是用等值查询还是范围…

【vue教程】四. Vue 计算属性和侦听器

目录 本章涵盖知识点回顾计算属性(Computed)创建计算属性计算属性的多样性计算属性的数组过滤计算属性的复杂表达式 计算属性 vs 方法计算属性的实例演示 侦听器(Watchers)创建侦听器侦听器的高级用法侦听器的深度观察侦听器的立即…

无线遥控控制直流电机和无刷电机开关

一 目的 此文章记录了arduino与陶晶驰串口屏实现联动,点击屏幕双态开关远程控制arduino2560板载的直流电机和无刷电机开关。为手搓乒乓球发球机做准备。 二 接线 2.1串口屏接线 串口屏与Arduino UNO接线如下: ———————————————— RX …

pdf2image:将PDF文档转化为图像的Python魔法

标题:探索pdf2image:将PDF文档转化为图 像的Python魔法 背景 在数字时代,我们经常需要处理各种格式的文档,尤其是PDF文件。PDF以其跨平台的可读性和稳定性而广受欢迎。然而,有时我们需要将PDF文件转换成图像格式&am…

C++ - char*、const char*、char[]、string

const char* const char* 用来定义字符串常量。 char[ ] char型的字符数组是一种定长的数组,存储指定长度的字符序列,数组中的每个元素都是一个char类型的变量,如: char arr[] {h, a, l, l, o, \0}; char c arr[0]; // 访问…

CentOS怎么关闭自动锁屏?

禁止自动锁屏 有时候几分钟不用Centos,系统就自动锁屏了,这是一种安全措施,防止别人趁你不在时使用你的系统。但对于大部分人而言,这是没有必要的,尤其是Centos虚拟机,里面没啥重要的东西,每次…

光伏发电管理软件:光伏企业的核心驱动力

光伏产业面对日益增长的装机容量、复杂多变的运维需求以及激烈的市场竞争,光伏企业如何高效管理、优化运营、提升效益,成为了行业关注的焦点。在此背景下,鹧鸪云光伏发电管理软件应运而生,并逐渐成为光伏企业的核心驱动力。 一、提…

Transformer合集

资料 位置编码:https://zhuanlan.zhihu.com/p/454482273 自注意力:https://zhuanlan.zhihu.com/p/455399791 LN:https://zhuanlan.zhihu.com/p/456863215 ResNet:https://zhuanlan.zhihu.com/p/459065530 Subword Tokenizati…

效率翻倍的秘密:探索AI工具的新世界

大家好,我是你们的效率小助手米兔!你是否曾在加班熬夜中挣扎,对着电脑屏幕发呆,感觉工作效率低到怀疑人生?别急,今天我要给你们安利几款超给力的AI工具,让你的工作变得轻松又愉快! …

c++笔记4

目录 深度优先搜索DFS DFS的复杂度 DFS与递归 递归与暴力枚举 递归树 DFS与栈 DFS的搜索剪枝 搜索剪枝与优化 可行性剪枝 最优化剪枝 减少等效的分支 优化搜索顺序 搜索的记忆化 搜索的复杂度 大多时候,搜索的复杂度都是指数级的。各种剪枝方案&#…

2024世界技能大赛某省选拔赛“网络安全项目”B模块--操作系统取证解析

2024世界技能大赛某省选拔赛“网络安全项目”B模块--操作系统取证解析 任务一、操作系统取证解析:总结:任务一、操作系统取证解析: A 集团某电脑系统被恶意份子攻击并控制,怀疑其执行了破坏操作,窃取了集团内部的敏感信息,现请分析 A 集团提供的系统镜像和内存镜像,找到…

WIX Toolset 3.11 对本地化的支持方案

1.准备主题文件和本地化文件 WIX Toolset种主题文件为xml文件,负责配置控件的布局, 本地化文件为wxl文件,负责配置待加载的字符串,主题文件根据ID加载需要显示的文字内容。考虑到英文和中文字符长度大小不一,所以这里…

与Bug较量:Codigger之软件项目体检Software Project HealthCheck来帮忙

在软件工程师的世界里,与 Java 小程序中的 Bug 作战是一场永不停歇的战役。每一个隐藏在代码深处的 Bug 都像是一个狡猾的敌人,时刻准备着给我们的项目带来麻烦。 最近,我就陷入了这样一场与 Java 小程序 Bug 的激烈较量中。这个小程序原本应…

【充电模块】

目录 一、实物图 二、原理图 引脚定义 模块特性 原理 三 、简介 四、注意事项 源文件下载 可访问底部联系方式也可前往电子校园网官网搜索关键词 关键词: 充电模块 一、实物图 二、原理图 引脚定…

springboot校园论坛网站-计算机毕业设计源码11401

摘 要 基于Java语言和Springboot框架的校园论坛网站设计与实现,为校园内的师生提供了丰富的功能和便捷的服务。本论文旨在详细介绍该网站的设计思路、功能特点以及技术实现。 论文介绍了网站的注册与登录功能,用户可以通过提供必要信息注册账号&#xf…

代码随想录算法训练营day6 | 242.有效的字母异位词、349. 两个数组的交集、202. 快乐数、1.两数之和

文章目录 哈希表键值 哈希函数哈希冲突拉链法线性探测法 常见的三种哈希结构集合映射C实现std::unordered_setstd::map 小结242.有效的字母异位词思路复习 349. 两个数组的交集使用数组实现哈希表的情况思路使用set实现哈希表的情况 202. 快乐数思路 1.两数之和思路 总结 今天是…

yolov8训练自己的实例分割数据集

参考: 1、官方教程:https://docs.ultralytics.com/zh/tasks/segment/ 2、YOLOv8制作自己的实例分割数据集保姆级教程(包含json转txt) 下载最新yolov8代码 git clone https://github.com/ultralytics/ultralytics.git一、制作自…

【日常记录】【JS】对一个数组,按照某个字段的值,进行分组

文章目录 1. 前言2. lodash 的分组3. Object.groupBy()参考链接 1. 前言 在开发中,经常会遇到一组数据,要按照某个字段进行分组,这个时候会有很多种方法,可以使用 forEach、reduce、等其他方法 reduce 方法 function groupBy(arr…

亚马逊云科技 re:Inforce 2024中国站大会

亚马逊云科技 re:Inforce 2024中国站大会 - 生成式AI时代的全面安全,将于7月25日本周四在北京富力万丽酒店揭幕

最新2024海报制作工具免费下载,赶紧体验!

在这个信息爆炸的时代,一张独特而有吸引力的海报如何打动观众的心已经成为每个人都需要关注的问题。如果你感到困惑,那么你就来到了正确的地方。今天我们要讨论的是免费版本的海报制作软件。我们将从软件的选择、操作模式、设计技巧等方面进行详细的解释…