开源模型也能强过闭源?Llama 3.1-405B数值对标GPT4!

Llama 3.1-405B引起AI浪潮:开源模型也能强过闭源?

QQ截图20240724135832.png

Llama 3.1

就这几天,只要你有在关注AI相关的事,你就会看见一群人在讨论 Meta 新出的 Llama 3.1。外网无数的业内大佬都在为之疯狂,因为 Llama3.1-405B 成为了目前开源模型中性能最强的模型,甚至直逼闭源大模型。

了解Llama 3.1

Llama 3.1 405B 是第一个公开可用的模型,在通用知识、可操纵性、数学、工具使用和多语言翻译方面的最新能力方面可以与顶级 AI 模型相媲美。

8B 和 70B 模型的升级版本是多语言的,上下文长度明显更长,为 128K,使用最先进的工具,整体推理能力更强。这使 Meta 的最新模型能够支持高级用例,例如长格式文本摘要、多语言对话代理和编码助手。

Meta 还对其许可证进行了更改,允许开发人员使用 Llama 模型(包括 405B 模型)的输出来改进其他模型。

开源与闭源的战争

开源与闭源的战争也不是一两天了。闭源模型通常由大型科技公司或研究机构开发,这些数据的质量和数量可能比开源模型更高,从而使闭源模型在性能上更具优势。但这次 Llama3.1 也不惯着你,直接“重拳出击”,怒砸了15 万亿个 token 用来训练,表示开源的数据也不比闭源差。

QQ截图20240724141623.png

Llama官网数据对比图

QQ截图20240724141632.png

Llama官网数据对比图

从提供的基准测试数据来看的话,Llama 3.1 405B 基本所有的参数都超过了 GPT-4,与 GPT-4mini 也能打的又来有回。性能可以说是非常的恐怖。而8B的版本也是超过了其他同阶水平的模型,70B的版本更是甩开了GPT 3.5 Turbo 一截。

QQ截图20240724143138.png

Llama3.1 405B的对比情况

而Llama官方也说他们在150多个多语言基准数据集上进行了性能评测和人工测试。而测试的结果也表明了他们的模型是可以和 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 去相比较的。

NVIDIA × Llaama 3.1

QQ截图20240724112732.png

NVIDIA × Llama 3.1

NVIDIA 今天宣布推出了 NVIDIA AI Foundry 服务和 NVIDIA NIM™ 推理微服务,通过 Llama 3.1 公开可用模型集合为全球企业增强生成式 AI 技术。

借助 NVIDIA AI Foundry,企业和国家现在可以使用 Llama 3.1 和 NVIDIA 软件、计算和专业知识为其特定领域的行业用例创建自定义“超级模型”。企业可以使用专有数据以及从 Llama 3.1 405B 和 NVIDIA Nemotron™ Reward 模型生成的合成数据来训练这些超级模型。

NVIDIA 创始人兼首席执行官黄仁勋表示:“Meta 公开提供的 Llama 3.1 模型标志着全球企业采用生成式 AI 的关键时刻。“Llama 3.1 为每个企业和行业打开了构建最先进的生成式 AI 应用程序的闸门。NVIDIA AI Foundry 已在整个过程中集成了 Llama 3.1,并已准备好帮助企业构建和部署定制的 Llama 超级模型。

圈内大佬的看法

QQ截图20240724102411.png

Llama 3.1 相关消息

QQ截图20240724102348.png

Llama 3.1 相关消息

现在 Llama 3.1 在外网可以说火的是一塌糊涂。今早打开 twitter 全是它的内容。如你所见,不少的大佬在自己的账号上都对 Llama 3.1 称赞不已。

QQ截图20240724143958.png

马克·扎克伯格探讨 Llama 3.1

而Meta的创始人兼CEO马克·扎克伯格更是亲笔撰写了一篇题为《Open Source AI Is the Path Forward》的文章。如果你对文章不感兴趣也可以直接搜到他所录制的视频,视频中也聊到了 Llama 3.1 的方方面面,很有意思。

就目前来看,Llama 3.1 的出现无疑给 AI 领域带来了新的冲击和思考。它证明了开源模型具备挑战闭源模型的实力,也让人们看到了开源模式在推动 AI 发展方面的巨大潜力。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1487553.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

CefSharp音视频编译与免费下载

注:Cefharp 音频和视频播放编译,生成相应的dll文件,从而支持项目开发。 建议编译至少 16G 的 RAM和至少 250G 的 SSD。该脚本以 E 盘为例,您需要在 E 盘上手动创建 cef 文件夹。禁止在转载后通过发布其他平台向用户收取下载费用。…

JavaEE - Spring Boot 简介

1.Maven 1.1 什么是Maven 翻译过来就是: Maven是⼀个项⽬管理⼯具。基于POM(Project Object Model,项⽬对象模型)的概念,Maven可以通 过⼀⼩段描述信息来管理项⽬的构建,报告和⽂档的项⽬管理⼯具软件。 可以理解为:Maven是一个项目管理工具…

MFC与QT中禁用Esc、Alt+F4、关闭图标

在业务中,我们需要按指定的方式才能关闭当前对话框。如下图需输入密码点击确认后,界面才能关闭。 1.禁用关闭按钮 在对话框初始化部分添加将关闭按钮禁用 //MFC CMenu *pSysMenu GetSystemMenu(FALSE); ASSERT(pSysMenu ! NULL); pSysMenu->EnableM…

【BUG】已解决:NameError: name ‘python‘ is not defined

NameError: name ‘python‘ is not defined 目录 NameError: name ‘python‘ is not defined 【常见模块错误】 【解决方案】 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英杰,211科班出身,就职于…

学习记录——day18 数据结构 树

树的存储 1、顺序存储 对于普通的二叉树,不适合存储普通的二叉树顶序存储,一般用于存储完全二叉树而言,如果使用顺序存储,会浪费大量的存储空间,因为需要给没有节点的位置留出空间,以便于后期的插入。 所以…

图书管理系统设计

设计一个图书管理系统时,我们需要考虑系统的基本功能、用户需求、技术选型以及数据的安全性和完整性。下面是一个基本的图书管理系统的设计概览: 1. 系统目标 管理图书信息:添加、删除、修改图书信息。借阅管理:处理借书、还书流…

Leetcode—297. 二叉树的序列化与反序列化【困难】

2024每日刷题(148) Leetcode—297. 二叉树的序列化与反序列化 实现代码 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode(int x) : val(x), left(NULL), right(…

Oracle对比两表数据的不一致

MINUS 基本语法如下 [SQL 语句 1] MINUS [SQL 语句 2];举个例子: select 1 from dual minus select 2 from dual--运行结果 1-------------------------------- select 2 from dual minus select 1 from dual--运行结果 2所以,如果想找所有不一致的&a…

汽车免拆诊断案例 | 2018 款别克阅朗车蓄电池偶尔亏电

故障现象 一辆2018款别克阅朗车,搭载LI6发动机和GF6变速器,累计行驶里程约为9.6万km。车主反映,该车停放一晚后,蓄电池偶尔亏电。 故障诊断 接车后用虹科Pico汽车示波器和高精度电流钳(30 A)测量该车的寄…

4、Python+MySQL+Flask的文件管理系统【附源码,运行简单】

4、PythonMySQLFlask的文件管理系统【附源码,运行简单】 总览 1、《文件管理系统》1.1 方案设计说明书设计目标工具列表 2、详细设计2.1 登录2.2 注册2.3 个人中心界面2.4 文件上传界面2.5 其他功能贴图 3、下载 总览 自己做的项目,禁止转载&#xff0c…

C++【泛型编程】【string类常用接口】学习

目录 泛型编程 推演实例化 显示实例化 类模板 类模板的声明和定义分离 STL string string的构造和拷贝构造 选取特定字符串拷贝 解析: 关于npos的解析 验证 从一个字符串中拷贝前几个字符 解析: 注意: 验证: size…

第13周 简历职位功能开发与Zookeeper实战

第13周 简历职位功能开发与Zookeeper实战 本章概述1. Mysql8窗口函数over使用1.1 演示表结构与数据1.2 案例1:获取男女总分数1.3 案例2****************************************************************************************本章概述 1. Mysql8窗口函数over使用 参考案例…

C++客户端Qt开发——Qt窗口(菜单栏)

Qt窗口是通过QMainWindow类来实现的。 QMainWindow是一个为用户提供主窗口程序的类,继承自QWidget类,并且提供了一个预定义的布局。QMainWindow包含一个菜单栏(menu bar)、多个工具栏(tool bars)、多个浮动窗口(铆接部件)(dock widgets、一个…

算法从零到精通 (一) ~ 快慢双指针

1. 前言 快慢双指针是一种常用的算法技巧,通常用于解决涉及链表或数组的问题。它的基本思想是使用两个指针,一个移动速度快(快指针),一个移动速度慢(慢指针),来解决特定的问题。这两…

Vue中el的两种写法

大家好我是前端寄术区博主PleaSure乐事。今天了解到了Vue当中有关el的两种写法,记录下来与大家分享,希望对大家有所帮助。 方法一 解释 第一种方法我们直接用new创建并初始化一个新的 Vue 实例,并定义了 Vue 实例的数据对象,在给…

低代码如何加速数字化转型

数字化转型,正日益决定企业成功的关键。这里的一个关键因素是它可以以更快的速度和质量来实施技术计划。在当今瞬息万变的商业环境中,战略性地采用低代码平台对于旨在加快上市时间、增强业务敏捷性和促进跨团队无缝协作的首席技术官来说至关重要。日益增…

动手学深度学习——6.循环神经网络

1.序列模型 处理序列数据需要统计工具和新的深度神经网络架构。 为了简单起见,我们以 图8.1.1所示的股票价格(富时100指数)为例。 图8.1.1 近30年的富时100指数 其中,用𝑥𝑡表示价格,即在时间…

江科大/江协科技 STM32学习笔记P6

文章目录 LED闪烁&LE流水&蜂鸣器一、操作STM32的GPIO步骤二、RCC库函数什么是AHB与APB? 三、GPIO库函数GPIO初始化选择IO接口工作方式 四、四种方法实现LED闪灯 LED闪烁&LE流水&蜂鸣器 一、操作STM32的GPIO步骤 1、使用RCC开启GPIO的时钟 2、使用…

UE/Unity加载倾斜摄影太卡问题-使用局部网格简化重构导出为FBX/OBJ

工具 OSGB源数据灵易智模倾斜摄影编辑平台(下称OPEditor) 与另一篇文章里描述的导出时指定LOD层级的网格简化效果的区别 本功能属于导出时指定LOD层级的网格简化方法的升级版,可以基于某一LOD层级的局部数据进行进一步拓扑重构与纹理重烘焙自定义程度较高&#xff…

西蒙学习法

西蒙学习法 《世界十大学习方法》之西蒙学习法