胤娲科技:揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

4653eca9a43ef1c4da3cfddc396a4744.jpeg

当AI遇上“乔丹打篮球”,真相竟然藏在动画里?


想象一下,你向一位AI大模型轻声询问:“迈克尔・乔丹从事的体育运动是……”几乎在瞬间,它就自信满满地回答:“篮球!”


这一刻,你是否曾好奇,这看似无所不知的AI,是如何在它那浩瀚的“大脑”里存储并检索这些琐碎却精准的事实的?


c237ec82809365679203e74994558f44.jpeg


最近,科技界的热门话题再次被点燃,3Blue1Brown的《深度学习》课程第7课以一场生动的动画盛宴,为我们揭开了LLM(大型语言模型)存储事实的神秘面纱。


a00259523679fcf5f4e4f54857527f73.jpeg


这次,我们不仅要看懂AI的“记忆宫殿”,还要一起探索“乔丹打篮球”背后的秘密。


LLM的记忆迷宫:事实与向量的奇幻之旅


在AI的世界里,没有真正的书本和笔记本,但它却拥有一种不可思议的能力——将海量的知识编码成高维向量,存储于它那由亿万个参数构成的复杂网络中。


4c70d1d59e622b9cc4be1849befbccc0.jpeg


想象一下,当我们输入“迈克尔・乔丹”时,AI其实是在它的“记忆迷宫”里寻找与这个名字相关联的所有线索。


这些线索,就像是迷宫中的指路牌,指引着AI走向正确的答案——“篮球”。


fbd3c3b340334305c58e3322f06aa8f5.jpeg


3Blue1Brown的动画,就像一位耐心的导游,引领我们穿梭于这个由Transformer和MLP(多层感知器)构建的迷宫中。


95b941df6d92cc56139818a18e68b5d5.jpeg


特别是MLP,它就像是一个个精密的“知识过滤器”,通过一系列复杂的运算,将输入的文本向量转化为包含丰富信息的输出向量。


cbfef6aaaba2a74f666328ac4c18569d.jpeg


在这个过程中,“乔丹打篮球”这一事实,被巧妙地嵌入到了网络的某个角落,等待着被唤醒。


MLP的内部探秘:从“姓名”到“运动”的神奇转变


走进MLP的内部,我们仿佛进入了一个由数字和矩阵编织的奇幻世界。在这里,每一个向量都承载着特定的信息,


6e91a0280e83a68bf35ae668b6d3c8f2.jpeg


它们通过线性投射、ReLU激活等步骤,不断地变换着形态,最终汇聚成指向正确答案的“光束”。


以“乔丹打篮球”为例,当输入“Michael Jordan”时,MLP会先对这个文本向量进行一系列的线性变换,就像是给它穿上了一层又一层的“知识外衣”。


d8217b473341556b179bd41e31b7401a.jpeg


这些外衣上,布满了与“Michael”、“Jordan”以及可能与之相关的各种概念相连接的线索。接着,通过ReLU函数的筛选,


b7734838e8aa8e8d675a41f8939bf802.jpeg


那些与“全名”不匹配的线索被剔除,只剩下最纯净、最相关的信息。最后,在另一个线性变换的作用下,这些信息被整合成指向“Basketball”的明确指示。


GPT-3的参数盛宴:1750亿个数字的狂欢


提到GPT-3,不得不提的就是它那惊人的1750亿个参数。这些参数,就像是构成AI“记忆宫殿”的砖石,

.

491a27f6c13026aed67962fd180d2dd9.jpeg


每一块都承载着特定的信息或功能。那么,这些参数究竟是如何分布和工作的呢?


原来,在GPT-3的架构中,MLP占据了参数总量的三分之二以上。每个MLP都包含多个线性变换步骤,每个步骤都需要大量的参数来支持。


bb3cc0dc71330bb533bb07d509a7b8d9.jpeg


以嵌入空间为例,其大小决定了矩阵的维度,进而决定了参数的数量。而GPT-3中,嵌入空间的大小达到了惊人的12288维,这仅仅是开始。


4327ff213f8a7d8c7960020dc87d8409.jpeg


随着向量的不断传递和变换,参数的数量呈指数级增长,最终汇聚成了那个令人咋舌的1750亿。


从“乔丹打篮球”到AI的未来


通过3Blue1Brown的这场动画盛宴,我们不仅揭开了LLM存储事实的神秘面纱,还深入到了MLP的内部,见证了从“姓名”到“运动”的神奇转变。


937f24c71a8be61607e7bae9960eaea2.jpeg


更重要的是,我们意识到了AI背后那庞大而复杂的参数网络,正是这些看似冰冷的数字,构建了我们与AI之间沟通的桥梁。


然而,AI的旅程才刚刚开始。随着技术的不断进步,我们有理由相信,未来的AI将更加智能、更加人性化。


50719e850b670317477c2e421879b138.jpeg


它们将不仅仅能够回答“乔丹打篮球”这样的简单问题,更能在医疗、教育、科研等领域发挥巨大的作用,成为我们生活中不可或缺的一部分。


729c7c554d699f565a7b7f8398777956.jpeg


而这一切的起点,就藏在那一个个生动有趣的动画和复杂的参数之中。让我们共同期待AI带来的无限可能吧!


87880f2a0e091290ff5530ac757e4a32.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1550350.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

跨境电商新风尚:一键解锁中国电商的全球代购奇迹

在全球化日益加深的今天,跨境电商成为了连接中国与世界消费者的桥梁,尤其是为国外客户代购中国电商商品的服务,正以一种前所未有的方式改变着国际购物体验。本文将深入探讨跨境电商代购系统的基本功能,揭示其背后的技术魅力与商业…

C#绘制动态曲线

前言 用于实时显示数据动态曲线,比如:SOC。 //用于绘制动态曲线,可置于定时函数中,定时更新数据曲线 void DrawSocGraph() {double f (double)MainForm.readData[12]; //display datachart1.Series[0].Points.Add(f);if (ch…

如何在云端地球建模云平台利用无人机航拍照片进行三维建模?

第一步:导入照片 进入云端地球工作台,选择【场景建模】将航拍的照片组导入。 输入模型名称(若无则无法上传),点击【上传】,将照片上传到云端服务器。 第二步:创建任务 上传成功后点击开始处理…

生成模型常见的条件融合方式

生成模型常见的条件融合方式 目前生成模型主要有4中常见的条件融合方式以实现可控生成:条件归一化层,Decoupled Cross-Attention,self-attention层进行融合,特征值逐元素求和。本文首先介绍下各种方法现,然后进行总结&…

华为云LTS日志上报至观测云最佳实践

华为云LTS简介 华为云云日志服务(Log Tank Service,简称 LTS),用于收集来自主机和云服务的日志数据,通过海量日志数据的分析与处理,可以将云服务和应用程序的可用性和性能最大化,为您提供实时、…

三维立体自然资源“一张图”

随着信息技术的发展,自然资源管理迎来了新的机遇与挑战。在众多技术中,“三维立体自然资源‘一张图’”的概念尤为引人注目。它不仅代表了地理信息科学领域的最新成果,也为自然资源的有效管理和可持续利用提供了强有力的支持。本文将探讨这一…

同元软控受邀出席2024第四届国际自主无人系统大会

9月19-21日,2024第四届国际自主无人系统大会在沈阳召开。辽宁省副省长高涛,沈阳市委副书记、市长吕志成出席并致辞。 本届大会由中国科学院沈阳自动化研究所、国防科技大学、西北工业大学、南京理工大学、中国航空学会共同主办,以“自主无人…

Webpack 特性探讨:CDN、分包、Tree Shaking 与热更新

文章目录 前言包准备CDN 集成代码分包Tree Shaking原理实现条件:解决 treeShaking 无效方案:示例代码: 热更新(HMR) 前言 Webpack 作为现代前端开发中的核心构建工具,提供了丰富的特性来帮助开发者优化和打…

【sw2024】solidworks2024双击setup.exe无反应管理员运行也没反应解决方法

第一步 官网下载xxclean,打开xxclean最新版本,登录。官网xxclean.com或者自己浏览器搜。 第二步 点击扩展功能,点击 运行sw2024安装程序无反应 右边的开始 第三步 进度百分之百之后去双击setup就有界面了。

unix中的exec族函数介绍

一、前言 本文将介绍unix中exec族函数,包括其作用以及使用方法。当一个进程调用fork函数创建一个新进程后,新进程可以直接执行原本正文段的其他内容,但更多时候,我们在一个进程中调用fork创建新的进程后,希望新进程能…

ApiSix 插件开发

版本 3.0.1 创建插件目录和文件 cd ./example/ mkdir -p apisix/plugins cd apisix/plugins touch my_plugin.lua结构如下: 编写脚本 local core require("apisix.core")local plugin_name "my_plugin"local schema {type "obje…

MySQL约束:外键约束

下面先创建两张表用来作为实验样例 1.创建dept表 create table dept(id int auto_increment comment ID primary key,name varchar(50) not null comment 部门名称 ) comment 部门表;INSERT INTO dept (id, name) VALUES (1, 研发部), (2, 市场部), (3, 财务部), (4, 销售部…

基于服务网格的集群访问控制

随着容器化、云原生等概念的火热,越来越多的应用都开始选择支持云原生部署,但是对于大型企业应用来说,各种为服务的拆分会导致集群运维的压力越来越大,尤其是服务之间的安全通信至关重要。 在容器化集群中,传统的基于…

同元软控参展2024超临界二氧化碳动力循环与多能互补系统国际会议

9月20-23日,2024超临界二氧化碳动力循环与多能互补系统国际会议(简称ICSPC2024)在上海召开。会议由中国科学院工程热物理研究所、中国工程热物理学会主办,华北电力大学、西安热工研究院有限公司为联合主办单位。同元软控携核反应堆…

7.3树形查找

7.3.1二叉排序树 1.定义 目的:提供查找删除,插入关键字的速度 二叉排序树的特性: 左子树<根节点<右子树左右字数也分别是一棵二叉树 对二叉排序树进行中序遍历,可以得到一个递增的有序序列 2.二叉排序树的查找 查找从根节点开始,沿分支逐层向下比较的过程 二叉排序…

foxmail登录不了hotmail的解决办法

foxmail登录不了hotmail 由于hotmail的信息安全保护&#xff0c;9.16号就在foxmail登录不了&#xff0c;因为习惯了foxmail&#xff0c;且微软改了验证方式&#xff0c;换要他们的客户端才行&#xff0c;就感觉好麻烦。 在foxmail输入原密码报错 修改验证方式 也是会报错 解决…

第十三届蓝桥杯真题Java c组C.纸张尺寸(持续更新)

博客主页&#xff1a;音符犹如代码系列专栏&#xff1a;蓝桥杯关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ 【问题描述】 在 ISO 国际标准中定义了 A0 纸张的大小为 1189mm 841mm&#…

LLM推理需要多大GPU?背完再去面试

在实际工作中&#xff0c;经常有人问&#xff0c;7B、14B 或 70B 的模型需要多大的显存才能推理&#xff1f;如果微调他们又需要多大的显存呢&#xff1f; 为了回答这个问题整理一份训练或推理需要显存的计算方式。如果大家对具体细节不感兴趣&#xff0c;可以直接参考经验法则…

original多因子图绘制

成品参考 首先导入数据 设置过程 设置X轴 设置图 双击空白部分设置图层宽度&#xff08;也需要设置高度&#xff09; 颜色配置 1.删除边框 合适的参数与颜色&#xff08;设置为单色&#xff09;

【Python】Python多行输入储存为字典,值为列表

1.储存在变量中 # 输入格式&#xff1a;3 5 tabel, customer map(int, input().split()) print("table:", tabel) print("customer:", customer) 2.储存在列表中 #输入格式&#xff1a;2 4 2 tabel_number [int(x) for x in input().split()] print(&q…