揭秘LLM计算数字的障碍的底层原理

LLM的 Tokenizer与数字切分  

大语言模型在处理语言时,通常依赖Tokenization技术来将文本切分为可操作的单元。早期版本的Tokenizer对数字处理不够精确,常常将多个连续数字合并为一个Token。比如“13579”可能被切分为“13”、“57”和“9”。在这种情况下,LLM难以准确理解数字的本质及其相互关系。因此,处理多位数加法时,LLM会遭遇极大的挑战。随着技术进步,后来的模型逐渐改进了这一点,能将每个数字单独切分。这项技术虽必要,却不足以解决所有问题。

数字序列的输入顺序  

在进行数字运算时,通常会将数字正序输入模型。然而,LLM的运算机制更适合于逆序输入。输入“13579+24680”这样的算式时,建议将其转为“97531+08642”。这个方法与人类处理数学问题的方式相似,通常会从低位到高位进行计算。逆序输入减少了模型在推算时的复杂度,大幅提升了运算的准确性。LLM需逐个生成Token,若高位在前,模型必须在第一次输出时就算出正确的结果,这无形中增加了难度。

数字对齐的重要性  

即使将数字逆序输入,LLM还是难以做到完美计算。这是因为数字在输入时可能未能精确对齐。以“13579+24680”为例,模型可能把相应位置的数字对错。这是因为在运算过程中,数据的相对位置变得模糊,而这部分偏差会直接导致计算错误。最有效的解决办法是通过引入位置信息,确保每个相同位置的数字都有提示字符。采用新的位置编码技术,能够提高LLM的数字对齐能力,从而提升计算的准确度。

外推能力的局限性  

LLM在训练过程中,若未接触过长长度的数字串,在实际应用中容易出现错误。这种外推能力的不足往往源于位置编码的设计不够成熟。模型在处理超出训练范围的输入时,可能机制失灵。通过引入新型位置编码技术及随机位置编码,可以在训练期间解决这个问题,使得模型能够应对更长的数字串,提升其运算能力。

大模型的幻觉问题  

大语言模型在生成内容时,可能会产生虚假的信息。这一现象在数字运算中尤为明显,模型可能声称其计算结果是正确的,但实际上却是基于错误的推测。这一现象不仅影响用户的信任感,也在实际应用中可能造成严重后果。可以通过更加严谨的训练技巧与策略来缓解这一问题。

结论  

大语言模型在数字运算中表现不佳,主要是由多种因素导致的,包括Tokenizer对数字的处理、输入顺序、数字对齐、长度外推能力以及模型幻觉等。然而,随着研究的深入,已有部分层面得到了有效改善。未来,随着技术的发展,期待大语言模型能够在数字运算上取得更好表现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1536648.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux修行路】网络套接字编程——UDP

目录 ⛳️推荐 前言 六、Udp Server 端代码 6.1 socket——创建套接字 6.2 bind——将套接字与一个 IP 和端口号进行绑定 6.3 recvfrom——从服务器的套接字里读取数据 6.4 sendto——向指定套接字中发送数据 6.5 绑定 ip 和端口号时的注意事项 6.5.1 云服务器禁止直接…

AIGC图片相关知识和实战经验(Flux.1,ComfyUI等等)

最近看了网上的一些新闻,flux.1火出圈了,因此自己也尝试跑了一下,作图的质量还是蛮高的,在这里做个知识总结回顾。 flux.1是什么? 根据介绍,flux.1是由stable diffusion 一作,Stability AI的核…

数据结构----栈和队列

(一)栈 1.栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端 称为栈顶,另一端称为栈底。栈中的数据元素遵守后进先出LIFO(Last In First …

【数据结构】十大经典排序算法总结与分析

文章目录 前言1. 十大经典排序算法分类2. 相关概念3. 十大经典算法总结4. 补充内容4.1 比较排序和非比较排序的区别4.2 稳定的算法就真的稳定了吗?4.3 稳定的意义4.4 时间复杂度的补充4.5 空间复杂度补充 结语 前言 排序算法是《数据结构与算法》中最基本的算法之一…

PHP Swoole实现简易聊天室,附加小程序端连接websocket简易代码

目录 用到的工具: PHP Swoole拓展 | PHP Redis拓展 | Redis 7 一、安装上述必要工具(下面是以宝塔面板中操作为例) 给PHP安装Swoole和Redis拓展: 安装Redis软件 二、创建websocket服务器文件"wss_server.php" 具…

19 MDIO 接口读写以太网PHY寄存器

以太网概述 以太网(Ethernet)是应用最普遍的局域网技术。IEEE组织的 IEEE 802.3标准制定了以太网的技术标准,它规定了包括物理层的连线、电子信号和介质访问层协议的内容。以太网凭借其成本低、通信速率高、抗干扰性强等优点被广泛应用在网络…

2024 RSTCONCTF re 部分wp

Unknown Architect DIE查看,RISC_V架构,直接交即可 Duke of the Kingdom 附件拖入jadx 比较简单。脚本 Keypad 附件拖入ida。一共四遍check,都比较简单 Pico-Cypher 文本编辑器打开附件 稍微问一问gpt,得知这是micropython&#x…

2024年【浙江省安全员-C证】考试试卷及浙江省安全员-C证模拟考试题库

题库来源:安全生产模拟考试一点通公众号小程序 浙江省安全员-C证考试试卷是安全生产模拟考试一点通总题库中生成的一套浙江省安全员-C证模拟考试题库,安全生产模拟考试一点通上浙江省安全员-C证作业手机同步练习。2024年【浙江省安全员-C证】考试试卷及…

PostMan使用变量

环境变量 使用场景 当测试过程中,我们需要对开发环境、测试环境、生产环境进行测试 不同的环境对应着不同的服务器,那么这个时候我们就可以使用环境变量来区分它们 避免切换测试环境后,需要大量的更改接口的url地址 全局变量 使用场景 当…

[Leetcode LCR 154][Medium]-复杂链表的复制-链表

目录 一、题目描述 二、整体思路 三、代码 一、题目描述 原题地址 二、整体思路 这道题难点在于如何处理random。因为涉及到的所有节点都在同一链表,因此可以在链表上利用复制-拆分的方法去做。 先在链表上把每个节点复制自身一次,相当于cur与cur.ne…

TCGA数据挖掘(全网最详细)

文章目录 前言一、数据处理二、数据融合3.基因ID转换4.表达差异分析5.可视化1. 筛选上下调及不显著变化的基因2.挑选top 103.火山图4. 热图4.1 上调前504.2 下调50 总结 前言 本文主要用于介绍TCGA初始数据的处理,数据融合,基因ID转换,数据融合以及数据的可视化! 一、数据处理…

评论怎么不被折叠?

首先 就很烦,即使我个人认为它很好 那么,怎么防止呢? 当然是 加代码框 //我是代码框 首先看看不加代码框 被撅了( 那加上呢 没事 所以,这功能有什么用呢

比传统机器学习更先进的深度学习神经网络的二分类建模全流程教程

比传统机器学习更先进的深度学习神经网络的二分类建模全流程分析教程 深度学习介绍和与传统机器学习的区别 深度学习(Deep Learning)是一种机器学习的分支,基于多层神经网络模型,能够自动从大量数据中学习特征并进行预测。深度学…

Linux中使用Docker构建Nginx容器完整教程

🏡作者主页:点击! 🐧Linux基础知识(初学):点击! 🐧Linux高级管理防护和群集专栏:点击! 🔐Linux中firewalld防火墙:点击! ⏰️创作…

幼儿与非幼儿识别系统源码分享

幼儿与非幼儿识别检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer…

初识Linux · 进程(3)

目录 前言: 进程的创建 前言: 继上文介绍了着重介绍了进程的内部属性,以及在操作系统层面进程如何被组织起来的,如何调用系统接口,有关task_struct,进程的部分理解等,今天,我们就…

书生大模型实战营学习[1]

学习目标: 完成SSH连接与端口映射并运行hello_world.py 创建conda环境 学习内容: 完成SSH连接 使用vscode实现SSH的远程连接 首先安装Remote -SSH 接着使用ssh-keygen生成密钥 在开发机平台添加SSH 进行端口映射 创建hello_world.py来验证 impor…

杨敏博士:基于法律大模型的智能法律系统

9月26日,杨敏博士受邀参加人工智能助力法治化营商环境发展论坛暨得理法律大模型发布会并发表了“基于法律大模型的智能法律系统”主题演讲。杨博士是香港大学计算机博士,担任中科院深圳先进院高性能数据挖掘实验室主任,是深圳市海外高层次人才…

我又做了一个国标GB28181设备模拟器的Windows版本,让国标28181开发更简单,不用再费劲弄个摄像机来调试国标GB28181开发了

之前我搞过一个《EasyGBD国标GB28181设备端模拟器帮助测试国标GB28181平台(EasyGBD->EasyGBS)》,当时,主要是在安卓手机上,用摄像机的本地摄像头来做为视频源、用摄像机的麦克风做为音频源,对外…

OpenSSH9.8p1编译rpm包(建议收藏)

1.升级前的openssh版本 [root@ncayu8847 ~]# ssh -V OpenSSH_7.4p1, OpenSSL 1.0.2k-fips 26 Jan 20172.下载软件包(离线包) openssh 源码下载地址: https://mirrors.aliyun.com/pub/OpenBSD/OpenSSH/portable/openssl源码下载 https:/