微软宣称其新工具可纠正人工智能幻觉 但专家依然对此表示怀疑

人工智能经常胡言乱语,微软现在说它有办法解决这个问题,但我们有理由对此持怀疑态度。微软今天发布了一项名为"更正"(Correction)的服务,它可以自动修改人工智能生成的与事实不符的文本。Correction 首先会标记出可能存在错误的文本–例如,公司季度财报电话会议的摘要可能存在错误的引文–然后通过将文本与事实来源(如文字记录)进行比较来进行事实核查。

作为微软 Azure AI 内容安全 API 的一部分,Correction 可与任何文本生成 AI 模型一起使用,包括 Meta 的Llama和 OpenAI 的GPT-4o。

"校正由一个利用小型语言模型和大型语言模型的新流程提供支持,以便使输出与基础文档保持一致,"微软发言人表示。“我们希望这项新功能能为医学等领域的生成式人工智能构建者和用户提供支持,在这些领域,应用开发者认为响应的准确性非常重要。”

今年夏天,Google在其人工智能开发平台 Vertex AI 中推出了一项类似功能,让客户可以通过使用第三方提供商的数据、自己的数据集或Google搜索来"磨合"模型。

但专家提醒,这些接地方法并不能从根本上解决幻觉问题。华盛顿大学研究新兴科技伦理影响的博士候选人奥斯-凯耶斯(Os Keyes)说:“试图从生成式人工智能中消除幻觉,就像试图从水中消除氢气一样不切实际,因为幻觉本身就是技术运作的一个重要组成部分。”

文本生成模型会产生幻觉,因为它们实际上什么都不"知道"。它们是一种统计系统,能识别一系列单词中的模式,并根据它们所训练的无数实例预测下一个单词。

由此可见,模型的回答并不是答案,而只是预测如果问题出现在训练集中会如何回答。因此,模型往往会对真相玩弄于股掌之间。一项研究发现,OpenAI 的ChatGPT有一半的时间会弄错医疗问题。

微软的解决方案是一对交叉引用、类似于文案编辑器的元模型,旨在突出和改写幻觉。

分类器模型会查找人工智能生成的文本中可能存在的错误、捏造或不相关的片段(幻觉)。如果检测到幻觉,分类器就会引入第二个模型,即语言模型,试图根据指定的"基础文件"纠正幻觉。

在这里插入图片描述
"通过帮助应用程序开发人员减少用户不满和潜在的声誉风险,修正可以大大提高人工智能生成内容的可靠性和可信度,"微软发言人说。“需要注意的是,接地性检测并不能解决’准确性’问题,但有助于使人工智能的生成输出与接地文件保持一致。”

凯耶斯对此表示怀疑。“这可能会减少一些问题,但也会产生新的问题。毕竟,Correction的幻觉检测库估计也能产生幻觉。”

在被问及有关 Correction 模型的背景介绍时,该发言人指出,微软研究团队最近发表了一篇论文,描述了这些模型的预生产架构。但该论文忽略了一些关键细节,比如使用了哪些数据集来训练模型。

玛丽皇后大学专门研究人工智能的研究员迈克-库克(Mike Cook)认为,即使"Correction"能像宣传的那样发挥作用,它也有可能加剧人工智能的信任和可解释性问题。这项服务可能会捕捉到一些错误,但也可能让用户陷入虚假的安全感–以为模型比实际情况更真实。

他说:“微软与 OpenAI 和Google一样,都造成了这样一个问题,即在模型经常出错的场景中依赖模型。微软现在所做的是在更高层次上重蹈覆辙。比方说,这让我们从 90% 的安全性提高到了 99% 的安全性–问题其实并不在那 9%。它永远存在于我们尚未发现的那 1%的错误中。”

库克补充说,微软捆绑"修正"功能还有商业考量,该功能本身是免费的,但每月最多只能免费提供 5000 条"文本记录"。之后,每 1000 条文本记录需支付 38 美分。

微软无疑面临着向客户和股东证明其人工智能值得投资的压力。仅在第二季度,这家科技巨头就在资本支出和设备方面投入了近 190 亿美元,其中大部分与人工智能有关。然而,该公司尚未从人工智能中获得可观的收入。本周,一位华尔街分析师下调了该公司的股票评级,理由是对其长期人工智能战略存有疑虑。

据《The Information》的一篇文章称,由于性能和成本问题,许多早期采用者已经暂停部署微软的旗舰生成式人工智能平台–Microsoft 365 Copilot。据报道,对于一个使用 Copilot 进行 Microsoft Teams 会议的客户来说,人工智能发明了与会者,并暗示通话的主题实际上从未讨论过。

毕马威会计师事务所(KPMG)的一项民意调查显示,在试用人工智能工具时,准确性和可能出现的幻觉是企业目前最担心的问题。

库克说:“如果这是一个正常的产品生命周期,那么生成式人工智能仍将处于学术研发阶段,并在不断改进和了解其优缺点。相反,我们已经把它部署到了十几个行业。微软和其他公司已经把所有人都装上了他们的发动机,并决定在前往目的地的途中建造起落架和降落伞。”

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149790.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Golang | Leetcode Golang题解之第435题无重叠区间

题目&#xff1a; 题解&#xff1a; func eraseOverlapIntervals(intervals [][]int) int {n : len(intervals)if n 0 {return 0}sort.Slice(intervals, func(i, j int) bool { return intervals[i][1] < intervals[j][1] })ans, right : 1, intervals[0][1]for _, p : ra…

js实现多行文本控件textarea,根据文本内容自适应窗口全部显示

概述 本人在使用html控件textarea&#xff0c;多行显示的时候&#xff0c;希望根据后台实际的文本&#xff0c;来全部显示文本内容&#xff0c;而不用再去操作滚动条查看全部文本。 本功能实现的难点在于&#xff0c;计算当前文本显示有多少行。 软件环境 编辑器&#xff1a…

使用 UWA Gears 测试小游戏性能

UWA Gears 是UWA最新发布的无SDK性能分析工具。针对移动平台&#xff0c;提供了实时监测和截帧分析功能&#xff0c;帮助您精准定位性能热点&#xff0c;提升应用的整体表现。 随着小游戏的规模和用户量持续增长&#xff0c;玩家对于小游戏的性能要求也越来越高。为了能够给玩…

现代桌面UI框架科普及WPF入门1

现代桌面UI框架科普及WPF入门 文章目录 现代桌面UI框架科普及WPF入门桌面应用程序框架介绍过时的UI框架MFC (Microsoft Foundation Class)缺点 经典的UI框架**WinForms****QT****WPF** 未来的UI框架**MAUI****AvaloniaUI** WPF相对于Winform&#xff0c;QT&#xff0c;MFC的独立…

1.1 elasticsearch分布式集群基本搭建(centos7.x + elaticsearch7.11.1)

【1】分布式分片集群基础概念 【1.1】ES的分布式集群有什么用&#xff1f; 高可用 高可用(High Availability)是分布式系统架构设计中必须考虑的因素之一&#xff0c;它通常是指&#xff0c;通过设计减少系统不能提供服务的时间。如果系统每运行100个时间单位&#xff0c;会有…

ubuntu22.04磁盘挂载(多磁盘和单磁盘挂载)

多磁盘挂载到同一个目录 # 如果没有安装逻辑卷管理系统工具sudo apt install lvm2 # 查看磁盘分区sudo fdisk -l # 新建物理卷sudo pvcreate /dev/nvme0n1 /dev/nvme1n1 # 查看现有物理卷信息sudo pvdisplay # 新建物理卷sudo vgcreate dnyjy_vg /dev/nvme0n1 /dev/nvme1n1…

微服务之服务保护

Sentinel引入Java项目中 一&#xff1a;安装Sentinel 官网地址&#xff1a;https://github.com/alibaba/Sentinel/releases 二&#xff1a;安装好后在sentinel-dashboard.jar所在目录运行终端 三&#xff1a;运行命令&#xff0c;端口自己指定 java -Dserver.port8090 -Dcs…

Unity 热更新(HybridCLR+Addressable)-资源更新

七、资源更新 创建一个叫Aot的文件夹&#xff0c;用来存放不会热更新的资源 这个修改为第三个 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/b8be5e6465184ad5ad6173c6870bfa06.png 这个是更新 在更新或者打包时遇到端口被占的报错&#xff0c;不用理会&#xf…

frp内网穿透常见问题

Frp编译和部署比较复杂&#xff0c;多端口映射时或者连接数多的情况下会出现不稳定的现象&#xff0c;不适合小白使用&#xff0c;而且仅是上一代的内网穿透技术&#xff0c;生产环境使用建议选择稳定性比较高的产品&#xff0c;如神卓互联、花生壳等&#xff0c;都是采用C语言…

Springboot原理之bean的依赖功能、自动配置

1. Bean管理 Spring 当中提供的注解 Component 以及它的三个衍 生注解&#xff08; Controller 、 Service 、 Repository &#xff09;来声明 IOC 容器中的 bean 对象&#xff0c;同时我们也学 习了如何为应用程序注入运行时所需要依赖的 bean 对象&#xff0c;也就是依赖注…

电池快充协议芯片

1&#xff1a;18650充电快充规则 电池知识 | 东莞市恒帝电子科技有限公司 (heldee.com) 锂电池快速充电知识【钜大锂电】 (juda.cn)18 锂电池和18650锂电池能不能快速充电&#xff0c;四种充电方式讲解 | 东莞市恒帝电子科技有限公司 (heldee.com) 2&#xff1a;国产厂家 …

光子架与电子架 -- 主从子架

主从子架模式可以实现物理上的多个子架在网管上作为一个网元统一管理&#xff0c;这样可以节省IP资源与管理开销&#xff0c;方便维护。 主从子架级联模式 在主从子架模式下&#xff0c;仅主子架可以和网管相连。和网管相连的主子架所在网元为网关网元。主从子架支持树型级联和…

node-rtsp-stream、jsmpeg.min.js实现rtsp视频在web端播放

1. 服务地址&#xff08;私有&#xff09;&#xff1a;https://gitee.com/nnlss/video-node-server 2.node-rtsp-stream 需要安装FFMPEG&#xff1b; 3.给推拉流做了开关&#xff0c;可借助http请求&#xff0c;有更好方式可联系&#xff1b; 4.存在问题&#xff1a; 1&…

浅谈提示工程之In-context learning技术

提示工程之In-context learning技术&#xff1b; 通过一张图片围绕下边几个方面进行简单说明 概念起因本质结构注意事项 日常总结

C++(9.24)

头文件 #ifndef MY_STRING_H #define MY_STRING_H#include <iostream>class My_string { private:char *ptr; // 指向字符数组的指针int size; // 字符串的最大容量int len; // 字符串的当前长度public:My_string();My_string(const char *src);My_string(const My_s…

Error:Decorators are not valid here. 使用Angular中的装饰器

Decorators are not valid here&#xff0c;项目中出现这个提示信息&#xff0c;说明装饰器未知错误、或者在不支持的元素上使用了装饰器。 如下图所示&#xff0c;我在NgModule装饰器后面加了一个导出方法&#xff0c;加完之后控制台提示了如下错误&#xff1a;Error TS1206&a…

【python】横截面数据分析及可视化报告示例

问题描述 题目&#xff1a; 共享的数据文件夹包含 2 个外部文件。第一个文件 "project data.xls "涉及国家层面的数据&#xff08;2000-2019 年&#xff09;&#xff0c;变量大多摘自世界发展指标。变量解释在第二个文件中 创建一个模型&#xff0c;解释为什么一些国…

STM32基础学习笔记-SPI通讯协议协议面试基础题8

第八章、SPI : LCD屏 1、LCD是什么 &#xff1f;发光原理 &#xff1f; 1.LCD:液晶显示 当有电流的时候&#xff0c;液晶层中的物质会有序排列 没有电流的时候&#xff0c;无序排列&#xff0c;光不可以透过 当像素点只有黑/白色的时候&#xff0c;灰度图&#xff08;非黑即…

windows C++-同步数据结构与 Windows API

将并发运行时提供的同步数据结构的行为与 Windows API 提供的同步数据结构的行为进行比较。 并发运行时提供的同步数据结构遵循协作线程模型。 在协作线程模型中&#xff0c;同步基元显式将其处理资源传递给其他线程。 这与抢占式线程模型不同&#xff0c;其中处理资源由控制调…

RtspServer:轻量级RTSP服务器和推流器

文章目录 项目概述技术分析支持的编码格式传输方式心跳检测机制RTSP 推流安全性 架构分析RtspServer 整体架构流程分析1. 客户端连接和会话建立2. 媒体数据传输3. 心跳检测和连接维护 xop 基础库项目介绍功能特性xop 整体架构 应用场景社区问题收集与解答问题一&#xff1a;刚开…