智谱发布AI助理,帮人类敲响AGI的大门

人工智能之父John McCarthy曾说:“只要AI可以开始正常工作,就不会有人再把它当AI了。”如今,这一预言正在逐渐变为现实。

10月25日,智谱AI推出了自主智能体AutoGLM,能够模拟人类操作手机,执行各种任务。

同时,智谱AI 还推出了端到端情感语音模型GLM-4-Voice,其能够理解情感,实现高度拟人的情绪表达,并且支持多语速、多语种的内容输出。

图源:智谱官网

产品一经推出,立刻引爆了资本市场,许多关联概念股持续走强:AI视频、AI教育、AI陪伴等多只个股受市场热捧。

在技术进步的支持和资本的热捧下,“个人AI助理”的时代终于要到来了吗?

AI助理概念再次火爆,为什么这次不一样?

谈到AI助理,就不得不提SIri——大部分人最早接触到的AI 助理。

自苹果最初推出Siri时,乔布斯就曾说过:“Siri属于人工智能,而不属于搜索。”但随着乔布斯的离去,如今,Siri的定位更像是一个自带语音功能的搜索引擎,而不是一个AI助理。它的迷失不仅仅意味着乔布斯远大愿景的终结,更意味着移动互联网时代的人类探索AI助理的失败。

当时间来到AI时代,Chatgpt的横空出世让人们再次燃起了对AI助理的幻想。2023年4月,AutoGPT上线,宣称能够在用户完全不插手的情况下自主执行任务。彼时,特斯拉前AI总监、Open AI联合创始人安德烈·卡尔帕西称,AutoGPT是“提示工程的下一个前沿”。更有人称AutoGPT将会替代ChatGPT。

然而,由于底层模型的推理能力不足,AutoGPT 最终也没能实现主动地识别和操作屏幕。它和茫茫多的“对话式AI大模型”一样,被困在一问一答的气泡中,没有自主操作的权力和能力——直到智谱AI 旗下AutoGLM的出现。

从评测博主们分享的画面来看,智谱AutoGLM已经能够精准识别并理解用户指令,无需用户手动操作示范,不受制于简单的任务场景或API调用,可替代用户在电子设备执行操作,可以自动完成点外卖、编辑评论、淘宝购物、朋友圈点赞、总结文章生成摘要等日常活动。

图源:数字生命卡兹克

同时,与其他的语言模型和AI助理不同的是,Auto GLM具备了一定自我纠错能力。据智谱AI团队介绍,基于自进化在线课程强化学习框架WEBRL,AutoGLM克服了训练任务稀缺、反馈信号稀少和策略分布漂移等网页智能体研究和应用难题,能够在迭代过程中不断改进、持续稳定地提高自身性能。

在智谱AI看来,理论上,AutoGLM将来可以完成人类在电子设备上做的任何事。只需要简单的语音指令,它就能够理解用户意图,自动调用工具,使用和人类相似的操作逻辑去操作手机,完成各种任务。

智谱AI将其称为“phone use”能力,有了 AutoGLM 的“phone us”,未来的手机应用将充满想象力,AI 技术也将真正惠及千万家。

从这个角度来看,AutoGLM的出现是里程碑式的。它的出现意味着,在整个AI革命的进程中,AI将不再被局限在聊天框内,而是能够真正地接管人们手中的设备。看似遥不可及的AGI,已经近在咫尺。

越开放、越智能:距离人手一个“贾维斯”还有多远?

在漫威作品《钢铁侠》中,斯塔克的AI助手“贾维斯”似乎无所不能;而反观此前市场上大多数的AI助理:他们似乎不过是垂直领域内“更专业一点”的Chatgpt,并且大多数人仍然不放心将核心工作交给AI助理来完成。

是什么限制了它们的发展?

最核心的原因,还是模型能力的不足。用智谱AI CEO张鹏的话来说,以初代GPT为代表的早期语言模型,“训练优势并不明显”。

直到OpenAI O1大模型、Claude3.5大模型等为代表的强推理模型的出现,才让AI大模型应用从简单对话生成时代,进入到Agent执行操作复杂多步骤任务时代。

过往的AI大模型更注重交互,同时在图像、视频等特定领域提供部分功能,以实现多模态的交互。而如今,大模型更注重理解和整合,即Agent能力。它要求模型具备独立思考、调用工具、完成目标的综合能力,在原有的模型基础之上,增加了规划、记忆、总结的工作流程。因此,只有这一能力得到彻底的提升,才能使得AI助理更泛化、更实用的渗透到用户日常工作和生活中去。

同时,据研究机构Gartner预测,2024年1月,在生产中接入AI助理的企业已经达到21%,到2026年,超过80%的企业都会接入AI助理。麦肯锡预测,到2030年前,它有望为全球经济贡献7万亿美元的价值,中国进一步释放生成式AI总效益的1/3。

由此可见,AI助理的需求仍然旺盛,而目前业界正在积极地对其进行布局和探索,正在努力地提高供给。如Open AI的 Agent,阿里的Mobile Agent、腾讯的App Agent、字节的豆包、荣耀的MagicOS 9.0操作系统、苹果的Apple Intelligence等。

从这个角度来看,随着AI助理渗透率的提高,AI终将成为所有人都可以使用的基础生产要素。彼时,所有的上层建筑都会重构,人类在工作和生活的协作方式、组织方式、商业模式都将迎来彻底的改变。

科技巨头们的“代理人战争”:如何解决通往AGI道路上最大的阻碍?

事实上,不仅是智谱AI,放眼整个AI行业,美国的科技巨头们都已经“转向”,开始加强自己在AI助理这一领域的产品力:

早在2023年,微软就已经开始尝试探索Copilot与办公软件的集成。今年10月,微软再次推出了Dynamics365中集成的10个自主AI助理,能够自动执行跨平台的超复杂业务,帮助企业节省时间和运营成本。

谷歌、Meta、Open AI在最近也同样在测试类似的AI助理产品,开始争夺这个市场。为什么科技巨头们放缓了在模型参数,API价格方面的内卷,转而开始加速布局AI助理?

核心的原因还是与商业化有关:

目前,顶流的AI大模型仍然保持着每年百亿美元级别的烧钱速度。Open AI预计:从2023年到2028年,公司将蒙受440亿美元的损失。如此巨大的投入,换来的却只有34亿美元左右的年化营收。

今年以来。更是有着许多大模型公司已经游走在并购、破产的边缘:Character.AI被谷歌收购;AI独角兽Inflection AI被微软收购;Stability AI单季度亏损超3000万美元,一度传出“卖身”消息。

此前,“红衣大叔”周鸿祎自硅谷交流归来,发出了一句感叹:“硅谷已经没有人在卖大模型了,大家都在卖产品。”当硅谷的创业公司都已经开始考虑推出产品盈利,足以见得盈利对于AI公司的重要性。毕竟,当泡沫逐渐退去,不管是投资人还是用户,最终都要关注自己的投入是否能够值回票价。

而针对商业化这一问题,智谱AI也给出了自己的答案:“全产品矩阵”。

自2022年开始,伴随千亿级超大规模预训练模型GLM-130B的诞生,智谱AI就基于这一千亿基座模型开始了商业化布局。

如今,从底层通用模型,到与国产算力芯片的适配,再到多模态生成和AI Agent智能体,智谱已经打通了AI产业链中全流程的技术和商业闭环,从而推出了国产大模型中最全的产品矩阵,让更多的用户和企业能够在智谱的平台上找到适合自己的产品和服务。

2023年以来,智谱AI与超过2000家的企业达成了合作,包括消费、制造、游戏、医疗、教育、文旅等多个领域的龙头企业,为C端提供个性化应用的同时为B端提供降本增效的方案。

图源:智东西

此前,博研咨询报告显示,截至2022年底,全球AI助理市场规模已达到约450亿美元,预计到2027这一数字将突破1200亿美元,复合年增长率高达22%。

从这个角度来看,面对这一广阔的市场前景,智谱AI或许已经为所有的AI企业提供了一种思路,用AI助理在产业层面的全面推广,为企业带来营收的同时,让投资者拥有继续烧钱的动力,把AI这个美好的故事继续讲下去。

来源:港股研究社

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/175.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Profinet、Ethernet/IP 工业以太网无线通信解决方案

在工业现场,我们常常会面临这样的困扰:两个PLC之间、PLC 跟远程IO之间或者PLC 跟伺服之间由于种种原因不方便布线,严重影响了通讯效率和生产进程。为了解决这一难题,三格电子设计了一款工业以太网无线网桥,这款无线网桥…

重塑未来,开源AI数字人系统引领个性化语音新纪元!AigcPanel v0.03开启公测

你是否曾梦想拥有一个能够与你对话、与你共鸣的AI数字人伙伴?现在,这一切都不再是幻想!我们自豪地推出——全新的开源AI数字人系统,一个集视频合成、声音合成、声音克隆与模型管理于一体的创新平台,让你轻松打造专属的…

js逆向-模拟加密

实战七麦数据: 1.寻找加密入口 尝试搜索的方法: 那只能使用跟栈的方法,进入send发包位置: 打上断点,寻找加密入口,前面是发包分包,promise注意到是一个异步操作,看是否在此加密&…

Kafka社区KIP-500中文译文(去除ZooKeeper)

原文链接:KIP-500: Replace ZooKeeper with a Self-Managed Metadata Quorum - Apache Kafka - Apache Software Foundation 译者:关于Kafka3.x版本最大的一个变化即是解除了对ZooKeeper的依赖,而本文的作者是大神Colin,他高屋建瓴…

【计算机网络教程】课程 章节测试1 计算机网络概述

一. 单选题(共16题) 1 【单选题】以下关于TCP/IP参考模型缺点的描述中,错误的是( )。 A、在服务、接口与协议的区别上不很清楚 B、网络接口层本身并不是实际的一层 C、它不能区分数据链路和物理层 D、传输层对…

(蓝桥杯C/C++)——常用库函数

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 一、 二分查找 1.二分查找的前提 2.binary_ search函数 3.lower_bound和upper_bound 二、排序 1.sort概念 2.sort的用法 3.自定义比较函数 三、全排列 1.next p…

软考:24年上半年选择题

软件测试的目的是降低风险,无法100%的证明被测对象的正确性。 数字孪生: EAI企业应用集成: 线性回归技术: 嵌入式系统实时特性: 计算机信息安全:最安全的是访问验证保护级,最不安全的是用…

【Linux】从零开始使用多路转接IO --- poll

碌碌无为,则余生太长; 欲有所为,则人生苦短。 --- 中岛敦 《山月记》--- 从零开始使用多路转接IO 1 前言1 poll接口介绍3 代码编写4 总结 1 前言 上一篇文章我们学习了多路转接中的Select,其操作很简单,但有一些缺…

系统架构设计师-未来信息综合技术(2)

一、机器人技术 森政弘与合田周平提出的:“机器人是一种具有移动性、个体性、智能性、通用性、半机械半人性、自动性、奴隶性等7个特征的柔性机器。” 从这一定义出发,森政弘又提出了用自动性、智能性、个体性、半机械半人性、通用性、移动性、信息性、柔性、有限性…

知识吾爱纯净版小程序系统 leibiao SQL注入漏洞复现(XVE-2024-30663)

0x01 产品简介 知识吾爱纯净版小程序系统是一款基于微信小程序平台开发的知识付费应用,旨在帮助用户快速建立自己的知识付费平台,实现支付变现和流量主收益。它提供了简洁明了的用户界面和良好的用户体验,同时注重用户隐私保护,确保用户信息的安全存储和传输。 0x02 漏洞…

CocoaPods安装步骤详解 - 2024

引言 CocoaPods的安装,如果有VPN就一直开启,会让整个流程非常顺畅。 在现代 iOS 开发中,依赖管理变得越来越重要,CocoaPods 成为开发者们首选的依赖管理工具。它不仅可以简化库的安装与更新,还能帮助开发者更高效地管…

【计网】深入理解NAT机制,内网穿透与内网打洞,代理服务

我没胆量犯错 才把一切错过 --- 林夕 《我对不起我》--- 一文了解NAT机制,代理服务,内网穿透 1 再谈 NAT 机制2 内网穿透与内网打洞3 代理服务器 1 再谈 NAT 机制 NAT机制我们在解决IP地址不足的问题中提到过。为了解决IP地址不足的问题,采…

Docker篇(安装容器)

目录 一、安装mysql容器 1. 拉取mysql镜像 2. 创建并运行容器 二、安装Tomcat容器 1. 拉取镜像 2. 创建并运行容器 三、安装Nginx容器 1. 拉取镜像 2. 创建并运行容器 四、安装Redis容器 1. 拉取镜像 2. 创建并运行容器 五、安装RabbitMQ 1. 拉取镜像 2. 创建并运…

App Inventor 2 列表显示框能否实现多选?

Q:列表显示框有没有办法做到多选的功能? // 问题分析 // AppInventor2列表显示框原生并没有多选功能,只能点击其中一项,然后触发“选择完成时”这个事件,那么有没有办法做到多选呢? // 问题思路 // 经过…

PropTypes 和 TypeScript 在 React 中的比较

文章目录 引言PropTypes什么是 PropTypes?如何使用 PropTypes优点缺点 TypeScript什么是 TypeScript?如何使用 TypeScript优点缺点 选择建议总结 引言 在 React 开发中,组件的可复用性和可维护性至关重要。为了确保组件接收到正确的 props&a…

进程间通信(命名管道 共享内存)

文章目录 命名管道原理命令创建命名管道函数创建命名管道 共享内存原理shmgetFIOK 代码应用:premsnattch 命名管道 用于两个毫无关系的进程间的通信。 原理 Linux文件的路径是多叉树,故文件的路径是唯一的。 让内核缓冲区不用刷新到磁盘中&#xff0c…

计算机毕业设计Hadoop+大模型旅游推荐系统 旅游景点推荐 旅游可视化 旅游爬虫 景区客流量预测 旅游大数据 大数据毕业设计

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 开题报告 设计&#xff08…

一般无人机和FPV无人机的区别

文章目录 一般无人机的工作原理关键组件:一般无人机的应用领域一般无人机的操控体验 FPV无人机的工作原理关键组件:FPV无人机的应用领域FPV无人机的操控体验性能特点FPV无人机的性能特点 未来无人机发展方向和通信方式拓展 一般无人机的工作原理 一般无…

react基础之redux快速上手环境准备

文章目录 核心概念配置基础环境提交action传参异步状态操作redux调试-devtools配套工具 Redux 是一个状态管理库,通常与 React 一起使用,帮助开发者管理应用的全局状态。它的核心理念是将应用的状态存储在一个单一的、不可变的状态树中,并通过…

OAuth2.0 动态注册客户端

什么是 OAuth 2.0 客户端自动注册? OAuth 2.0 客户端注册通常是在授权服务器的管理界面或通过静态配置文件手动完成的。客户端自动注册是指应用在启动或运行过程中通过代码与 OAuth 2.0 授权服务器交互,自动注册并获取 client_id 和 client_secret 等必…