公共云提供商正在错失人工智能机遇

他们目前的成功和增长得益于人工智能的应用,但从长远来看,不可持续的成本和可行的替代方案可能会让企业望而却步。

生成式人工智能正在蓬勃发展,并且将继续蓬勃发展。因此,本地和公共云提供商都看到了对其人工智能产品的需求激增,这种趋势至少在未来五年内可能会持续下去。

当然,云是企业对 AI 感兴趣的核心优势。然而,这种增长势头可能不会像许多人认为的那样持续下去。首席信息官和首席财务官经常大声抱怨云费用出乎意料地高——比他们预期的要贵 2.5 倍。随着云 AI 的出现,他们担心未来可能会出现更大、甚至更不可预测的云账单。每个人都想找到具有成本效益的替代方案。

人工智能的真正机会可能并不在公共云中,至少不是它们目前的定位。尽管公共云提供商已经奠定了基础并宣称他们已经为人工智能做好准备,但如果他们仍然对客户的担忧和市场变化充耳不闻,他们就有可能失去他们帮助创建的市场。

人工智能系统的高成本

AI 工作负载成本高昂。对于涉及大型语言模型和其他计算密集型系统的工作负载尤其如此。训练一个高级 AI 模型可能要花费数千万美元,并且还需要持续的微调、再训练和推理成本。公共云提供商拥有处理这些任务的庞大基础设施,但对于许多企业来说,其价格越来越难以承受。

随着企业从 AI 的实验和培训阶段进入生产规模推理阶段,财务成本开始超过收益。

云计算提供可预测的经济效益,包括按使用量付费和按需弹性。随着 AI 用例在整个组织中增长和扩展,当公司全天候使用数百或数千个 GPU 或 AI 所需的其他资源时,这些可预测的经济效益很快就会失去光彩。这并不是说公司看不到使用公共云提供商的好处;而是成本和收益之间的差距越来越大。

进一步加剧这一问题的是,全球能源成本不断上升,同时人工智能系统对训练、冷却和部署所需的电力需求也不断增加。IDC的一份报告显示,2024 年上半年,企业在人工智能部署的计算和存储硬件上的支出增长了 37%。值得注意的是,越来越多的支出被转移到公共云提供商之外。公共云仍然占据着早期人工智能投资的最大份额。IDC 估计,2024 年上半年,云和共享环境中支持人工智能的系统占人工智能服务器支出的 65%。然而,随着企业转向大规模部署人工智能,大多数企业发现坚持使用超大规模系统并不划算。

主机托管和微云的兴起

一个新的 AI 基础设施提供商生态系统已经出现,以填补公共云在成本竞争力方面日益扩大的差距。主机托管服务、GPU 即服务专家和混合云提供商为企业提供了极具吸引力的中间地带。这些替代方案使企业能够更好地控制其 AI 工作负载,同时避免在公共云上运行这些系统所产生的高昂费用。

CoreWeave 和 Foundry 是 GPU 即服务市场的两家新贵。这些公司在 GPU 容量和按需付费模式方面投入巨资,可与超大规模企业相媲美。甚至像 Rackspace 这样的老牌公司也通过推出自己的 GPU 即服务产品加入这一行列,而主机托管提供商也看到了新的兴趣。

与传统公共云不同,这些方法通常是从头开始构建的,以满足现代 AI 基础设施的独特需求。这意味着高密度 GPU 配置、液体冷却系统和节能设计。更重要的是,它们允许企业转向所有权模式或共享资源,从而长期降低成本。

押注错误的商业模式

公共云提供商将自己定位为构建和部署 AI 工作负载的天然家园。自然而然,AWS re:Invent 2024 的重点再次放在了生成式 AI 以及 AWS 云如何支持生成式 AI 解决方案上。随着组织纷纷涌向超大规模计算平台来训练复杂模型并快速测试新用例,早期的 AI 实验和试点推动了云收入的短期飙升。

在公有云基础设施上训练 AI 模型是一回事,大规模部署这些系统又是另一回事。通过押注 AI,公有云供应商严重依赖基于消费的定价模型。是的,在云中启动资源很容易,但这种模型的漏洞越来越难以忽视。随着公司从实验转向生产,长期、GPU 密集的 AI 工作负载不会转化为成本效率。

讽刺的是,云提供商——他们帮助创造了当今的 AI 淘金热——正面临因定价过高而被市场淘汰的危险。他们努力吸引的用户发现,主机托管服务、GPU 即服务提供商 (microcloud) 和其他混合基础设施模型在成本、控制和灵活性之间提供了更可持续的平衡。如果公共云供应商不调整其业务模式来解决这些问题,他们就有可能被更适应 AI 独特需求和规模经济的参与者边缘化。

大多数时候,我都认为他们已经预见到了这一点,但后来我又开始怀疑。公共云供应商未能及时注意到市场上的其他重大变化,例如多云、finops以及现在的 AI 优化。人们很容易说“你无法在瞬间改变一艘远洋班轮”,但当你即将靠岸时,“全速前进”是正确的策略吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/36289.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux系列】AWK 使用指南

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

什么是 k8s CNI ?

1、什么是 CNI ? CNI 是容器网络接口 (Container Network Interface)的缩写。定义了容器运行时如何与网络插件进行交互,从而管理容器网络。只要开发者遵循 CNI 定义的规范就可以接入 kubernetes ,为 Pod 创建虚拟网卡…

深入理解进程的退出、等待与替换(Linux系统)

个人主页:敲上瘾-CSDN博客 个人专栏:Linux学习、游戏、数据结构、c语言基础、c学习、算法 目录 一、进程退出 1.退出场景 2.常见退出方法 3.退出码与退出信号 4._exit函数与exit函数 二、进程等待 1.什么是进程等待(是什么?…

【初阶数据结构与算法】二叉树链式结构刷题训练(Leetcode二叉树遍历、单值二叉树、相同的树、另一棵树的子树、对称二叉树)

文章目录 一、二叉树的遍历二、单值二叉树三、相同的树四、另一颗树的子树五、对称二叉树 一、二叉树的遍历 在链式二叉树的定义与实现中我们已经详细讲解了二叉树常见的三种遍历方式,以及层序遍历,这里给出链接:【初阶数据结构与算法】二叉树…

深入浅出 Go 语言 sync包中的互斥锁、条件变量

深入浅出 Go 语言 sync包中的互斥锁、条件变量 引言 在并发编程中,多个 Goroutine 同时访问共享资源可能会导致数据竞争(Race Condition),进而引发程序的不一致性或崩溃。为了确保并发程序的正确性和稳定性,Go 语言提…

制造业数据集成案例分享:3小时内实现MySQL到MySQL数据对接

ZZ刷新生产用料清单四化库存-制造一处-3小时:MySQL到MySQL数据集成案例分享 在现代制造业中,实时、准确的数据流动是确保生产效率和资源优化的关键。本文将分享一个实际运行的系统对接集成案例——“ZZ刷新生产用料清单四化库存-制造一处-3小时”&#…

OpenCV 图像基本操作

OpenCV快速通关 第一章:OpenCV 图像基本操作 第二章:OpenCV 图像基本操作 OpenCV 图像基本操作 OpenCV快速通关第二章:OpenCV 图像基本操作一、相关结构体与函数介绍(一)cv::Mat 结构体(二)cv:…

雨晨 2610(2)0.2510 Windows 11 24H2 Iot 企业版 LTSC 2024 极简 2in1

文件: 雨晨 2610(2)0.2510 Windows 11 24H2 Iot 企业版 LTSC 2024 极简 2in1 install.esd 索引: 1 名称: Windows 11 IoT 企业版 LTSC 极简 26100.2510 描述: Windows 11 IoT 企业版 LTSC 极简 26100.2510 By YCDISM RTM 2025 24-12-07 大小: 8,176,452,990 个字节 索引: 2 …

PHP保存base64编码图片,图片有一部分是灰色块儿,原因和解决办法

文章目录 场景原因解决方案完整的代码前端代码php代码 场景 我有个需求,移动端h5上传多张的图片。用input file可以上传多张,但是现在照片体积越来越大,同时上传多张会因为体积过大,导致上传失败。如果是小程序会好很多&#xff…

【CSP CCF记录】202212-2第28次认证 训练计划

题目 样例1输入 10 5 0 0 0 0 0 1 2 3 2 10 样例1输出 1 1 1 1 1 10 9 8 9 1 样例1解释 五项科目间没有依赖关系,都可以从第 1 天就开始训练。 10天时间恰好可以完成所有科目的训练。其中科目 1 耗时仅 1天,所以最晚可以拖延到第 10 天再开始训练&…

gitee

Git 是一个开源的 [ 分布式 ][ 版本控制系统 ] ,用于敏捷高效地 处理任何或小或大的项目 Git 非常容易学习,低植入,高性能。因为拥有轻量的本地分支,易用的暂存区,和多工作流的特点,它超越了类似Subversio…

Spring——SpringBean初始接口

摘要 本文详细介绍了Spring框架中SpringBean的初始化接口和注解,包括BeanPostProcessor接口、InitializingBean接口和PostConstruct注解。文章解释了这些接口和注解的原理、作用、适用场景,并提供了示例代码。最后,对比了不同SpringBean初始…

「嵌入式系统设计与实现」书评:学习一个STM32的案例

本文最早发表于电子发烧友论坛:【新提醒】【「嵌入式系统设计与实现」阅读体验】 学习一个STM32的案例 - 发烧友官方/活动 - 电子技术论坛 - 广受欢迎的专业电子论坛!https://bbs.elecfans.com/jishu_2467617_1_1.html 感谢电子发烧友论坛和电子工业出版社的赠书。 …

操作系统——大容量存储结构

笔记内容及图片整理自XJTUSE “操作系统” 课程ppt,仅供学习交流使用,谢谢。 大容量存储结构概述 磁盘 磁盘为现代计算机系统提供大量外存。每个盘片为平的圆状(类似CD),普通盘片直径为4.5~9.0厘米。盘片的两面都涂着…

Redis从入门到进阶(总结)

以下内容均以CentOS7为背景。 一、Redis安装及启动 mysql(读:2000/s;写:600/s) redis(读:10w/s;写:8w/s)通过官方给出的数据单机并发可以达到10w/s&#xf…

Java进阶(注解,设计模式,对象克隆)

Java进阶(注解,设计模式,对象克隆) 一. 注解 1.1 什么是注解 java中注解(Annotation),又称java标注,是一种特殊的注释 可以添加在包,类,成员变量,方法,参数等内容上 注解会随同…

使用 Gin 框架构建 RESTful 博客 API

使用 Gin 框架构建 RESTful 博客 API 引言 在现代 Web 开发中,RESTful API 是一种非常流行的设计风格,它通过 HTTP 协议与客户端进行通信,提供了灵活且易于扩展的接口。Go 语言以其高效的并发处理能力和简洁的语法,成为了构建高…

Leecode刷题C语言之骑士在棋盘上的概率

执行结果:通过 执行用时和内存消耗如下: 代码如下: static int dirs[8][2] {{-2, -1}, {-2, 1}, {2, -1}, {2, 1}, {-1, -2}, {-1, 2}, {1, -2}, {1, 2}};double knightProbability(int n, int k, int row, int column){double dp[200][30][30];mem…

21. C++STL 7(8000字详解list及其迭代器的模拟实现)

⭐本篇重点:STL中的list及其迭代器的模拟实现和测试 ⭐本篇代码:c学习 橘子真甜/c-learning-of-yzc - 码云 - 开源中国 (gitee.com) 目录 一. list的节点 二. list的迭代器 2.1 迭代器框架 2.2 迭代器实现 三. list的实现 3.1 list的构造函数 3.…

Docker打包SpringBoot项目

一、项目打成jar包 在进行docker打包之前,先确定一下,项目能够正常的打成JAR包,并且启动之后能够正常的访问。这一步看似是可有可无,但是能避免后期的一些无厘头问题。 二、Dockerfile 项目打包成功之后,需要编写Doc…