迄今为止,对象存储世界已由 PUT 和 GET 的 S3 API 概念定义。然而,我们现在生活的世界需要更多。鉴于 MinIO 的 S3 部署甚至比 Amazon 还多,因此我们不得不提出下一个出色的 S3 API。
这个新 API 就是 Prompt API,它很可能成为有史以来最强大的 S3 API 扩展。它将 PUT 和 GET 范例更改为 PUT 和 PROMPT 范例,以及用户和应用程序与数据交互的方式。它在新的 AIStor 中可用。在最基本的层面上,MinIO promptObject API 允许用户或应用程序与非结构化对象通信,就像他们正在与 LLM一样。这意味着您可以要求一个对象描述自身,以查找与其他对象的相似之处,并查找与其他对象的差异。这将导致可以直接与 MinIO 上的数据对话的应用程序激增。更重要的是,promptObject API 对用户/应用程序实际上是透明的。不需要事先了解 RAG 模型、矢量数据库或其他 AI 概念。promptObject API 开箱即用,适用于多代理架构,其中内置了编排功能,可与小规模的域 AI 特定模型配合使用。这遵循了 MinIO 关于简单性的核心口号。对于组织来说,让基本的 AI 工作应该不复杂或昂贵 - 您只需要能够将 promptObject API 指向您的数据。promptObject API 以 API 的形式提供其功能。它不是一个独立的应用程序,也不是我们控制台的扩展(尽管控制台中提供了它的用户界面),而是我们 SDK 的扩展(我们支持所有主要的编程语言)。简而言之,promptObject 可以丰富现有应用程序或构建新应用程序。让我们先演示一下 promptObject API 的工作原理,然后再介绍支撑它的细节。
类似 Expensify 的应用程序的构成
promptObject API 适用于任何非结构化对象。图像就是这样一种非结构化对象,费用收据就是一个很好的例子。这里有一个:
有两种方法可以 “talk” 这个对象。一种是使用 promptObject 框直接通过控制台,另一种是通过开发人员的 Jupyter Notebook。我们将从 Jupyter Notebook 开始,因为它显示了我们正在处理的图像,并将为读者提供更多的上下文。下面是 Notebook 的示例。我们在 Notebooks 中浏览来自 AIStor 的对象,并使用 prompt_object 与对象通信
控制台中提供了相同的功能。如果需要,对象浏览器用于手动验证图像。在这里,我们询问对象有多少人来吃晚饭。
无论哪种情况,用户几乎可以询问有关收据的任何问题。平均支票大小是多少,在哪个城市,顶部的图像是什么,最贵的菜是什么?MinIO 在后端运行多模态 LLM) 并处理所有事情。它对 IT 用户或应用程序开发人员是完全透明的(但自然对数据科学团队开放以供检查)。这确实需要 GPU,但团队可以从一个 GPU 开始。还支持一次查询多个对象。在这种情况下,用户识别了三个收据,并要求 promptObject API 查找两个差异和两个相似之处。
从用户和应用程序的角度来看,可能性实际上是无穷无尽的。一个简单但非常强大的示例是向对象附加标签的概念。通常,对象进入 AIStor 时几乎没有描述性标签。它们由计算机或音频或视频生成。使用 promptObject API 和一些代码,应用程序可以要求每个新对象描述自身、总结自身、提供有关自身的特定数据。然后,它可以将该信息附加到对象本身 - 从而使搜索效果更好(请参阅目录功能)或其他应用程序更有效。在下面的 GIF 中,您将看到用户为多个对象添加了新标签。这些标签会自动检测内容是否具有个人身份信息、是否受 GDPR 约束,或者是否具有将其限制为仅供内部使用的敏感度级别。这可以与 Catalog 结合使用,以搜索特定标记及其相应值的对象。
请记住,元数据规则在此处仍然适用。第三方元数据数据库无法扩展。您需要采用元数据对对象是原子的架构(例如 AIStor)。尽管如此,更多的元数据/标签是一件好事,并且在数据到达时拥有 AI 标签数据完全改变了游戏规则。
改变业务的游戏规则
这样做的商业利益应该是显而易见的。数据是组织的核心价值。非结构化数据占企业中所有数据的 90% 以上。更多地了解这些数据并能够轻松地与非结构化数据交互 - 而无需具备 RAG 或矢量数据库技能,这非常重要。应用程序开发人员可以开发业务需要的任何内容。数据像往常一样存储在 MinIO 中。业务团队提出了一个概念,他们可以自己在 Console 中测试它,或者向应用程序团队描述它。应用程序团队可以构建一些东西 - 可能在几个小时内。AI 的目标是从数据中提取更多商业价值。以下是由 promptObject 提供支持的企业的一些好处:
1 . 将数据转化为业务洞察的直接资源。无需专业技能。
传统上,企业存储大量非结构化数据,但从中挖掘可操作的见解需要专门的数据团队、昂贵的分析工具和复杂的 ETL(提取、转换、加载)流程。promptObject API 可以消除许多这些瓶颈,使企业内的任何人都可以直接自然地查询数据。这有效地将数据存储转变为主动资源,而不是被动存档。企业可以直接询问有关其数据的问题并获得有价值的回复,无论是关于客户行为、合规性还是运营洞察,而无需单独的数据管道或专家干预。此功能可加快决策速度,并支持跨部门采取主动的数据驱动型行动。
2 . 降低 AI 技能门槛,让 AI 在整个组织中都可以使用
通过抽象出复杂的 AI 概念(例如,检索增强生成、矢量数据库),promptObject 使非技术团队能够利用 AI 驱动的见解。例如,合规官可以验证文档合规性,客户服务可以分析交互历史记录,营销团队可以直接从存储中评估营销活动绩效。AI 的这种民主化大大减少了对专业数据科学团队的依赖,使 AI 工具更容易被业务用户使用和访问。企业可以跨部门进行自助数据分析,这不仅可以提高生产力,还可以让团队在数据方面更具创新性。这对于可能难以招聘或留住 AI 人才的企业尤其有价值,尤其是在技术以外的行业。
3 . 降低与数据分析相关的基础设施和运营成本
大多数从事 AI 驱动型数据分析的企业都需要额外的基础设施,例如数据仓库或单独的 AI 处理平台。通过将 AI 驱动的查询直接嵌入到存储中,企业可以潜在地消除或减少对其他数据处理层的依赖,从而简化基础设施并降低运营开销。这将大大节省基础设施和/或云费用的成本。企业不需要专用的 AI 平台或第三方分析解决方案,而是可以利用 promptObject 进行原位分析,从而简化其数据架构并将成本整合到一个多功能存储平台上。
4 . 加快获得洞察的时间,实现实时运营敏捷性
传统的数据处理工作流程涉及许多步骤,从数据检索和清理到分析。promptObject API 允许企业通过直接与存储格式的数据交互来绕过这些步骤。这对于实时或近乎实时的洞察特别有价值,因为与传统数据处理相关的滞后太慢。更快地访问洞察意味着企业可以在数据最相关的时候对数据采取行动,这对于时间敏感型应用程序至关重要。例如,制造商可以监控设备数据以进行预测性维护,金融公司可以更快地检测欺诈行为,零售商可以实时调整定价策略。这种实时敏捷性提高了跨行业的竞争力和响应能力。
5 . 增强合规性和治理能力
随着监管要求的不断提高,许多企业都在努力保持对其非结构化数据的控制和可见性。promptObject API 直接查询数据的能力使合规官能够更有效地识别敏感信息、验证文档完整性或审计数据使用情况。API 使合规性和治理团队能够更好地管理监管风险,而无需大量的数据工作流。他们可以直接在存储中执行按需审计或合规性检查,从而大大改进数据治理实践并降低不合规风险。
6 . 通过降低实验成本来促进创新
数据驱动的实验(例如测试新产品或探索客户洞察)通常会产生与数据提取、模型训练和基础设施相关的成本。promptObject API 使实验更易于访问,使团队能够以最少的准备工作查询数据,并且不需要复杂的模型。通过降低成本和数据实验的障碍,企业可以通过鼓励团队自由探索数据洞察来培养创新文化。这可能会带来更快的原型设计、更好的客户理解以及从以前未开发的数据中得出的创新解决方案。
下一步
今天,promptObject 适用于任何非结构化对象。这包括图像、PDF、GIF 等。较长的视频仍需要一些优化。我们还需要添加对音频的支持。
期待
我们通常不是那种夸大其词的人。我们通常以产品为主导,让它来说话。随着时间的推移,它对我们来说效果很好。话虽如此,这个功能感觉很特别。在撰写这篇博文期间,我们扩展了它的功能,并提出了 API 的多个新应用程序。你用它做的越多,你对新事物的思考就越多。我们怀疑这就是 OpenAI 的团队在第一次了解他们正在处理的问题时的感受。显然,这些在量级方面差异很大,但对于存储类型,它们将立即掌握 Prompt 范式的量级。我们总是很高兴看到人们如何推动 MinIO,但我们对此功能感到特别兴奋。