AIHub: 模型和数据集的私有云存储库

AIStor 的最新功能之一是广受欢迎的开源项目 Hugging Face 的私有云版本。这篇文章详细介绍了 AIStor 的 AIHub 如何有效地创建一个完全由企业控制的 API 兼容的私有云版本的 Hugging Face。在我们开始之前,介绍 Hugging Face 是有意义的。Hugging Face 是面向 AI 工程师的领先开放平台。它的使命是使机器学习大众化,并成功创建了一个用于共享模型和数据集的云平台。许多在模型研发方面处于领先地位的大型科技公司 - 特别是在大型语言模型 (LLMs - 都为 Hugging Face 做出了贡献。这是一件大事,因为 LLMs 的训练时间和金钱成本很高。当共享像 LLMs,没有资源从头开始构建 LLMs可以使用 AI 向前发展,如果没有 Hugging Face 提供的共享,这是不可能的。此外,对真正的开放 AI 感兴趣的技术领导者也将开源用于训练他们开源模型的数据。模型的好坏取决于用于训练它们的数据。允许共享训练数据意味着社区可以审查它是否存在潜在的偏差和其他缺点。如果发现问题,则可以找到新数据来纠正问题,还可以共享新数据。Hugging Face 还提供用于共享数据集的产品。Hugging Face 进一步发展 AI 的努力并不止于模型和数据共享。他们还创建了用于减少操作模型和数据所需的代码量的库。您可以将这些库视为封装模型和数据复杂性的抽象层。这些库已被社区直接大量使用。以下是更流行的 Hugging Libraries 的列表和简短描述。

Transformers - Transformers 提供 API 和工具来下载和训练最先进的预训练模型。预先训练的模型可以降低您的计算成本和碳足迹,并节省从头开始训练模型所需的时间和资源。

数据集 - 数据集是一个库,用于轻松访问和共享表格、音频、计算机视觉和自然语言处理 (NLP) 任务的数据集。

扩散器 - 扩散器库是由 Hugging Face 开发的一个 Python 库,用于处理扩散模型,扩散模型是一种可以创建高质量图像、音频和其他数据的生成模型。

Sentence Transformers - 是用于访问、使用和训练最先进的文本和图像嵌入模型的首选 Python 模块。它可用于使用 Sentence Transformer 模型计算嵌入,或使用 Cross-Encoder 模型计算相似性分数。

使用 Hugging Face 库构建的生态系统

特别有趣的是,其他 AI 工具也依赖于 Hugging Face 的库,并使用它们来提供其功能。例如,许多推理服务器使用 Hugging Face 作为查找和部署模型的中心。以下是使用 Hugging Face API 的常见推理服务器、编排库和微调库的简短列表。

vLLM - vLLM 推理服务器是适用于大型语言模型 (LLMs。它优化了内存使用和并行化,以实现快速响应时间和高吞吐量。它旨在支持基于 Transformer 的模型,包括 Hugging Face 模型。vLLM - vLLM 推理服务器是适用于大型语言模型 (LLMs。它优化了内存使用和并行化,以实现快速响应时间和高吞吐量。它旨在支持基于 Transformer 的模型,包括 Hugging Face 模型。

Nvidia Triton 推理服务器 - NVIDIA Triton 推理服务器是 NVIDIA AI 平台的一部分,可与 NVIDIA AI Enterprise 一起使用,是一款开源软件,可标准化每个工作负载中的 AI 模型部署和执行。

Ollama - Ollama 是一个轻量级的可扩展框架,用于在本地计算机上构建和运行语言模型。它支持 macOS、Linux 和 Windows。

LangChain - LangChain 是一个框架,用于构建由 LLMs。它旨在帮助开发人员编排工作流,包括数据摄取、数据检索、提示创建和推理等任务。

隐私和控制问题

在理想情况下,所有通过微调改进的模型也将与用于改进它们的数据一起共享。不幸的是,情况并非总是如此。对于某些组织,隐私和控制优先于共享。对于在受到严格监管的行业中运营的组织以及负责个人身份信息 (PII) 的组织来说尤其如此。对于希望使用公共 AIHub 作为起点,但在数据集增加敏感信息并且模型已根据这些新数据进行微调后需要隐私和控制的组织,以下是典型的工作流程。

许多希望使用 Hugging Face 模型和数据集作为其 AI 计划的起点的组织可能已经使用蛮力实施了上述逻辑。这通常是使用网络共享作为伪集线器来完成的。遗憾的是,使用网络共享作为中心不是一个可缩放或高性能的解决方案。此外,Hugging Face API 不包含在下载之前在本地中心内查找所请求模型(或数据集)版本的逻辑。这需要手动覆盖所有下载功能,这很容易出错。暴力破解方法的最后一个问题是,默认情况下,Hugging Face API 中的所有上传函数和方法都配置为将模型和数据集发送回 Hugging Face。很容易意外地将私有数据或使用私有数据训练的模型发送回公共 Hugging Face Hub。需要的是一种简单的方法,使用配置来循环使用上面显示的逻辑,同时允许开发人员使用 Hugging Face API - 或构建在 Hugging Face API 之上的任何其他库。

AIHub 简介

AIHub 以 Hugging Face API 为目标,并实现了与这些 API 完全兼容的代理服务器。无需更改代码,应用程序开发人员可以使用现有的 Hugging Face 库从 Hugging Face 下载现有模型并将其保存到 MinIO 存储桶中。对同一模型的后续请求将导致 Hugging Face 库从 MinIO 中提取模型。如果模型被增强或微调,新版本将被推送到 MinIO 并与原始版本一起保存。数据集的工作方式相同。最重要的是,工程师可以使用 AIHub 通过熟悉的工具在本地保存模型和数据。

让我们检查一下 Python 客户端、Hugging Face Hub 和 AIHub 之间的关系,如下图所示,以更好地了解 AIHub 的工作原理。请注意,AIHub 包括 AIHub 服务器和 AIStor 存储桶,两者均如图所示。

AIHub 服务器是一个代理服务器,可以拦截来自 Hugging Face API 的所有请求。它还包含上一节中所示的工作流中显示的逻辑。也就是说,如果 AIStor 存储桶中已经存在模型或数据集,那么这就是将从 Hugging Face 下载 API 返回的模型。如果 AIStor 存储桶中不存在,则将从 Hugging Face 下载它并自动保存在存储桶中。AIStor 存储桶是 MinIO 中的一个存储桶,它是一个可扩展且高性能的对象存储。最后,AIHub 服务器将所有保存和推送请求发送到 AIStor 存储桶。模型和数据集永远不会发送回 Hugging Face。

设置和使用 AIHub

由于 AIHub 服务器需要连接到 AIStor 实例中的存储桶,因此其配置需要所有必要的信息才能连接到 AIStor 并找到所需的存储桶。下面是 AIStor UI,显示了 AIHub 服务器连接到 AIstor 并找到将充当本地集线器的存储桶所需的六个环境变量。

多个 AIHub 可以托管在单个 AIStor 租户中。管理员可以使用 AIStor 控制台用户界面对其进行配置。AIHub 实例也可以使用 YAML 以声明方式指定,然后通过 AIStor 控制台上传到 AIStor 租户。想要使用 AIHub 的 ML 工程师只需在工作流程开始时设置一个环境变量。下面是一个代码片段,其中显示了必须设置的环境变量。这就是使用 AIHub 所需要做的全部工作。如果 ML 工程师使用 Jupyter Notebook,则应将此变量设置为 Jupyter Notebook 环境设置的一部分。

import os
os.environ['HF_ENDPOINT'] = 'https://ai-hub.aistor.company.com'

结论

处于 AI 早期阶段的组织可以转到 Hugging Face 并找到模型来引导他们的计划。Hugging Face 使组织能够轻松地使用开放模型和数据集构建 AI。但是,Hugging Face 上的所有内容都是开放的,许多组织需要将最初从 Hugging Face 下载的模型保存到本地安全中心。他们还需要使用私有且完全由他们控制的数据来微调这些模型。AIHub 是旨在应对这些挑战的统包式解决方案。使用 AIHub,客户可以将其模型和数据集安全地存储在 AIStor 租户中,完全由他们控制。这一切都发生在让工程师使用 Hugging Face 的模型或数据集的初始版本开始他们的 ML 管道时。此外,不需要新的库。现有的 Hugging Face 库和依赖于 Hugging Face 的任何其他库将按原样工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/16169.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【SAP FICO】财务三大报表_2-进阶(现金流量表-数据表结构、取数逻辑)

系列文章目录 文章目录 系列文章目录前言一、现金流量表二、现金流量表的数据表结构1、核心数据表2、内部数据结构 三、现金流量表的取数逻辑1、获取用户输入2、获取数据3、处理数据 总结 前言 承接上篇财务三大报表_2-进阶(利润表-数据表结构、取数逻辑&#xff0…

【人工智能】深入解析!三种实现ChatGPT打字机效果的最佳方案

在当今AI快速发展的时代,ChatGPT 凭借其强大的自然语言处理能力,已经成为众多开发者和企业的首选工具。然而,如何在前端页面中实现类似于ChatGPT的打字机效果,以提升用户交互体验,成为了一个广受关注的话题。今天&…

C++:继承

一、什么是继承? 概念: 在我们认识模板之后,模板是写与类型无关的代码,是一种复用方法。今天讲解的是继承,继承也是代码复用的方法,是在原有的基础上进行增加新的类。由此继承体现了面向对象的层次结构&a…

Java版本Spring Cloud+SpringBoot b2b2c:Java商城实现一件代发设置及多商家直播带货商城搭建

一、产品简介 我们的JAVA版多商家入驻直播带货商城系统是一款全*面的电子商务平台,它允许商家和消费者在一个集成的环境中进行互动。系统采用先进的JAVA语言开发,提供多商家入驻、直播带货、B2B2C等多种功能,帮助用户实现线上线下的无缝对接…

【Linux】进程

目录 谈谈硬件冯诺依曼体系结构数据流向 谈谈软件(操作系统)什么是操作系统?为什么需要操作系统?操作系统如何管理? 谈谈进程管理进程PCB查看进程ps ajxprockill -9 PID 系统调用getpid()getppid()fork() 进程状态linux下的进程状态RSDT/tXZ …

【comfyui教程】ComfyUI绘画|ComfyUI 本地部署(Windows系统)

前言 关于 ComfyUI 的部署,推荐使用 Window系统 英伟达显卡 的搭配组合。 整合包下载⏬ 所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~ PS:最好是下载到固态硬盘内,确保存储空…

飞牛云fnOS本地部署1Panel服务器运维管理面板并搭建Halo个人博客

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

Python实现贪吃蛇 经典解压小游戏!附源码

大家应该都玩过诺基亚上面的贪吃蛇吧,那是一段美好的童年回忆,本文将带你一步步用python语言实现一个snake小游戏! 基础环境必备 版本:Python3 ●系统:Windows ●相关模块:pygame pip install pygame安…

史上最强大的 S3 API?介绍 Prompt API。

迄今为止,对象存储世界已由 PUT 和 GET 的 S3 API 概念定义。然而,我们现在生活的世界需要更多。鉴于 MinIO 的 S3 部署甚至比 Amazon 还多,因此我们不得不提出下一个出色的 S3 API。 这个新 API 就是 Prompt API,它很可能成为有…

微信小程序 — 农产品供销系统

农产品供销系统 一:基本介绍开发环境功能模块图系统功能部分数据库表设计 二:部分系统页面展示小程序登录界面小程序首页水果分类列表 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/415514d6c40c461c91c1739a4f682fea.jpeg#pic_center)小程序…

为什么说数字化转型需要用到RPA

在现代商业环境中,数字化转型已成为企业追求创新、提高竞争力和适应市场变化的重要战略。然而,数字化转型不仅仅是简单地将纸质文档转化为电子文件或引入新的IT系统,而是要全面优化和重塑企业的业务流程、运营模式和客户体验。在这一过程中&a…

海外媒体发稿:聚焦摩洛哥世界新闻 Morocco World News

关于摩洛哥世界新闻简介: 摩洛哥世界新闻:通过卓越的新闻报道倡导言论自由和深思熟虑的辩论 摩洛哥世界新闻致力于向广大受众提供摩洛哥和中东及北非地区的新闻,不带偏见或政治目的。摩洛哥世界新闻的愿景是成为言论自由的捍卫者&#xff0…

快速建造高品质音乐厅:声学气膜馆打造专业降噪空间—轻空间

随着音乐艺术在城市生活中的地位不断提升,各类音乐厅和演出场馆的需求量也逐年增加。然而,传统音乐厅的建设往往周期长、成本高,特别是在城市中心和文化聚集区,土地资源有限,建造优质的音乐厅面临诸多挑战。如何在有限…

Stable Diffusion Web UI - Checkpoint、Lora、Hypernetworks

Checkpoint、Lora、Hypernetworks是 Stable Diffusion Web UI 生图的重要工具,它们有各自的特点,结合不同的生图场景选择一个或者多个叠加使用,能够更好的命令 Stable Diffusion 生成理想状态的图片。 以人像生图用通俗的方式解释checkpoint…

深度学习神经网络热点全解:原理精析与丰富应用场景大揭秘

深度学习神经网络是人工智能领域的重要研究方向,以下是一些热点方向及其原理和具体应用场景: 这些深度学习神经网络的热点领域不断推动着人工智能技术的发展和创新,在各个行业和领域展现出了巨大的应用潜力,同时也面临着一些技术挑…

越南很火的slots游戏投放Google谷歌广告策略

越南很火的slots游戏投放Google谷歌广告策略 越南的slot游戏市场正在借助Google广告代投策略推动增长。随着智能手机的普及和互联网的普及,越南的游戏市场迅速增长,吸引了越来越多的投资者和开发者进入该市场。 在这个竞争激烈的市场中,广告…

构建安全的数据库环境:群晖NAS安装MySQL和phpMyAdmin详细步骤

文章目录 前言1. 安装MySQL2. 安装phpMyAdmin3. 修改User表4. 本地测试连接MySQL5. 安装cpolar内网穿透6. 配置MySQL公网访问地址7. 配置MySQL固定公网地址8. 配置phpMyAdmin公网地址9. 配置phpmyadmin固定公网地址 前言 本文将详细讲解如何在群晖NAS上安装MySQL及其数据库管理…

多边形Newell向量

多边形Newell向量 空间平面多边形的Newell向量可以用来表示一个该多边形所在平面的法向量而且 Newell向量的模是这个多边形的面积。 Code 计算多边形的法向量和中心点。 template<typename T> void PolygonTriangulation::ComputePolygonPlane(const TArray<TVect…

【9687】基于springboot+vue的在线考试系统

作者主页&#xff1a;Java码库 主营内容&#xff1a;SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。 收藏点赞不迷路 关注作者有好处 文末获取免费源码 项目描述 21世纪&#xff0c;我国就已普及互联网信息&#x…

出行如何用远程控制软件实现异地办公?

远程办公软件让你轻松享受假期&#xff01; 想象一下&#xff0c;像类似于国庆长假里&#xff0c;你在海边享受着悠闲时光&#xff0c;突然工作上有点急事需要处理。这时&#xff0c;如果你有一款好用的远程办公软件&#xff0c;一切就变得轻松多了。今天&#xff0c;我们就来…