本科生已不够 AI公司雇佣各领域专家训练大模型

9月29日消息,人工智能模型的性能在很大程度上依赖于其训练数据的质量。传统方法通常是雇用大量低成本劳动力对图像、文本等数据进行标注,以满足模型训练的基本需求。然而,这种方式容易导致模型在理解和生成信息时出现“幻觉”现象,即生成不准确或误导性的信息。为了解决这一问题,许多初创公司如今更倾向于聘请拥有高学历和专业背景的专家来参与模型训练,确保训练数据的准确性和深度,从而提升模型的整体表现。

以下为翻译全文:

早年,像ChatGPT及其竞争对手Cohere等人工智能模型要生成类似人类的反应,需要依赖大量低成本的人力团队,帮助模型区分基本事实,比如一张图像是汽车还是胡萝卜。

然而,随着竞争愈发激烈,对人工智能模型的升级已转变为一项高复杂度的专业任务,如今需要一个快速扩展的专业训练师网络。这些训练师涵盖从历史学家到科学家等专业人才,有些甚至拥有博士学位。

Cohere联合创始人Ivan Zhang在谈到其内部训练师队伍的变化时表示:“一年前,我们还可以雇佣本科生来大致教AI如何改进。而现在,我们有执业医师教模型如何在医疗环境中工作,还有金融分析师和会计师帮助模型在特定领域表现更好。”

在这里插入图片描述
为提升培训能力,估值已超50亿美元的Cohere与一家名为Invisible Tech的初创公司合作。Cohere是OpenAI的主要竞争对手之一,专注于为企业提供AI服务。

初创公司Invisible Tech雇佣了数千名远程培训师,并已成为AI行业的主要合作伙伴之一,为包括AI21和微软在内的多家人工智能公司提供训练服务,帮助减少被称为“幻觉”的AI错误现象。Invisible创始人弗朗西斯·佩德拉萨(Francis Pedraza)表示:“我们在全球100多个国家拥有5000多名具有博士、硕士学位及深厚专业知识的专家。”

根据任务的复杂程度和工作地点,Invisible的时薪最高可达40美元。其他公司如Outlier支付的时薪高达50美元,而Labelbox则为像量子物理这样的“高专业性”科目提供高达200美元的时薪,基础类任务起步价为15美元。

Invisible成立于2015年,最初主要为DoorDash等公司提供工作流程自动化服务,比如将外卖菜单数字化。然而,转折点出现在2022年春季,在ChatGPT公开发布前,OpenAI主动寻求与Invisible合作。

佩德拉萨回忆道:“OpenAI遇到了一个问题,早期版本的ChatGPT在回答问题时容易陷入‘幻觉’,其答案不可靠。为此,他们需要一个能够通过人类反馈来强化AI学习的先进训练伙伴。”

生成式人工智能依赖过去用于训练的数据生成新内容。然而,有时它无法区分真假信息,产生所谓的“幻觉”。一个例子发生在2023年,当时谷歌的聊天机器人在宣传视频中分享了关于哪个望远镜首次拍摄到太阳系外行星的不准确信息。

AI公司意识到,“幻觉”现象可能会影响生成式人工智能在商业领域的吸引力,因此他们正在尝试各种方法减少这种现象,其中包括利用人类训练师来教导AI区分事实与虚构。

自与OpenAI合作以来,Invisible迅速成为众多生成式AI公司的首选培训伙伴,其客户包括Cohere、AI21和微软等。尽管微软尚未正式确认合作关系,但Cohere和AI21已承认是Invisible的大客户。

佩德拉萨指出:“在人工智能行业,培训成本是企业的第二大支出,仅次于算力。而高质量的培训对于确保模型的准确性和可靠性至关重要。”

它是如何工作的?

OpenAI的生成式人工智能热潮背后有一个名为“人类数据团队”的团队支持。该团队与AI训练师合作,收集专业数据以训练ChatGPT等模型。

熟悉该公司流程的知情人士透露,OpenAI的研究人员设计了一系列实验,旨在解决诸如减少“幻觉”、优化写作风格等问题。他们与Invisible等供应商的AI训练师合作,根据需求收集和处理数据。

上述知情人士说,在任何时候,同时进行的实验项目都可能多达数十项,这些项目有的可以采用OpenAI的自研工具,也可以使用供应商提供的解决方案。

Invisible会根据AI公司的需求,雇佣具有相关学科背景的专家,无论是研究瑞典历史的学者还是金融建模专家,都可以为这些AI项目贡献力量,帮助减少AI公司管理大量训练师的负担。

佩德拉萨表示:“OpenAI拥有世界顶尖的计算机科学家,但他们不一定精通瑞典历史、化学或生物等专业领域的问题。”他补充说,仅OpenAI就有超过1000名合同工为其提供数据标注服务。

Cohere的Ivan Zhang亲自体验了Invisible训练师的能力,并成功教会Cohere的生成式AI模型如何从大数据集中提取相关信息。

竞争加剧

在AI训练数据集领域,Scale AI是Invisible的主要竞争对手。这家私营初创公司估值达140亿美元,不仅提供数据集服务,还开始为AI公司提供培训服务,并将OpenAI列为其客户之一。Scale AI没有回应置评请求。

相比之下,Invisible的资金募集显得更为保守,自2021年起开始盈利,仅获得了800万美元的主要资本。佩德拉萨表示:“我们70%的股权归团队所有,30%的股权归投资者。”他还透露,最近的公司估值已达5亿美元。

最早进入AI训练领域的培训师主要通过从事数据标注工作,要求相对较低,因此报酬也较低,有时每小时薪酬低至2美元,主要由非洲和亚洲国家的劳动者完成。

然而,随着AI技术的快速发展,对专业培训师的需求急剧上升,涵盖数十种语言和领域,创造了一个高薪利基市场。如今,来自各个学科的专家无需编程技能,也有机会成为AI培训师。

AI公司的需求正催生出更多提供类似服务的企业。Ivan Zhang说:“我的收件箱几乎被不断涌现的新公司所淹没,这些公司纷纷涌入人工智能训练服务市场。这的确是一个全新的领域,公司雇佣人类只是为了给我们这样的人工智能实验室创造数据。”

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1552800.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

<<迷雾>> 第5章 从逻辑学到逻辑电路(5)--异或门 示例电路

!ABA!B 的逻辑电路组成 info::操作说明 鼠标单击开关切换开合状态 注: 这个实际就是 异或门, 当两个输入相异时输出高电平, 否则输出低电平 primary::在线交互操作链接 https://cc.xiaogd.net/?startCircuitLinkhttps://book.xiaogd.net/cyjsjdmw-examples/assets/circuit/cyj…

读数据湖仓04数据架构与数据工程

1. 大容量存储器 1.1. 几乎是到最后时刻,大容量存储器才被引入基础数据的基础设施中 1.1.1. 分析人员通常不会直接在大容量存储器中进行数据分析 1.1.2. 大容量存储器在基础数据中扮演的角色也特别重要,它能够在许多方面支持数据分析人员自由灵活地完成…

从零开始搭建UVM平台(七)-加入monitor

书接上回: 从零开始搭建UVM平台(一)-只有uvm_driver的验证平台 从零开始搭建UVM平台(二)-加入factory机制 从零开始搭建UVM平台(三)-加入objection机制 从零开始搭建UVM平台(四&…

Github 2024-10-02C开源项目日报 Top9

根据Github Trendings的统计,今日(2024-10-02统计)共有9个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量C项目9BitBake项目1Netdata: 开源实时监控平台 创建周期:4020 天开发语言:C协议类型:GNU General Public License v3.0Star数量:68982 个For…

JAVA开源项目 周边产品销售网站 计算机毕业设计

本文项目编号 T 061 ,文末自助获取源码 \color{red}{T061,文末自助获取源码} T061,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 查…

【算法】0/1背包问题

背包中有一些物品,每件物品有它的价值与重量,给定一个重量,在该重量范围内取物品(每件物品不可重复取),求最大价值。 将需求转化为表格,每一行中的每个格子代表可选哪些下标的物品在总重量限额内…

VMware Aria Operations 8.18 发布,新增功能概览

VMware Aria Operations 8.18 - 多云 IT 运维管理 通过统一的高性能平台,实现跨私有云、混合云和多云环境的 IT 运维管理。 请访问原文链接:https://sysin.org/blog/vmware-aria-operations/,查看最新版。原创作品,转载请保留出…

营业执照显示经营异常怎么回事

经营异常是怎么回事?是什么意思?首先,我们要明确什么是公司经营异常。简单来说,就是公司在经营过程中出现了一些问题,导致公司无法正常运营。这些问题可能包括未按规定报送年度报告、未按规定公示有关信息等。那么&…

资源《Arduino 扩展板1-LED灯》说明。

资源链接:Arduino 扩展板1-LED灯 1.文件明细: 2.文件内容说明 包含:AD工程、原理图、PCB。 3.内容展示 4.简述 该文件为PCB工程,采用AD做的。 该文件打板后配合Arduino使用,属于Arduino的扩展板。 该文件主要有…

Vue 路由设置

为了防止遗忘,记录一下用Vue写前端配置路由时的过程,方便后续再需要用到时回忆。 一、举个例子 假如需要实现这样的界面逻辑: 在HomePage中有一组选项卡按钮用于导航到子页面,而子页面Page1中有一个按钮,其响应事件是…

C++继承的三种方式[ACCESS]

C继承的定义 两个类的继承关系在派生类中声明,派生类定义使用以下语法: class DerivedClass: [ACCESS] BaseClass{ /…/ }; 冒号(:)后的[ACCESS]是继承的最高权限级别符,可以是以下三个值(存取权限级别&am…

业务封装与映射 -- ODUflex

ODUflex,即灵活速率光数字单元,带宽范围1.25G~100G。目前ITU-T G.709定义了两种形式的ODUflex,基于固定比特速率业务的ODUflex (CBR)和基于包业务的ODUflex (GFP)。 ODUflex特点 高效承载 提供灵活可变的速率适应机制。用户可根据业务大小&…

5. 常用开源数据集快速导入Linux服务器(AutoDL)——深度学习·科研实践·从0到1

目录 1. 查找公开数据 2. 解压到自己的数据盘中 3. 解压常用指令 1. 查找公开数据 参考文档:AutoDL帮助文档-公开数据查找和导入 AutoDL提供了部分常用开源数据,供咱在实例中进行使用,免去下载上传的烦恼(直接解压到咱的服务…

OpenAi FunctionCalling 案例详解

源码详细讲解 pdf 及教学视频下载链接:点击这里下载 FunctionCalling的单一函数调用 天气预报查询(今天长沙的天气如何?) import json import requests from openai import OpenAIclient OpenAI()location "长沙"…

鸿蒙开发知识点速记全解

入门 1、API涵盖应用框架、系统、媒体、图形、应用服务、AI六大领域。 应用框架相关Kit开放能力:Ability Kit(程序框架服务)、ArkUI(方舟UI框架)等。系统相关Kit开放能力:Universal Keystore Kit&#xf…

24-10-1-读书笔记(二十一)-《契诃夫文集》(四)下([俄] 契诃夫 [译] 汝龙) 我爱你,娜坚卡。

文章目录 《契诃夫文集》(四)下([俄] 契诃夫 [译] 汝龙 )目录阅读笔记记录总结 《契诃夫文集》(四)下([俄] 契诃夫 [译] 汝龙 ) 十月第一篇,放假了,挺高兴的&…

四、I/O控制方式

1.程序直接控制方式 完成一次读/写的过程 CPU千预频率 每次I/O的数据传输单位 数据流向 优缺点 CPU发出I/0命令后需要不断轮询 极高 字 设备→CPU→内存 内存→CPU→设备 优点:实现简单。在读/写指令之后,加上实现循环检查的一系列指令即可(因此才称为“程…

WaterCloud:一套基于.NET 8.0 + LayUI的快速开发框架,完全开源免费!

前言 今天大姚给大家分享一套基于.NET 8.0 LayUI的快速开发框架,项目完全开源、免费(MIT License)且开箱即用:WaterCloud。 可完全实现二次开发让开发更多关注业务逻辑。既能快速提高开发效率,帮助公司节省人力成本&…

Stable Diffusion绘画 | 来训练属于自己的模型:打标处理与优化

上一篇完成的打标工作,是为了获取提示词,让AI认识和学习图片的特征。 因此,合适、恰当、无误的提示词,对最终模型效果是相当重要的。 Tag 如何优化 通过软件自动生成的 Tag 只是起到快速建立大体架构的作用,里面会涉…

某大型公园定岗定编项目成功案例纪实

某大型公园定岗定编项目成功案例纪实 ——优化人力配置,实施灵活化人员调整策略,解决忙闲不均问题 【客户行业】文旅行业;事业单位;公园 【问题类型】定岗定编 【客户背景】 某大型公园随着上级政策的改变,公园取…