不只是模仿,伯克利新研究赋予机器人跨实体自主学习的能力,零样本时代已来

导读:

在当今科技飞速发展的时代,机器人技术正不断地给我们带来惊喜和变革。2024 年 9 月,一篇来自加州大学伯克利分校、丰田研究所和Physical Intelligence 的研究论文RoVi-Aug: Robot and Viewpoint Augmentation for Cross-Embodiment Robot Learning引起了广泛关注。该创新性的机器人数据增强方法,在跨实体机器人的数据利用和学习方面有重大意义。©️【深蓝AI】编译

▲图1|RoVi-Aug整体流程概述©️【深蓝AI】编译

1. 背景

机器人的研究通常面料数据的收集和利用层面的困难。扩大数据规模虽然能使机器人学习到的策略更具通用性和鲁棒性,但收集真实机器人数据耗时耗力。现有的机器人学习数据集存在着机器人类型和相机角度分布不平衡的问题,这使得该数据对应的策略容易过拟合。例如,当一个策略在特定类型的机器人上训练后,可能无法很好地适应其他不同类型的机器人;或者当相机角度发生变化时,策略的性能会大幅下降。

Open-X Embodiment(OXE)项目通过合并数据集展示了协同训练的积极效果,但该数据集高度不平衡。此外,当政策在部署到其他机器人或不同相机角度时,往往需要进行微调,这增加了实际应用的复杂性和成本。测试时适应算法 Mirage 虽然能实现零样本转移,但也存在一些局限性。它需要精确的机器人模型和相机矩阵,不允许该数据集对应的策略进行微调,并且对相机姿态的变化有一定的限制。

2. 相关工作

■2.1 跨实体机器人学习

之前有很多研究对「如何使用多样的数据来源来增加样本效率和加速学习」做出了诸多尝试。例如,利用模拟数据、其他机器人数据和人类或动物视频等,通过联合训练,从而学习更稳健和通用的策略。最近,许多工作也开始探索如何在大型和多样化的真实机器人数据上进行训练。这为RoVi-Aug的研究提供了重要的理论基础和实践经验。

■2.2 生成式模型和机器人数据增强

生成式模型发展迅速,人们利用生成式模型进行机器人研究的兴趣也日益浓厚。例如,使用语言模型进行规划、控制、奖励规范和数据重新标记;图像和视频生成式模型用于生成模拟、数据增强和视觉目标规划等。RoVi-Aug正是在这一背景下,充分利用了扩散模型的优势,实现了机器人和视点的增强,为机器人学习和反馈带来了新的思路。

3. RoVi-Aug详细方法

■3.1 创新的数据增强方法:RoVi-Aug

RoVi-Aug是一种全新的机器人数据增强方法,它利用扩散模型生成具有新机器人和视点的轨迹。这一方法为机器人学习提供了更多样化的数据,有助于提高策略的通用性和鲁棒性。

具体来说,RoVi-Aug 包括机器人增强(Ro- Aug)和视点增强(Vi-Aug)两个部分。机器人增强能够将图像中的源机器人转换为不同的目标机器人,从而弥合不同机器人之间的视觉差距,实现零样本部署在目标机器人上。视点增强则可以提高策略对相机姿态变化的鲁棒性。

▲图2|给定机器人图像,RoVi-Aug使用最先进的扩散模型来增强数据,并生成来自不同机器人和视角的合成图像©️【深蓝AI】编译

■3.2 物理实验

通过一系列物理实验,研究团队得出了多个重要结论。

首先,机器人增强(Ro-Aug)能够有效地弥合机器人之间的视觉差距,使得训练好的策略可以在没有任何额外训练的情况下,直接部署在目标机器人上,并且表现出良好的性能。

其次,视点增强(Vi-Aug)可以显著提高策略对相机姿态变化的鲁棒性。在实际应用中,相机角度的变化是不可避免的,而Vi-Aug可以让策略更好地适应这种变化,提高机器人的自主决策能力。结合机器人和视点增强的RoVi-Aug能够成功地将策略零样本部署在具有不同相机角度的不同机器人上。这意味着,通过RoVi-Aug训练的策略可以在各种不同的机器人和环境中快速部署,大大提高了机器人的适应性和灵活性。

最后,RoVi-Aug还可以学习多机器人多任务策略,并提高了新机器人和任务的组合上通用策略的微调样本效率。这对于实际应用中的复杂任务和多机器人协作场景具有重要意义。

图3|用于做评估的任务©️【深蓝AI】编译在这里插入图片描述

■3.3 局限性

尽管RoVi - Aug取得了显著的成果,但它也存在一些局限性。

机器人增强的链路依赖于一系列不同的模型,可能会导致误差级联。研究人员可以探索统一的模型来处理多对机器人,提高系统的稳定性和准确性。对于视点增强,目前新视图合成的质量还有待提高。未来可以通过在机器人数据上微调模型或使用基于视频的模型来进一步改善新视图合成的效果。

此外,未来的相关研究可以结合RoVi-Aug与其他“增强“方法,如对象、背景和任务的增强,以获得更通用的策略,这将为机器人学习带来更多的可能性和创新。目前的研究只演示了固定机器人手臂之间的转移,未来可以考虑不同的抓手,如多指手,进一步拓展RoVi-Aug的应用范围。

4. 总结

RoVi-Aug在机器人数据学习方面具有重大意义的研究成果,它通过创新的数据增强方法,解决了机器人学习中数据不平衡和策略过拟合的问题,为机器人学习带来了新的思路和方法。尽管RoVi-Aug还存在一些局限性,但它的出现为机器人学习领域的未来发展指明了方向。相信在不久的将来,随着技术的不断进步,RoVi-Aug将会在更多的领域得到应用,为人类的生产和生活带来更多的便利和创新。

值得关注的是,RoVi-Aug的出现可能为机器人学习领域带来了广阔的应用前景。在工业生产中,不同类型的机器人可能需要执行相同的任务,而RoVi-Aug 可以让策略快速适应不同的机器人,提高生产效率和质量。在服务机器人领域,机器人需要在不同的环境中为人类提供服务,相机角度的变化和不同的机器人类型都是常见的情况。RoVi-Aug可以让服务机器人更加灵活和智能,更好地满足人类的需求。此外,在多机器人协作场景中,RoVi-Aug 可以学习多机器人多任务策略,提高机器人之间的协作效率和准确性。这对于未来的智能工厂、智能物流等领域具有重要的应用价值。让我们共同期待机器人技术在RoVi-Aug等创新研究的推动下,迈向更加智能、通用和高效的未来。
©️【深蓝AI】

Ref:
RoVi-Aug: Robot and Viewpoint Augmentation for Cross-Embodiment Robot Learning
编译|Scarlett
审核|Los

本文首发于微信公众号【深蓝AI】,移步公众号【深蓝AI】,第一时间获取自动驾驶、人工智能与机器人行业最新最前沿论文和科技动态👇
深蓝AI·赋能自动驾驶+机器人+AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1540248.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C++ | 二叉搜索树

前言 本篇博客讲解c中的继承 💓 个人主页:普通young man-CSDN博客 ⏩ 文章专栏:C_普通young man的博客-CSDN博客 ⏩ 本人giee: 普通小青年 (pu-tong-young-man) - Gitee.com 若有问题 评论区见📝 🎉欢迎大家点赞&…

超详细!百分百安装成功pytorch,建议收藏

文章目录 一、Anaconda安装1.1下载anaconda1.2配置Anaconda环境1.3验证anaconda是否安装成功 二、查看电脑显卡三、更新显卡驱动3.1下载驱动3.2、查看显卡驱动版本 四、cuda安装4.1CUDA下载4.2CUDA环境配置4.3验证CUDA是否安装成功 五、安装pytorch4.1下载pytorch5.2验证pytorc…

OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【内核通信机制】上

往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…

力扣 18.四数之和

文章目录 题目介绍解法 题目介绍 解法 思路和 15. 三数之和 一样,排序后,枚举 nums[a] 作为第一个数,枚举 nums[b] 作为第二个数,那么问题变成找到另外两个数,使得这四个数的和等于 target,这可以用双指针…

《线性代数》常用公式定理总结

文章目录 1 行列式1.1 克拉默法则1.2 基本性质1.3 余子式 M i j M_{ij} Mij​1.4 代数余子式 A i j ( − 1 ) i j ⋅ M i j A_{ij} (-1)^{ij} \cdot M_{ij} Aij​(−1)ij⋅Mij​1.5 具体型行列式计算(化为基本型)1.5.1 主对角线行列式:主…

git 本地分支误删,怎么恢复?误删本地已提交未推送的分支!

误删本地已提交未推送的分支! 前提: 已提交! 重点:未推送! 要是推送了,再拉一下代码就行了。你也不会来搜这个帖子了。 如果你删除的分支里有你未提交的代码,不用往下看了,帮不到你…

树莓派4B+UBUNTU20.04+静态ip+ssh配置

树莓派4B+UBUNTU20.04+静态ip+ssh配置 1.烧录Ubuntu镜像1.1选择pi 4b1.2选择ubuntu server (服务器版,无桌面)20.041.3选择sd卡1.4 点击右下角 NEXT ,编辑设置,输入密码,wifi选CN, 开启ssh1.5 烧录,依次点击“是”,等待完成2 烧录完成后装入树莓派,上电,等待系统完成配…

电竞显示器哪个牌子好

电竞显示器哪个好?你想成为电竞选手吗?显示器很关键,下面我就列举7款市面流行的电竞显示器给大家看看,总有一款适合你。 1.电竞显示器哪个好 - 蚂蚁电竞 ANT255VF电竞显示器 一、产品概述 蚂蚁电竞 ANT255VF电竞显示器是一款专为…

鱼哥好书分享活动第31期:如何构建出更好的大模型RAG系统?《大模型RAG实战》

鱼哥好书分享活动第31期:如何构建出更好的大模型RAG系统?《大模型RAG实战》 S1 初级RAGS2 高级RAG模型测策略测模型微调测 S3 超级RAG购买链接:内容简介:赠书抽奖规则: ChatGPT爆火之后,以ChatPDF为首的产品组合掀起了…

Node-red 某一时间范围内满足条件的数据只返回一次

厂子里有个业务需求增加一段逻辑,根据点位数值,判断是否让mes执行之后的逻辑。 网关采集周期5s/次,及数据上报周期5s/次; iot通过网关写入时间为8s左右; 同类设备共用一条规则链; 想当触发条件时修改”完成上传“不…

简单题67.二进制求和 (java)20240919

题目描述: Java: class Solution {public String addBinary(String a, String b) {StringBuilder result new StringBuilder();int i a.length()-1;int j b.length()-1;int carry 0; //记录进位信息while(i>0 || j>0 || carry!0){int sum ca…

[Linux#55][网络协议] 序列化与反序列化 | TcpCalculate为例

目录 1. 理解协议 1.1 结构化数据的传输 序列化与反序列化 代码感知: Request 类 1. 构造函数 2. 序列化函数:Serialize() 3. 反序列化函数:DeSerialize() 补充 4. 成员变量 Response 类 1. 构造函数 2. 序列化函数:…

免费下载PDF | 自然语言处理新范式:基于预训练模型的方法

前言 本次给大家推荐阅读的书籍是——《自然语言处理:基于预训练模型的方法》。近些年来,以GPT、BERT为代表的预训练模型在自然语言处理领域掀起了一股浪潮,打开了“预训练精调”的自然语言处理新范式的大门。 由电子工业出版社出版的《自然…

动手学深度学习(pytorch土堆)-06损失函数与反向传播、模型训练、GPU训练

模型保存与读取 完整模型训练套路 import torch import torchvision.datasets from torch import nn from torch.nn import Conv2d, MaxPool2d, Flatten, Linear from torch.utils.data import DataLoader from torch.utils.tensorboard import SummaryWriterfrom model impo…

AV1 Bitstream Decoding Process Specification--[7]: 语法结构语义-3

原文地址:https://aomediacodec.github.io/av1-spec/av1-spec.pdf 没有梯子的下载地址:AV1 Bitstream & Decoding Process Specification摘要:这份文档定义了开放媒体联盟(Alliance for Open Media)AV1视频编解码…

分发饼干00

题目链接 分发饼干 题目描述 注意点 1 < g[i], s[j] < 2^31 - 1目标是满足尽可能多的孩子&#xff0c;并输出这个最大数值 解答思路 可以先将饼干和孩子的胃口都按升序进行排序&#xff0c;随后根据双指针 贪心&#xff0c;将当前满足孩子胃口的最小饼干分配给该孩…

再次理解UDP协议

一、再谈端口号 在 TCP / IP 协议中&#xff0c;用 "源 IP", "源端口号", "目的 IP", "目的端口号", "协议号" 这样一个五元组来标识一个通信(可以通过 netstat -n 查看) 我们需要端口号到进程的唯一性&#xff0c;所以一个…

Obsidian如何粘贴的图片类似于Typora,图片相对当前路径

添加插件 下载插件&#xff1a; Custom Attachment Location 基础设置 同时需要在下面进行设置 示意效果

大数据多集群数据作业和集群状态监控

目前手里面有四套大数据集群的作业需要维护&#xff0c;分别属于不同的客户&#xff0c;我同岗位的兄弟离职后&#xff0c;所有的数据作业都落到我头上了&#xff0c;公司也不招人了。开发新的数据作业倒没有什么问题&#xff0c;就是客户叫我补数的时候&#xff0c;头比较大&a…

Linux基础权限

Linux基础权限 shell的概念Linux基础权限Linux的两种用户Linux的权限管理权限认知权限设置权限掩码粘滞位 shell的概念 &#xff08;shell&#xff09;命令行解释器 的存在意义&#xff1a; 将用户的命令翻译给操作系统&#xff0c;然后返回OS的结果给用户&#xff1b;保护OS…