Khronos:动态环境下时空度量语义SLAM的统一方法

Khronos: A Unified Approach for Spatio-Temporal Metric-Semantic SLAM in Dynamic Environments

原文
项目

引言:
人类居住环境通常是高度动态的,人、机器人和其他实体不断移动、互动和改变场景。对于机器人在这种情况下的操作,仅仅建立一个单一时间点的世界模型是不够的。相反,机器人还应该能够推理过去时间段场景的状态,推断出在多次观察中场景可能如何改变。这种能力对于需要对较长时间跨度进行推理的各种应用至关重要,包括家庭和服务机器人、工业建筑或工地监测,其中机器人不仅需要在高度动态的环境中操作,而且需要跟踪或推理过去环境的演变,以更智能地高效执行任务。度量语义SLAM允许机器人实时构建场景的语义注释的几何表示。几何信息对于机器人安全导航和物体操作至关重要,而语义信息为机器人执行人类指令和向人类提供易于理解的环境模型提供了理解。为了实时构建这些密集的度量语义表示,通常假设世界是静态的,并专注于将嘈杂的几何和语义测量稳健地融合成度量语义模型。尽管这对于某些机器人应用是一个有效的假设,但它限制了机器人可以操作的环境类型的普遍性,以及可以分配给它的任务。另一方面,已经有大量的工作在动态环境中处理SLAM,但这些工作主要集中在短期动态,如当前在摄像机前移动的人或物体,很难处理长期变化。可能场景发生了实质性的变化(例如,家具被重新摆放),而机器人并没有直接观察到。真实环境同时经历短期和长期的变化,现有方法很难对两者同时进行推理。此外,为了使机器人能够有效地与其他人类和机器人一起工作,这样一个框架需要在机器人操作期间利用有限的信息和计算资源构建对世界的理解。

为此,这篇文章引入了时空度量语义SLAM(SMS)问题,旨在随着机器人导航场景,逐步构建世界的密集度量语义模型。作者提出了一个统一的框架来解决SMS问题,其核心思想是基于时空局部一致性开发SMS问题的新因子分解,这允许解开由感知噪声、状态估计误差、动态对象和场景中的长期变化引起的错误。作者将这一见解集成到一个名为Khronos的时空感知系统中,它是第一个能够实时构建场景时空地图的度量语义系统。在几个模拟场景中对我们的方法进行了彻底评估,并在多个机器人平台上导航高度动态的现实环境中进行了背景重建、物体检测、运动跟踪和变化检测的详细注释。

贡献:

  1. 形式化了时空度量语义SLAM(SMS)问题,允许机器人对周围环境及其随时间演变的密集度量语义有深入理解。
  2. 提出了SMS问题的新型因子分解,为现有的专注于短期和长期动态的解释提供了统一的视角。
  3. 提出了Khronos,第一个时空度量语义感知系统,由用于异步局部地图和可变全局变化检测的新算法组成。

方法原理:
在这里插入图片描述
Khronos输入机器人里程计Φ,语义分割和RGBD输入Z。活动窗口使用这些来估计局部表示和物体碎片Y。然后执行全局优化来估计机器人位姿X和碎片关联A。最后,将优化后的碎片状态调和来估计场景的时空地图。

  • 通过活动窗口进行局部估计
    将局部估计组件称为活动窗口。它的目标是通过增量估计一组来自观测 Z,Φ 的片段 Yk,以满足局部一致性。
    重建。 首先重建静态背景。使用网格来实现 Khronos 来建模表面 Ω。为此,在机器人周围逐步分配体积图,并执行投影 TSDF 融合以估计 OBG。然后,从原始 RGBD 数据中的每个帧中获取候选观测 Z。可以使用不同的线索从传感器数据中提取 Z。首先,利用输入帧中提供的语义掩码作为 Z。其次,利用几何运动检测将物体与背景分离。
    跟踪。 为了估计最好解释观测 Z 的片段 Y,生成一组对象假设的池。由于活动窗口内的变化很小,可以贪婪地将新的观测 Ztk 关联到最合适的假设上,通过计算每个 Ztk与假设之间的体积 IoU 来实现。在这种方法中,选择使用 TSDF 融合来重建静态物体的表面,并使用点云来表示可变形的动态物体。同样,跟踪背景的局部一致性并提取退出活动窗口的顶点。这种对活动窗口中每个实体的异步跟踪确保了局部一致性,并自然地处理了部分或错误的观测。同时,它具有一个重要优势,即当所有数据都可用时,可以估计对象属性。

  • 全局优化
    全局优化模块从活动窗口获得的局部估计进行优化和更新以进行调和。在全局范围内,联合估计机器人姿势 X、片段位置 Y 和背景密集网格。变形图的节点对应于机器人姿势 X 和从 OBG 中选择的网格控制点 PM,以及一个新的碎片姿态,其位置和标识旋转进行初始化。使用边缘 EYX 将位姿连接到机器人姿势图。每个位姿始终与首次观察碎片时对应的机器人姿势 Xf 连接,并根据一致性检查选择性地与最后观察到碎片时对应的机器人姿势连接。

  • 调和
    最后,调和的目标是估计在所有时间 t < T 时刻的场景状态。值得注意的是,碎片只包含积极的观察结果,即有关检测到的对象存在的信息,但不包括它们的缺失信息。为了解决这一缺失证据与证据缺失问题,执行额外的几何验证步骤。
    可变形变化检测。 虽然在表面表示中没有存储体积信息,但这些信息部分地隐含在背景和机器人姿态中。核心思想是,当连接背景顶点和机器人姿态时,它们不会在那个时候被遮挡。然而,由于全局优化过程中机器人和背景姿态可以不断改变,因此在在线操作过程中将这些信息集成到自由空间地图中是不可行的。相反,通过光线库来近似这些全局自由空间信息。每当从活动窗口提取背景顶点时,创建该顶点到其观察窗口中间的机器人位置的代表光线。为了进行高效的查找,这是通过在粗略的全局哈希映射中存储顶点和视点的索引来实现的。这些可以高效地逐步添加,并允许机器人和背景点在它们的网格单元内自由移动。当检测到较大的位置变化时,例如在闭环的情况下,哈希映射将从头开始重新计算。为了检测缺失或存在的证据,在光线库中查询碎片表面上的点。
    调和。 最后,可以估计在碎片 Y 之间每个对象存在的时间。为此,计算了在首次观察到碎片 Y 之前的最新缺失证据,以及在其退出活动窗口之后的最早缺失证据。类似地,计算了该窗口内存在的最早和最晚的存在证据。直观地说,这反映了一个对象必须在其位置最后被观察为空时和该位置首次被观察到对象存在之间的某个时间点新出现,并反之亦然。假设对象以均匀的概率出现或消失,最小的期望误差估计可以很容易地显示为该窗口的中间部分。

实验效果:
在这里插入图片描述
图 1:我们提出了 Khronos,这是一种在动态环境中执行度量语义同步映射和定位 (SLAM) 时推理短期动态和长期变化的统一方法。上面显示了 Khronos 时空地图中的一些实例,代表了所有时间的场景状态。短期动态(左)以洋红色显示,并与相应时间间隔内观察到的人类行为进行比较。我们显示检测到的移动点周围的当前和初始边界框以及质心轨迹。人类和无生命物体(例如手推车(左下))都会被检测到。显示同一场景的三个时间实例的长期变化(右)。最早的实例出现在时间 0:20(右上角)。当机器人穿过走廊时,一把椅子被移走,一个红色的冷却器被放置在桌子上;当机器人重新访问并在时间 1:52(右下)关闭循环时,会检测到这些变化。最后,冷却器再次被移除,机器人在 3:35 检测到这一情况。

4D背景重建, 包括静态对象,动态对象和变化检测。对所有指标来说,越高越好。
在这里插入图片描述

真值分割和开放集分割对Apartment序列的变化检测性能。
在这里插入图片描述

Khronos目标检测性能和对人工标注的真值的长期变化。
在这里插入图片描述第一次变化发生在90 s左右,但机器人自然还没有再观察到该物体。然后,机器人开始观察变化并增加其回忆性,而新物体出现并消失,降低了回忆性。最终,机器人闭合回路,在起始位置检测到若干变化。
在这里插入图片描述

在这里插入图片描述
图 8:使用 Boston Dynamics Spot 四足动物构建的时空地图,涵盖大学建筑的整个楼层。我们在地图中展示了一些长期变化的实例:将一把椅子移到不同的位置(左上),移除两个回收箱(右上),以及改变两把椅子的排列(右下)。显示的 Khronos 重建对应于较晚的时间戳,检测到的对象在图像中突出显示。例如,请注意,窗户附近的椅子(右下,3:09)如何在 6:30(右上)出现在地图中,但在机器人于 7:30 重新访问后被标记为不存在并以新姿势重新出现:19(右下)。我们还展示了人类行为的短期动态(左下);然而,由于摄像头朝下的角度,Khronos 只能看到行走的人的腿,而该腿已被成功检测到。

全局优化组件( top )和协调组件( bottom )的运行时间。
在这里插入图片描述

限制:
(1)由于Khronos将边界框质心估计为物体位置,因此对部分观测和遮挡敏感。此外,缺乏对物体旋转的估计会降低全局估计和协调的有效性。采用现代物体姿态和形状估计以及注册技术将提高物体关联的鲁棒性和准确性。(2)使用光线追踪方法进行变化检测意味着存在一个参考表面。尽管在实验中发现其效果良好,但在具有稀疏表面的大型开放空间中进行变化检测将表现不佳。(3)随着对物体的重新观察,物体分割的数量增加,这限制了Khronos的可扩展性。在理想情况下,过时或已经自信地协调的物体分割被边缘化,使得存储的物体分割数量与支持长时间任务的物体数量成比例。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1557518.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

想要加密电脑?盘点2024年企业常用的10款电脑文件加密软件

在企业数据安全的时代背景下&#xff0c;文件加密已经成为保护企业核心信息、应对网络安全威胁的关键举措。无论是保护机密的商业数据&#xff0c;还是遵守数据隐私合规性要求&#xff0c;企业对文件加密软件的需求日益增长。本文将盘点2024年企业常用的10款电脑文件加密软件&a…

安卓如何实现双击触摸唤醒点亮屏幕功能-源码分析linage os高通平台

背景&#xff1a; 前面文章已经有讲解过双击亮屏在一些方案调研情况&#xff0c;刚好linage os手机本身也有这个功能&#xff0c;刚好也有整体开源源码&#xff0c;所以今天带大家来对双击亮屏的源码部分进行剖析&#xff0c;本篇文章会一直分析到hal操作驱动节点。 设置作为…

重学SpringBoot3-集成Redis(二)之注解驱动

更多SpringBoot3内容请关注我的专栏&#xff1a;《SpringBoot3》 期待您的点赞&#x1f44d;收藏⭐评论✍ 重学SpringBoot3-集成Redis&#xff08;二&#xff09;之注解驱动 1. 为什么选择 Redis 作为缓存&#xff1f;2. 如何在 Spring Boot 中启用 Redis 缓存&#xff1f;2.1 …

华为OD七日集训第1期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)

目录 一、适合人群二、本期训练时间三、如何参加四、7日集训五、精心挑选21道高频100分经典题目&#xff0c;作为入门。第1天、逻辑分析第2天、数组第3天、双指针第4天、滑动窗口第5天、贪心算法第6天、二分查找第7天、分治递归 六、集训总结 大家好&#xff0c;我是哪吒。 最…

Qt程序打包(解决找到dll问题)

1、运行Qt程序找不到dll 在Qt Creator外&#xff0c;运行Qt编译的exe程序&#xff0c;常常出现找不到xxx.dll而无法运行的问题。 解决的办法之一是找到Qt安装目录下bin文件夹中的dll文件&#xff0c;将该路径添加到系统环境变量path中去。 第二种办法就是对Qt程序进行打包&…

来了,使用YOLOv11目标检测教程

来了&#xff0c;使用YOLOv11目标检测教程 概述 YOLO11 在 2024 年 9 月 27 日的 YOLO Vision 2024 活动中宣布&#xff1a;https://www.youtube.com/watch?vrfI5vOo3-_A。 YOLO11 是 Ultralytics YOLO 系列的最新版本&#xff0c;结合了尖端的准确性、速度和效率&#xff…

【LeetCode】动态规划—72. 编辑距离(附完整Python/C++代码)

动态规划—72. 编辑距离 前言题目描述基本思路1. 问题定义2. 理解问题和递推关系3. 解决方法3.1 动态规划方法3.2 空间优化的动态规划 4. 进一步优化5. 小总结 代码实现PythonPython3代码实现Python 代码解释 CC代码实现C 代码解释 总结: 前言 编辑距离问题是字符串处理中的经…

threejs-模型贴图颜色与图片存在色差 问题解决方案

我使用的是obj模型&#xff0c;然后加载的话使用的是texturelLoader加载器&#xff0c;效果是这样的 使用的场景是&#xff1a;能够将图片贴到衣服上&#xff0c;并且能够移动旋转等操作贴图&#xff0c;但是这存在很明显的色差问题&#xff0c;具体的解决方案是&#xff1a; 我…

.Net Core 接口或网站发布到IIS

将.Net Core 接口或网站发布到IIS上&#xff0c;需要遵循一系列步骤来确保正确配置和部署。下面将以.NET Core 3.1的api接口发布示范&#xff1a; 一、环境准备 安装.NET Core 3.1 SDK和运行时&#xff1a; 在服务器上安装.NET Core 3.1 SDK&#xff08;如果需要在服务器上编译…

LeetCode 48 Rotate Image 解题思路和python代码

题目&#xff1a; You are given an n x n 2D matrix representing an image, rotate the image by 90 degrees (clockwise). You have to rotate the image in-place, which means you have to modify the input 2D matrix directly. DO NOT allocate another 2D matrix and …

桥水基金、贝莱德、摩根士丹利选择极狐GitLab 的五大理由!

疯狂上涨的 A股、港股 节前一周&#xff0c;上证指数累计上涨超 12%&#xff0c;创下2008年11月以来最大单周涨幅&#xff1b;深证成指累计上涨超17%&#xff0c;创下1996年4月最大单周涨幅&#xff1b;创业板指上涨超22%&#xff0c;创下史上最大单周涨幅。 过去两周&#x…

1688代采系统-反向海淘系统详细介绍

Onebound凡邦1688代采系统-反向海淘系统是一种专为海外买家及跨境电商提供一站式采购解决方案的平台。其核心功能和服务旨在解决跨境采购中的语言、货币等常见问题&#xff0c;并优化采购流程&#xff0c;提高采购效率。以下是对该系统的详细介绍。 一、核心功能 商品采集与展…

基于Java(Jsp+Sevlet)+MySql 实现的(Web)成绩管理系统

1 概述 1.1 开发背景 随着学生数量的日渐增多&#xff0c;学生教务系统的数据量也不断增加&#xff0c;这无疑大大增加了教务系统的负担。如果能把负责学生成绩管理的模块独立出来形成一个独立的系统&#xff0c;便可以有效降低教务系统的数据量&#xff0c;不仅可以方便管理…

2003-2023年上市公司政府补助明细数据

2003-2023年上市公司政府补助明细数据 1、时间&#xff1a;2003-2023年 2、来源&#xff1a;通过整理和筛选于企业财务报表附注“营业外收入”下的“政府补助明细”得到 3、指标&#xff1a;年份、股票代码、股票简称、行业名称、省份、城市、区县、上市状态、政府补助金额、…

企业架构系列(16)ArchiMate第14节:实施和迁移视角

在企业架构中&#xff0c;为了有效地规划和管理架构的变更与实施&#xff0c;通常会使用不同的视角来描述架构的不同方面。本篇涉及到三个主要视角&#xff1a;项目视角、迁移视角以及实施与迁移视角。 一、实施和迁移视角概览 1.项目视角 元素与关系&#xff1a;关注项目本身…

基于ResNet50模型的船型识别与分类系统研究

关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有&#xff1a;中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等&#xff0c;曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万粉丝&#xff0c;拥有2篇国家级人工智能发明专利。 社区特色…

获取时隔半个钟的三天

摘要&#xff1a; 今天遇到需求是配送时间&#xff0c;时隔半个钟的排线&#xff01;所以需要拼接时间&#xff01;例如2024-10-08 14&#xff1a;30&#xff0c;2024-10-08 15&#xff1a;00&#xff0c;2024-10-08 15&#xff1a;30 <el-form-item label"配送时间&a…

AP8505固定5V输出5V0.2A,SOP7/DIP7非隔离开关电源IC

AP8505基于高压同步整流架构&#xff0c;集成PFM控制器以及500V高可靠性MOSFET&#xff0c;用于外部元器件极精简的小功率非隔离开关电源。AP8505无线门铃芯片内置500V高压启动&#xff0c;实现系统快速启动、超低待机功能。5V非隔离无线门铃芯片AP8505提供了完整的智能化保护功…

海报制作用什么软件?快速搞定年末各种节日借势海报设计

厌倦了自己动手从零开始做宣传海报&#xff1f; 想要找AI智能工具&#xff0c;却又觉得生成的图片太假&#xff0c;不够的宣传格调&#xff1f; 想要找海报制作模板免费下载的平台&#xff0c;还总找不到自己想要的那一个风格的模板&#xff1f; 有没有想过&#xff0c;是你…

fastdfs下的doc文件可以访问,但是图片无法访问报错404,解决记录

fastdfs下的doc文件可以访问,但是图片无法访问报错404 以下内容主要讲linux的问题 以下内容主要讲linux的问题 以下内容主要讲linux的问题 以下内容主要讲linux的问题 以下内容主要讲linux的问题 第1项:查看Nginx的日志 可以先去查看Nginx的日志,在你Nginx的安装目录下的lo…