NVIDIA发布端到端自动驾驶框架Hydra-MDP

动图封面

自动驾驶是目前人工智能领域的一个主要分支,目前特斯拉的FSD确实是为数不多的大模型框架。与其说特斯拉是一个造车公司,不如说是一个人工智能大数据公司。特斯拉每天靠行驶在道路上的汽车搜集的道路数据不胜其数,而拥有海量的数据是人工智能领域成功的关键。

端到端自动驾驶的工作原理

自动驾驶汽车的开发竞赛不是短跑,而是一场永无止境的铁人三项赛,其中有三个不同但至关重要的部分组成:AI 训练、AI自动模拟和自动驾驶。每个部分都需要自己的加速计算平台,而专为这些步骤构建的全栈系统共同构成了一个强大的人工智能系统。

Hydra-MDP 提供了一个通用框架,展示了如何通过基于规则的规划器增强基于机器学习的规划。这种集成系统确保模型不仅模仿人类的驾驶行为,还遵守交通规则和安全标准,解决了传统模仿学习的局限性。Hydra-MDP 的数据驱动缩放定律证明了其稳健性和适应性。通过使用具有大量数据和 GPU 预训练基础模型,Hydra-MDP 展示了其可扩展性和持续改进的潜力。

为了实现这一点,首先在NVIDIA DGX等 AI 超级计算机上训练模型。然后使用NVIDIA Omniverse平台在NVIDIA OVX系统上运行,在模拟中对其进行测试和验证,最后进入正式的车辆系统中,NVIDIA DRIVE AGX平台通过模型实时处理传感器数据。

构建一个能够在复杂的物理世界中安全导航的自主系统极具挑战性。该系统需要全面感知和理解其周围环境,然后在几分之一秒内做出正确、安全的决策。这需要像人类一样的态势感知能力来处理潜在的危险或罕见情况。

AV 软件开发传统上基于模块化方法,具有用于对象检测和跟踪、轨迹预测以及路径规划和控制的独立组件。端到端自动驾驶系统使用统一模型接收传感器输入并生成车辆轨迹,从而简化这一过程,有助于避免过于复杂的系统,并提供更全面、数据驱动的方法来处理现实场景。

拥抱多模式和多目标规划的复杂性

一个基础教训是必须采用多模式和多目标规划。传统的端到端自动驾驶系统通常专注于单模态和单目标,限制了其在现实世界中的有效性。Hydra-MDP 集成了针对安全性、效率和舒适度等多项指标量身定制的多种轨迹。这确保了模型能够适应复杂的驾驶环境,而不仅仅是模仿人类驾驶员。

Hydra-MDP 架构

Hydra-MDP 的开发教会了NVIDIA几个重要的经验教训,这些经验教训塑造了Hydra-MDP 架构。Hydra-MDP 结合了人类和基于规则的知识提炼,创建了一个强大而多功能的自动驾驶模型。拥抱多模式和多目标规划的复杂性是自动驾驶的主要任务,不能仅仅局限于单目标,单模式的方式,而是学习人类的驾驶方式,处理多维度的数据,接受多目标规划的复杂性。

动图封面

多目标 Hydra-distillation 是一个师生多模式框架,是Hydra-MDP方法中的关键策略。通过聘用多位专业教师(包括人类和基于规则的教师),该模型学会预测符合各种基于模拟的自动驾驶轨迹。这种技术增强了模型在不同驾驶条件下的泛化能力。结合基于规则的规划器提供了一个结构化的框架,而人类教师则引入了适应性和细致的决策能力,这对于应对不可预测的情况至关重要。

传统方法通常会将感知和规划拆分为不同的、不可微分的步骤,从而丢失宝贵的信息。Hydra-MDP 的端到端架构将感知和规划无缝集成,并在整个决策过程中保持环境数据的丰富性。这种集成可实现更明智、更准确的预测。

Hydra-MDP 的感知网络以 Transfuser 基线为基础,结合了 LiDAR 和摄像头输入的功能。这种多模态融合有助于模型更好地理解和应对复杂的驾驶环境。

对整个训练数据集进行模拟可生成各种指标的真实模拟分数。然后,这些数据用于监督训练过程,使模型能够从各种模拟驾驶场景中学习。这一步强调了广泛的模拟对于弥合理论性能和实际适用性之间的差距的重要性。

Hydra-MDP采用了混合编码器和子分数集成等技术来整合模型优势。这提高了 Hydra-MDP 的稳健性,并确保最终模型能够高精度地处理各种驾驶场景。集成技术平衡了计算效率和性能,这对于实时应用至关重要。

Hydra-MDP 的开发是一个创新、实验和持续学习的过程。通过采用多模式和多目标规划、利用多目标蒸馏以及通过大量模拟数据进行改进,Hydra-MDP创建了一个性能远超现有最先进方法的模型。这些经验为 Hydra-MDP 的成功做出了贡献,并为未来自动驾驶的发展提供了宝贵的意见。

https://arxiv.org/html/2406.06978v1
https://developer.nvidia.com/
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技

 动画详解transformer  在线教程

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149217.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构——顺序表、链表

目录 前言 一,数据结构 1,什么是数据结构? 2,有什么类型? 二,顺序表 1,线性表 2,顺序表基本结构 3,动态顺序表的功能实现 三,链表 1,链…

乌克兰因安全风险首次禁用Telegram

据BleepingComputer消息,乌克兰国家网络安全协调中心 (NCCC) 以国家安全为由,已下令限制在政府机构、军事单位和关键基础设施内使用 Telegram 消息应用程序。 这一消息通过NCCC的官方 Facebook 账号对外发布,在公告中乌…

2024icpc(Ⅱ)网络赛补题 L

L、502 Bad Gateway 题意: 给定一个 T T T,每一步可以做以下两个操作: 1、减1 2、随机重置为 [ 1 , T ] [1,T] [1,T]中的某个整数 求在最优策略下,得到 0 0 0的期望步数 思路: 最优策略为选择一个阈值 S S S&…

01.系统IO

文章的函数说明只是简单的说明,具体还得查看man手册 Linux文件说明 linux下一切皆是文件。 Linux 下的文件类型: 1,普通文件(regular):存在于外部存储器中,用于存储普通数据。 2&#xff0…

深入理解音视频pts,dts,time_base以及时间数学公式

引入 首先介绍一下基础名词 DTS(Decoding Time Stamp):即解码时间戳,这个时间戳的意义在于告诉播放器该在什么时候解码这一帧的数据。当数据没b帧时,dts pts,有兴趣可参阅我前面视频知识类文章。 PTS&a…

统信服务器操作系统【开机自启动】配置方法

开机自启动的四种配置方法,包括systemctl命令、rc.local文件、crontab任务,通过desktop配置开机自动,前三种方法适合后台程序或者脚本启动,最后一种方法适合图形化程序启动。 文章目录 准备环境配置方法一、通过编写service的方法,使用systemctl配置开机自启二、通过rc.lo…

展锐平台的手机camera 系统isptool 架构

展锐平台的isptool 主要用于支持展锐各代芯片isp的各效果模块快速tuning和参数生成打包。 具体需要: 一、工具段能在线实时预览到调试sensor经过isp 处理后的图像,也就是各模块的参数在当下实时生效,通过工具能在PC 上在线观看到修改的效果。…

【企业微信】群机器人自动消息配置

0、群聊机器人 内部企微群聊可以添加一个机器人,这个机器人其实是个消息接口,可以外部脚本来自动定时发送消息到群里,打工人最有用的提醒就是每周提醒发周报了。 1、创建机器人 一般公司都没有人使用,我们可以手动创建一个。 …

小程序开发设计-小程序的宿主环境:宿主环境简介⑥

上一篇文章导航: 小程序开发设计-小程序代码的构成:小程序页面的组成部分详解⑤-CSDN博客https://blog.csdn.net/qq_60872637/article/details/142306902?spm1001.2014.3001.5501 注:不同版本选项有所不同,并无大碍。 目录 上…

OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【用户态内存调测】

往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 持续更新中…… 基本概念 Debug版本的musl-libc库为用户提供内存泄漏检测、堆内存…

2024在线翻译工具横评:准确率、速度与易用性大比拼

在日常的学习与生活中,翻译工具无疑成为了我们迅速获取国际新闻与知识的得力助手。起初,我倾向于依赖有道在线翻译这一平台来解决我的语言障碍问题。然而,随着对翻译质量要求的提升和多元化比较的需求增加,我进一步探索并发现了数…

从入门到精通:计算机视觉学习路线与实战项目推荐

全面解析计算机视觉的学习路径,深入探讨关键技术与实战项目,助您快速掌握核心技能 引言 随着人工智能的飞速发展,计算机视觉已成为AI领域中最具潜力和应用价值的分支之一。从自动驾驶到医疗影像分析,计算机视觉技术正在改变我们的…

vue/配置axios(前后端数据连通/api接口的调用)

1.创建apis文件 2.写入调用的api地址且暴露出去。 import httpInstance from /utils/http;export function getHomeNav() {return httpInstance({url: http://10.0.11.91:91/dailyreport/getdailyreportall,}) }3.创建文件编写拦截器 代码部分 //axios基础封装 import axio…

OpenCV 3

模板匹配方法 尽量采用归一化的方法,因为它更加精细。 匹配效果展示 匹配单一图像 这是一段Python代码,主要使用了OpenCV库进行图像处理。这段代码的主要功能是通过模板匹配方法在一张大图中找到一个小图的位置。 具体来说: - 第一行的for…

Docker:解决开发运维问题的开源容器化平台

云计算de小白 Docker是一个开源的容器化平台,可以将应用程序及其依赖的环境打包成轻量级、可移植的容器。 Docker为什么这么受欢迎呢?原因很简单:Docker可以解决不同环境一致运行的问题,而且占用资源少,速度快。 所以好的东西…

Leetcode—329. 矩阵中的最长递增路径【困难】

2024每日刷题&#xff08;165&#xff09; Leetcode—329. 矩阵中的最长递增路径 dfs dp实现代码 class Solution { public:int longestIncreasingPath(vector<vector<int>>& matrix) {// 9 9 4// 6 6 8// 2 1 1// 1 1 2// 2 2 1// 3 4 2int m …

Three.js 3D人物漫游项目(下)

本文目录 前言最终效果1、效果回顾2、编写人物模型动画执行类并调用2.1 代码2.2 代码解读2.3 实例化动画类并调用2.4 效果2.4.1 休息动画2.4.2 跑步动画2.4.3 走路动画2.4.4 舞蹈1动画2.4.5 舞蹈2动画3、键盘控制动画3.1 站立休息、走、跑、舞蹈1、舞蹈2代码3.1.1 效果3.2 跳跃…

Matlab|基于遗传模拟退火算法的风电功率聚类分析

目录 主要内容 部分代码 结果一览 下载链接 主要内容 模糊C-均值聚类&#xff0c;也称FCM&#xff0c;是比较常用的一种聚类算法&#xff0c;该算法利用几何贴进度的概念将不同数据分配到不同聚类群中&#xff0c;但是作为局部搜索优化算法&#xff0c;初值选择不…

趣味运动会随机分组指南

如何实现男女比例平均分组&#xff1f; 组织趣味运动会时&#xff0c;如何确保男女比例平均且分组公平是一个关键问题。利用云分组小程序&#xff0c;我们可以轻松实现这一目标&#xff0c;让活动更加有趣和公平。 以下是详细的操作步骤&#xff1a;步骤一&#xff1a;创建分组…

生信技能59 - 基于GATK CallingSNP变异检测及注释流程

1. 流程说明 使用BWA MEM比对,如果文件较大,可使用bwa-mem2进行比对,速度会有很大提升;使用GATK对BAM进行排序和标记重复,再使用GATK HaplotypeCaller + GATK GenotypeGVCFs进行变异检测,生产.g.vcf文件,提取SNP并使用annovar进行位点注释。 使用bwa-mem2进行比对,获…