当前位置: 首页 > news >正文

端到端自动驾驶前沿论文盘点(pdf+代码)

现在的自动驾驶,大多数还是采用的模块化架构,但这种架构的缺陷十分明显:在一个自动驾驶系统里,可能会包含很多个模型,每个模型都要专门进行训练、优化、迭代,随着模型的不断进化,参数量不断提高,所需的研发人员也跟着涨,研发成本自然居高不下。

而端到端架构的优势在于,只通过一个模型就实现了以上多种模型的功能,因此我们只需要调整训练这一个模型,就能大大提高性能,这让我们可以更好地集中资源,实现功能聚焦。

为此,端到端架构的研究一直是自动驾驶领域的热门方向,我这次也收集整理了36篇端到端自动驾驶论文来和大家分享,原文+代码已打包,文末领取

端到端(5)

Policy Pre-Training for End-to-End Autonomous Driving via Self-Supervised Geometric Modeling

标题:通过自监督几何建模进行端到端自动驾驶的策略预训练

内容:作者提出了PPGeo(基于几何建模的策略预训练),这是一个直观和直接的完全自监督框架,用于视运动驾驶中的策略预训练。作者的目标是通过对大规模无标注和无标定的YouTube驾驶视频进行3D几何场景建模,将策略表示学习为一个强大的抽象。所提议的PPGeo分两个阶段执行,以支持有效的自监督训练。在第一阶段,几何建模框架同时生成姿态和深度预测,以两个连续帧为输入。在第二阶段,视觉编码器通过仅基于当前视觉观察预测未来自身运动来学习驾驶策略表示,并通过光度误差进行优化。如此,预训练的视觉编码器配备了丰富的驾驶策略相关表示,从而能够胜任多个视运动驾驶任务。

​Trajectory-guided Control Prediction for End-to-end Autonomous Driving: A Simple yet Strong Baseline

标题:基于轨迹指导的端到端自动驾驶控制预测:一个简单但强大的基准

内容:当前的端到端自动驾驶方法要么基于规划的轨迹运行控制器,要么直接进行控制预测,这两种方法构成了两个相对独立的研究方向。考虑到两者之间的潜在互补优势,本文首次探索将这两个成熟的世界结合起来。具体而言,作者的集成方法分别有轨迹规划和直接控制两支。轨迹分支预测未来轨迹,控制分支采用新颖的多步预测方案,以推理当前行为与未来状态之间的关系。两支相连,使控制分支在每个时间步都从轨迹分支获得相应指导。然后将两支的输出融合以实现互补优势。作者在封闭环城市驾驶环境中评估结果,使用CARLA模拟器中的具有挑战性的场景。即使只使用单目摄像头输入,所提方法也位居CARLA排行榜第一,大幅领先其他使用多传感器或多融合机制的复杂方法。

​ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature Learning

标题:基于空间-时域特征学习的端到端基于视觉的自动驾驶(ST-P3)

内容:作者提出了一个空间-时域特征学习方案,以同时获得感知、预测和规划任务更具代表性的一组特征,称为ST-P3。具体而言,在进行鸟瞰图变换用于感知之前,作者提出了一种以自身为中心的累积技术来保留3D空间中的几何信息。为了进行未来预测,作者设计了一种双通道建模方法来考虑过去的运动变化,作者引入了一种基于时间的精炼单元来补偿规划中的基于视觉的元素的识别。

​Urban Driver: Learning to Drive from Real-world Demonstrations Using Policy Gradients

标题:城市司机:使用策略梯度从真实世界演示中学习驾驶

内容:本文首次提出了一个离线策略梯度方法,用于从大规模真实世界演示中学习复杂城市驾驶的模仿策略。这是通过在感知输出和该区域的高保真高清地图之上构建一个可微分的数据驱动模拟器来实现的。它允许我们使用中间表示从现有演示中合成新的驾驶体验。使用这个模拟器,在闭环中采用策略梯度训练一个策略网络。作者在城市道路上训练了提出的方法,结果表明它学习到了复杂的驾驶策略,并表现出很好的泛化能力,能够执行各种驾驶机动操作。

MP3: A Unified Model to Map, Perceive, Predict and Plan

标题:MP3:一个统一的模型进行映射、感知、预测和规划

内容:作者提出了MP3,这是一种端到端的无地图驾驶方法,其输入是原始传感器数据和高级命令(例如,在交叉路口左转)。MP3预测中间表示,包括在线地图和当前及未来的动态代理状态,并在新颖的神经运动规划器中利用它们做出可解释的决策,同时考虑不确定性。与基准和大规模真实世界数据集中的专家驾驶相比,作者的方法在复杂的长期闭环模拟中明显更安全、更舒适,并且可以更好地遵循命令。

综述(3)

Recent Advancements in End-to-End Autonomous Driving using Deep Learning: A Survey

标题:最近端到端自动驾驶技术中深度学习的进展:一项调研

内容:本文全面回顾了端到端的自动驾驶技术栈,它提供了一个自动驾驶任务的分类,其中神经网络已经以端到端的方式被使用,涵盖从感知到控制的整个驾驶过程,同时解决实际应用中遇到的关键挑战,分析了端到端自动驾驶的最新发展,并根据基本原理、方法和核心功能对研究进行分类。

​End-to-end Autonomous Driving: Challenges and Frontiers

标题:端到端自动驾驶:挑战与前沿

内容:在本论文中,作者对250多篇论文进行了全面分析,涵盖了端到端自动驾驶的动机、路线图、方法、挑战和未来趋势。作者深入探讨了几个关键挑战,包括多模态、可解释性、因果混淆、鲁棒性和世界模型等。此外,还讨论了基础模型和视觉预训练的当前进展,以及如何在端到端驾驶框架内部署这些技术。

​Delving into the Devils of Bird's-eye-view Perception: A Review, Evaluation and Recipe

标题:深入研究鸟瞰视角感知的难点:综述、评估与指南

内容:本调研回顾了BEV感知的最新工作,并对不同解决方案进行了深入分析。此外,还描述了几种系统的BEV方法设计。作者还提供了全面的实用指南,以提高BEV感知任务的性能,包括摄像头、激光雷达和融合输入。最后,作者指出了该领域的未来研究方向。

可解释性(13)

  • Planning-oriented Autonomous Driving Best Paper

  • Multi-Modal Fusion Transformer for End-to-End Autonomous Driving

  • Learning Situational Driving

  • Learning from All Vehicles

  • Policy Pre-training for Autonomous Driving via Self-supervised Geometric Modeling

  • NEAT: Neural Attention Fields for End-to-End Autonomous Driving

  • TransFuser: Imitation with Transformer-Based Sensor Fusion for Autonomous Driving

  • Safety-Enhanced Autonomous Driving Using Interpretable Sensor Fusion Transformer

  • PlanT: Explainable Planning Transformers via Object-Level Representations

  • Safety-Enhanced Autonomous Driving Using Interpretable Sensor Fusion Transformer

  • ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature Learning

  • Hidden Biases of End-to-End Driving Models

  • Scaling Self-Supervised End-to-End Driving with Multi-View Attention Learning

模仿学习(11)

  • Think Twice before Driving: Towards Scalable Decoders for End-to-End Autonomous Driving

  • Learning by Watching

  • Policy Pre-training for Autonomous Driving via Self-supervised Geometric Modeling

  • End-to-End Urban Driving by Imitating a Reinforcement Learning Coach

  • Hidden Biases of End-to-End Driving Models

  • Scaling Self-Supervised End-to-End Driving with Multi-View Attention Learning

  • Learning by Cheating

  • SAM: Squeeze-and-Mimic Networks for Conditional Visual Driving Policy Learning

  • Urban Driving with Conditional Imitation Learning

  • Learning to Drive from Simulation without Real World Labels

  • Multimodal End-to-End Autonomous Driving

行为克隆(3)

  • KING: Generating Safety-Critical Driving Scenarios for Robust Imitation via Kinematics Gradients

  • Learning to Drive by Watching YouTube Videos: Action-Conditioned Contrastive Policy Pretraining

  • Exploring the Limitations of Behavior Cloning for Autonomous Driving

关注下方【学姐带你玩AI】🚀🚀🚀

回复“端到端”免费领取全部论文+代码合集

码字不易,欢迎大家点赞评论收藏!

相关文章:

端到端自动驾驶前沿论文盘点(pdf+代码)

现在的自动驾驶,大多数还是采用的模块化架构,但这种架构的缺陷十分明显:在一个自动驾驶系统里,可能会包含很多个模型,每个模型都要专门进行训练、优化、迭代,随着模型的不断进化,参数量不断提高…...

2023年中期奶粉行业分析报告(京东数据开放平台)

根据国家统计局和民政部数据公布,2022年中国结婚登记数创造了1980年(有数据公布)以来的历史新低,共计683.3万对。相较于2013年巅峰时期的数据,2022年全国结婚登记对数已接近“腰斩”。 2023年“520”期间的结婚登记数…...

web集群学习:基于CentOS 7构建 LVS-DR 群集并配置服务启动脚本

目录 1、环境准备 2、配置lvs服务启动脚本 1、在RS上分别配置服务启动脚本 2、在lvs director上配置服务启动脚本 3、客户端测试 配置LVS-DR模式主要注意的有 1、vip绑定在RS的lo接口; 2、RS做arp抑制; 1、环境准备 VIP192.168.95.10 RS1192.168…...

Flask 高级应用:使用蓝图模块化应用和 JWT 实现安全认证

本文将探讨 Flask 的两个高级特性:蓝图(Blueprints)和 JSON Web Token(JWT)认证。蓝图让我们可以将应用模块化,以便更好地组织代码;而 JWT 认证是现代 Web 应用中常见的一种安全机制。 一、使用…...

【Grafana】中文界面配置 v10.0.3

比如通过 docker run -d -p 3000:3000 -v /e/code/monitor/grafana/grafana.ini.txt:/etc/grafana/grafana.ini grafana/grafana运行一个容器(最新是v10.0.3)。 在 /admin/settings 可以看到 users 部分有一个 default_language 配置。 所以在挂载到 …...

web前端html

文章目录 快捷方式一、html5的声明二、html5基本骨架 2.1 html标签 2.2 head标签 2.3 body和head同级 2.4 body标签 2.5 title标签 2.6 meta标签 三、标题标签介绍与应用 3.1 标题的介绍 3.2 标题标签位置摆放 3.3 标签之段落、换行、水平线 3.3 标签之图片 3.3.1 图…...

Unity 编辑器选择器工具类Selection 常用函数和用法

Unity 编辑器选择器工具类Selection 常用函数和用法 点击封面跳转下载页面 简介 在Unity中,Selection类是一个非常有用的工具类,它提供了许多函数和属性,用于操作和管理编辑器中的选择对象。本文将介绍Selection类的常用函数和用法&#xff…...

ArcGIS在洪水灾害普查、风险评估及淹没制图中应用教程

详情点击链接:ArcGIS在洪水灾害普查、风险评估及淹没制图中应用教程 一:洪水普查技术规范 1.1 全国水旱灾害风险普查实施方案 1.2 洪水风险区划及防治区划编制技术要求 1.3 山丘区中小河流洪水淹没图编制技术要求 二:ArcGIS及数据管理 …...

Oracle日志相关操作

1.归档日志设置 # 切换账号 $ su - oracle# 登录oracle的sys账户 $ sqlplus / as sysdbasql> archive log list; #查看是不是归档方式 SQL> archive log list; Database log mode Archive Mode Automatic archival Enabled Archive destin…...

IMV8.0

一、背景内容 经历了多个版本,基础内容在前面,可以使用之前的基础环境: v1: https://blog.csdn.net/wtt234/article/details/132139454 v2: https://blog.csdn.net/wtt234/article/details/132144907 v3: h…...

【Linux 网络】 数据链路层协议

数据链路层协议 数据链路层解决的问题以太网协议认识以太网以太网帧格式 认识MAC地址对比理解MAC地址和IP地址认识MTUMTU对IP协议的影响MTU对UDP协议的影响MTU对于TCP协议的影响ARP协议ARP协议的作用ARP协议的工作流程ARP数据报的格式 总结 数据链路层解决的问题 IP拥有将数据跨…...

GWJDN-400型2MHZ自动平衡高温介电温谱仪

GWJDN-400型2MHZ自动平衡高温介电温谱仪 GWJDN-400型2MHZ自动平衡高温介电温谱仪 关键词:介电常数,高温介电,自动平衡 主要功能: 材料介电常数测试仪 半导体材料的介电常数、导电率和C-V特性液晶材料:液晶单元的介电常数、弹性…...

第十五次CCF计算机软件能力认证

第一题:小明上学 小明是汉东省政法大学附属中学的一名学生,他每天都要骑自行车往返于家和学校。 为了能尽可能充足地睡眠,他希望能够预计自己上学所需要的时间。 他上学需要经过数段道路,相邻两段道路之间设有至多一盏红绿灯。 京…...

ThreadPoolExecutor线程池详解

ThreadPoolExecutor线程池详解 1. 背景 项目最近的迭代中使用到了ThreadPoolExecutor线程池,之前都只是知道怎么用,没有了解过线程池的底层原理,项目刚上线,有时间整理一下线程池的用法,学习一下线程池的底层实现与工…...

【VB6|第22期】用SQL的方式读取Excel数据

日期:2023年8月7日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不对的地方&#xff…...

融云:从「对话框」跳进魔法世界,AIGC 带给社交的新范式

8 月 17 日(周四),融云将带来直播课-《北极星如何协助开发者排查问题与预警风险?》欢迎点击上方报名~ AIGC 与社交结合的应用主要分两种,一是发乎于 AIGC,以大模型为基础提供虚拟伴侣等服务的 App&#xff…...

UWB伪应用场景 - 别再被商家忽悠

近几年UWB技术在网上宣传得如火如荼,与高精度定位几乎或等号,笔者认为这是营销界上的一大成功案例。 UWB超宽带技术凭借着低功耗、高精度,确实在物联网行业混得风生水起,但在无数实际应用案例中,根据客户的反馈情况&a…...

【快应用】list组件属性的运用指导

【关键词】 list、瀑布流、刷新、页面布局 【问题背景】 1、 页面部分内容需要瀑布流格式展示,在使用lsit列表组件设置columns进行多列渲染时,此时在里面加入刷新动画时,动画只占了list组件的一列,并没有完全占据一行宽度&…...

js 面试题总结

js 面试题总结 文章目录 js 面试题总结近百道面试题1、实现 子元素 在父元素中垂直居中的方式2、实现 子元素 在父元素中水平 垂直居中的方式3、描述 Keepealive 的作用,有哪些钩子函数,如何控制组件级存列表?4、请写出判断对象是数组的三个方法5、请说…...

HTML之表单标签

目录 表单标签 Form表单 定义: 基本语法结构: form属性: enctyoe属性 fieldeset标签 fieldeset属性 legend标签 label标签 优势 label属性 input标签 input属性 input标签中的type属性 text text输入框有以下配套属性 searc bu…...

Java经典面试题总结(一)

Java经典面试题总结(一) 题一:Java编译运行原理题二:JDK,JVM,JRE三者之间的关系题三:谈一下对冯诺依曼体系的了解题四:重载与重写的区别题五:拆箱装箱是指什么&#xff1…...

Android监听设备亮灭屏广播(动态广播代码)

MainActivity中 public class MainActivity extends Activity {private WakeAndLockReceiver wakeAndLockReceiver;Overrideprotected void onCreate(Bundle savedInstanceState) {super.onCreate(savedInstanceState);setContentView(R.layout.activity_main);//注册亮屏和息…...

【前端面试手撕题】简易深拷贝、深拷贝、寄生组合式继承、发布订阅模式、观察者模式

FED16 简易深拷贝 描述 请补全JavaScript代码&#xff0c;要求实现对象参数的深拷贝并返回拷贝之后的新对象。 注意&#xff1a; 参数对象和参数对象的每个数据项的数据类型范围仅在数组、普通对象&#xff08;{}&#xff09;、基本数据类型中]无需考虑循环引用问题 <!DO…...

【生物医学】应激(应激反应)全身适应综合征

最近在探索疲劳、负荷、应激方面的底层发生机制&#xff0c;遂整理了一些相关内容&#xff0c;以脑图方式呈现。本文以生物医学向为主。 OK&#xff0c;开始基础介绍&#xff1a;应激 (stress)是指在收到外部或内部、心理社会刺激下的非特异性适应反应。 本文主要收集整理了相…...

浅析基于安防监控EasyCVR视频汇聚融合技术的运输管理系统

一、项目背景 近年来&#xff0c;随着物流行业迅速发展&#xff0c;物流运输费用高、运输过程不透明、货损货差率高、供应链协同能力差等问题不断涌现&#xff0c;严重影响了物流作业效率&#xff0c;市场对于运输管理数字化需求愈发迫切。当前运输行业存在的难题如下&#xf…...

VBA技术资料MF41:VBA_将常规数字转换为文本数字

【分享成果&#xff0c;随喜正能量】时有落花至&#xff0c;远随流水香。人生漫长&#xff0c;不攀缘&#xff0c;不强求&#xff0c;按照自己喜欢的方式生活&#xff0c;不必太过在意&#xff0c;顺其自然就好。路再长也有终点&#xff0c;夜再黑也有尽头。 我给VBA的定义&am…...

Wavefront .OBJ文件格式解读【3D】

OBJ&#xff08;或 .OBJ&#xff09;是一种几何定义文件格式&#xff0c;最初由 Wavefront Technologies 为其高级可视化器动画包开发。 该文件格式是开放的&#xff0c;已被其他 3D 图形应用程序供应商采用。 OBJ 文件格式是一种简单的数据格式&#xff0c;仅表示 3D 几何体&…...

JavaScript:ES6中类与继承

在JavaScript编程中&#xff0c;ES6引入了一种更现代、更清晰的方式来定义对象和实现继承&#xff0c;那就是通过类和继承机制。本文将以通俗易懂的方式解释ES6中类与继承的概念&#xff0c;帮助你更好地理解和应用这些特性。 1. 类的创建与使用 类是一种模板&#xff0c;用于…...

通用指令(汇编)

一、数据处理指令1&#xff09;数学运算数据运算指令的格式数据搬移指令立即数伪指令加法指令带进位的加法指令减法指令带借位的减法指令逆向减法指令乘法指令数据运算指令的扩展 2&#xff09;逻辑运算按位与指令按位或指令按位异或指令左移指令右移指令位清零指令 3&#xff…...

苏宁数据治理实战方法论和三字经

随着移动互联网和大数据的蓬勃发展&#xff0c;“数据即资产”的理念深入人心。大数据已发展成为具有战略意义的生产资料&#xff0c;在各行各业发挥着极其重要的作用&#xff0c;而大数据也给很多企业带来了前所未有的自豪感和自信感。 但是&#xff0c;大数据真的是越“大”越…...