当前位置: 首页 > news >正文

CV——day80 读论文:DLT-Net:可行驶区域、车道线和交通对象的联合检测

DLT-Net:可行驶区域、车道线和交通对象的联合检测

  • I. INTRODUCTION
  • II. ANALYSIS OF PERCEPTION
  • IV. DLT-NET
    • A. Encoder
    • B. Decoder
      • 1) Drivable Area Branch(可行驶区域分支)
      • 2) Context Tensor(上下文张量)
      • 3) Lane Line Branch(车道线分支)
      • 4) Traffic Object Branch(目标检测对象分支)
    • C. Loss Function and Training
  • V. EXPERIMENTS
    • A. Dataset and Experimental Setting
    • B. Drivable Area Results(可驾驶区域结果)
  • VI. CONCLUSION

DLT-Net: Joint Detection of Drivable Areas, Lane Lines, and Traffic Objects

I. INTRODUCTION

image-20230301093847401

图1。我们的方法的输入和结果。我们的目的是联合检测可行驶区域、车道线和交通目标。(b)中,绿色区域为可行驶区域,橙色线为车道线,红色边界框为交通对象。

Mask R-CNN提出了联合检测对象和段实例,每个任务都达到了最先进的性能。但它不能直接应用于智能交通领域,因为它不能检测可行驶区域和车道线。我们认为,可行驶区域、车道线和交通目标的检测是智能车辆最基本的感知任务。

我们工作的两项贡献是:

  • 可行驶区域、车道线和交通目标检测集成为一个框架。

  • 设计了上下文张量,通过融合可驱动区域解码器与其他两个解码器的特征映射实现任务间的互信息共享。

II. ANALYSIS OF PERCEPTION

image-20230301094450169

假设智能车辆只需要使用一个摄像头进行行驶,可行驶区域的检测是感知中最紧迫的任务。当车辆行驶时,可行驶区域可能发生迅速变化。如果经常进行路径规划,就不能保证车辆的高速行驶。在大多数情况下,中心线是最好的选择,它突出了车道线检测的重要性

IV. DLT-NET

我们的网络简单而有效。我们的目标是使用统一的网络来检测可行驶区域、车道线和交通对象。该网络共享一个编码器,并为每个任务分为三个解码器。不同的部分用不同的颜色表示。在解码器中,我们设计了上下文张量结构来融合三个任务的特征映射。整个网络可以端到端的训练。

image-20230301122318042

图3,DLT-Net的架构。DLT-Net共享相同的编码器,并为每个任务组合三个解码器。上下文张量的设计是为了融合不同解码器之间的特征。每个feature map附近的数字就是feature map的大小。

A. Encoder

本文采用VGG16和特征金字塔结构作为编码器。

首先,通过VGG16使用卷积层和池化层生成5种不同大小的特征图。最后一层的尺寸为(W/16, H/16, 512)。然后所有完全连接的层在这里被移除。

研究表明,深层特征和浅层特征对感知任务都有重要作用。为了结合深层特征和浅层特征,我们采用策略融合相邻层。融合方法为单元平均运算。融合三个深度最大的feature map,最终feature map的大小为(W/4, H/4, 256)。最后的特征图用于为三个解码器提供信息。

B. Decoder

1) Drivable Area Branch(可行驶区域分支)

image-20230301122927726

可驱动区域分支的最终输出特征图的大小为(W, H, 2),这两个通道表示每个像素对于可行驶区域和背景的可能性。

2) Context Tensor(上下文张量)

image-20230301122938627

我们设计了上下文张量来融合可驾驶区域分支与其他两个分支的特征图。可行驶区域包含所有车道线,不可行驶区域包含所有潜在交通对象。交通对象在很大程度上是可驾驶区域边界的一部分。因此,可驾驶区域对其他两个任务有实际的指导。

例如,在其他的探测器中,车道线很容易与路缘混淆。由于车道线只存在于可行驶区域,因此我们的模型利用上下文张量具有很强的识别能力。

在此基础上,我们构建了上下文张量来分担任务间的指定影响。在上下文张量中,使用连接操作融合特征映射。在我们的模型中使用了两个上下文张量。

3) Lane Line Branch(车道线分支)

image-20230301122948625

车道线部分用橙色表示。车道线分支与可行驶区域具有相同的结构。融合特征图的大小为(W/16, H/16, 256)。最终的特征图也有两个通道,表示每个像素对于车道线和背景的可能性

4) Traffic Object Branch(目标检测对象分支)

其关键思想是用焦点损失函数代替原损失函数。在上下文张量之后,将网络分为两部分,一部分用于分类,另一部分用于边界盒回归。

C. Loss Function and Training

采用多任务丢失来训练整个网络。式1为总损失函数,为四部分之和。

image-20230301123135803

image-20230301123144001

V. EXPERIMENTS

A. Dataset and Experimental Setting

BDD数据集已经发布用于自动驾驶研究。这是一个很大的数据集,包含变化的天气、场景和一天中的时间。

本文利用BDD数据集对MultiNet进行再训练。然后在可行驶区域和交通目标检测任务中直接与我们的网络进行比较。

基本的DLT-Net也用于评估上下文张量。基本的DLT-Net是没有上下文张量结构的DLT-Net。换句话说,解码器在基本的DLT-Net中是完全分离的。

我们的CPU是Intel® Xeon® E5-2630 v4,我们的GPU是NVIDIA GTX TITAN Xp。

B. Drivable Area Results(可驾驶区域结果)

image-20230301123618813

图4。可行驶区域检测结果的实例。绿色区域为检测到的可行驶区域。红色圈出的区域是假阳性和假阴性。

image-20230301123653762

图5。交通对象检测结果示例。红色边界框为检测到的正确车辆,黄色边界框为误报车辆。

image-20230301123719487

图6。车道线检测结果实例。红线是检测到的正确车道线。黄线是假阳性。

image-20230301123733234

图7。一些使用DLT-Net的假阳性和假阴性。(a)可行驶区域检测结果。(b)红色边框为检测到的正确车辆,黄色边框为假阴性车辆。©车道线检测结果。红线为检测正确车道线,黄色椭圆为假阴性。

VI. CONCLUSION

提出了一种可行驶区域、车道线和交通目标联合检测的统一网络DLT-Net。这三个任务被认为是自动驾驶汽车最关键的感知任务。该网络在BDD数据集的所有三个任务中都显示出竞争性能。在DLT-Net中设计的上下文张量显著提高了检测精度,使其性能优于多项网络。

考虑到智能交通应用的性质,与将每个任务分开相比,统一网络具有固有的优势。此外,与分离每个解码器相比,上下文张量结构在提高检测精度方面显示出固有的优势。

相关文章:

CV——day80 读论文:DLT-Net:可行驶区域、车道线和交通对象的联合检测

DLT-Net:可行驶区域、车道线和交通对象的联合检测I. INTRODUCTIONII. ANALYSIS OF PERCEPTIONIV. DLT-NETA. EncoderB. Decoder1) Drivable Area Branch(可行驶区域分支)2) Context Tensor(上下文张量)3) Lane Line Branch(车道线分支)4) Traffic Object Branch(目标检测对象分…...

工具篇4.5数据可视化工具大全

1.1 Flourish 数据可视化不仅是一项技术,也是一门艺术。当然,数据可视化的工具也非常多,仅 Python 就有 matplotlib、plotly、seaborn、bokeh 等多种可视化库,我们可以根据自己的需要进行选择。但不是所有的人都擅长写代码完成数…...

京东前端二面常考手写面试题(必备)

实现发布-订阅模式 class EventCenter{// 1. 定义事件容器,用来装事件数组let handlers {}// 2. 添加事件方法,参数:事件名 事件方法addEventListener(type, handler) {// 创建新数组容器if (!this.handlers[type]) {this.handlers[type] …...

如何用AST还原某音的JSVMP

1. 什么是JSVMP vmp简单来说就是将一些高级语言的代码通过自己实现的编译器进行编译得到字节码,这样就可以更有效的保护原有代码,而jsvmp自然就是对JS代码的编译保护,具体的可以看看H5应用加固防破解-JS虚拟机保护方案。 如何区分是不是jsv…...

【蓝桥杯试题】 递归实现指数型枚举例题

💃🏼 本人简介:男 👶🏼 年龄:18 🤞 作者:那就叫我亮亮叭 📕 专栏:蓝桥杯试题 文章目录1. 题目描述2. 思路解释2.1 时间复杂度2.2 递归3. 代码展示最后&#x…...

【用Group整理目录结构 Objective-C语言】

一、接下来,我们看另外一个知识点,怎么用Group把这一堆乱七八糟的文件给它整理一下,也算是封装一下吧, 1.这一堆杂乱无章的文件: 那么,哪些类是属于模型呢,哪些类是属于视图呢,哪些类是属于控制器呢, 我们接下来通过Group的方式,来给它们分一下类, 这样看起来就好…...

JavaScript高级程序设计读书分享之8章——8.1理解对象

JavaScript高级程序设计(第4版)读书分享笔记记录 适用于刚入门前端的同志 创建自定义对象的通常方式是创建 Object 的一个新实例,然后再给它添加属性和方法。 let person new Object() person.name Tom person.age 18 person.sayName function(){//示 this.name…...

代码随想录算法训练营第四十天 | 343. 整数拆分,96.不同的二叉搜索树

一、参考资料整数拆分https://programmercarl.com/0343.%E6%95%B4%E6%95%B0%E6%8B%86%E5%88%86.html 视频讲解:https://www.bilibili.com/video/BV1Mg411q7YJ不同的二叉搜索树https://programmercarl.com/0096.%E4%B8%8D%E5%90%8C%E7%9A%84%E4%BA%8C%E5%8F%89%E6%90…...

数据结构与算法系列之顺序表的实现

这里写目录标题顺序表的优缺点:注意事项test.c(动态顺序表)SeqList.hSeqList.c各接口函数功能详解void SLInit(SL* ps);//定义void SLDestory(SL* ps);void SLPrint(SL* ps);void SLPushBack(SL* ps ,SLDataType * x );void SLPopBack(SL* ps…...

基于Linux_ARM板的驱动烧写及连接、挂载详细过程(附带驱动程序)

文章目录前言一、搭建nfs服务二、ARM板的硬件连接三、putty连接四、挂载共享文件夹五、烧写驱动程序六、驱动程序示例前言 本文操作环境:Ubuntu14.04、GEC6818 这里为似懂非懂的朋友简单叙述该文章的具体操作由来,我们的主要目的是将写好的驱动程序烧进…...

python-爬虫-字体加密

直接点 某8网 https://*****.b*b.h*****y*8*.com/ 具体网址格式就是这样的但是为了安全起见,我就这样打码了. 抛出问题 我们看到这个号码是在页面上正常显示的 F12 又是这样就比较麻烦,不能直接获取.用requests库也是获取不到正常想要的 源码的,因为字体加密了. 查看页面源代码…...

计算机组成原理4小时速成5:输入输出系统,io设备与cpu的链接方式,控制方式,io设备,io接口,并行串行总线

计算机组成原理4小时速成5:输入输出系统,io设备与cpu的链接方式,控制方式,io设备,io接口,并行串行总线 2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人&#xff0c…...

安全狗受聘成为福州网信办网络安全技术支撑单位

近日,福州市委网信办召开了2022年度网络安全技术支撑单位总结表彰大会。 作为国内云原生安全领导厂商,安全狗也出席了此次活动。 据悉,会议主要对2022年度优秀支撑单位进行表彰,并为2023年度支撑单位举行授牌仪式。 本次遴选工…...

RV1126 在Ubuntu18.04开发环境搭建

1:安装软件终端下输入安装命名:sudo apt install openssh-serversudo apt install android-tools-adbsudo apt install vim net-tools gitsudo apt install cmakesudo apt install treesudo apt install minicomsudo apt install gawksudo apt install bisonsudo ap…...

如何在 C++ 中调用 python 解析器来执行 python 代码(一)?

实现 Python UDF 中的一步就是学习如何在 C 语言中调用 python 解析器。本文根据 Python 官方文档做了一次实验,记录如下: 1. 安装依赖包 $sudo yum install python3-devel.x86_642. 使用 python-config 来生成编译选项 $python3.6-config --cflags -…...

操作系统权限提升(二十三)之Linux提权-通配符(ws)提权

系列文章 操作系统权限提升(十八)之Linux提权-内核提权 操作系统权限提升(十九)之Linux提权-SUID提权 操作系统权限提升(二十)之Linux提权-计划任务提权 操作系统权限提升(二十一)之Linux提权-环境变量劫持提权 操作系统权限提升(二十二)之Linux提权-SUDO滥用提权 利用通配符…...

Zookeeper下载和安装

Zookeeper 1.下载 官方下载地址:https://zookeeper.apache.org/ 版本:apache-zookeeper-3.7.1-bin.tar.gz 2. 安装 2.1 本地安装 2.1.1 安装JDK 见:Hadoop集群搭建 2.1.2 上传安装包 使用远程工具拷贝安装包到Linux指定路径 /opt/s…...

Biomod2 (上):物种分布模型预备知识总结

Biomod11.栅格数据处理1.1 读取一个栅格图片1.2 计算数据间的相关系数1.3 生成多波段的栅格图像1.4 修改变量名称1.4.1 计算多个变量之间的相关性2. 矢量数据处理2.1 提取矢量数据2.2 数据掩膜2.2 栅格计算2.3 拓展插件的使用3. 图表绘制3.1 遥感影像绘制3.2 柱状图分析图绘制3…...

操作指南:如何高效使用Facebook Messenger销售(二)

上一篇文章我们介绍了使用Facebook Messenger作为销售渠道的定义、好处及注意事项,本节我们将详细介绍怎么将Facebook Messenger销售与SaleSmartly(ss客服)结合,实现一站式管理多主页配图来源:SaleSmartly(…...

计算机三级|网络技术|中小型网络系统总体规划与设计方案|IP地址规划技术|2|3

p3 p4一、中小型网络系统总体规划与设计方案网络关键的设备选型路由器技术指标性能指标综述吞吐量背板能力丢包率时延抖动突发处理能力路由表容量服务质量网管能力可靠性和可用性1 吞吐量指路由器的包转发能力,涉及两个内容:端口吞吐量和整机吞吐量&…...

为什么一定要做集成测试?

集成测试,我们都不陌生,几乎我们产品每天都在进行。但是我们真的有好好思考:为什么一定要做集成测试吗?只是为了简单的将“积木”搭起来就行,还是有什么其他的深意? 深意可能不一定会有,但是意…...

前端:CSS

CSS基本语法规则:选择器若干属性声明 style标签:可以放到代码的任意位置处,head/body中都可以 三种写CSS的方式: 1、内部样式:使用style标签,直接把CSS写到html文件中。此时的style标签可以放到任何位置…...

CMMI—组织级过程定义(OPD)

大家好,我是Doker 多克!一、目的组织级过程定义(Organizational Process Definition, OPD)的目的在于建立并维护一套可用的组织级过程资产、工作环境标准以及团队规则与指南二、简介组织级过程资产使得整个组织具有一致…...

华为OD机试真题Python实现【猜字谜】真题+解题思路+代码(20222023)

猜字谜 题目 小王设计了一个简单的猜字谜游戏,游戏的谜面是一个错误的单词,比如nesw,玩家需要猜出谜底库中正确的单词。 猜中的要求如下: 对于某个谜面和谜底单词,满足下面任一条件都表示猜中: 变换顺序以后一样的,比如通过变换w和e的顺序,nwes跟news是可以完全对应的…...

软测入门(三)Selenium(Web自动化测试基础)

Selenium(Web端自动测试) Selenium是一个用于Web应用程序测试的工具:中文是硒 开源跨平台:linux、windows、mac核心:可以在多个浏览器上进行自动化测试多语言 Selenium WebDriver控制原理 Selenium Client Library…...

备战蓝桥杯——sort函数

备战蓝桥杯——sort函数排列字母lambda匿名函数排列字母 链接: 排列字母 不用多说,很简单的签到题,我们先来了解一下sort函数的用法 list.sort(cmpNone, keyNone, reverseFalse) cmp:进行比较的方法(可以自定义排序的方法,通常…...

华为机试题:HJ86 求最大连续bit数(python)

文章目录(1)题目描述(2)Python3实现(3)知识点详解1、input():获取控制台(任意形式)的输入。输出均为字符串类型。1.1、input() 与 list(input()) 的区别、及其相互转换方…...

机器学习复习--logistic回归简单的介绍和代码调用

最近需要复习一下机器学习相关知识,记录一下 一、简介 线性回归:h(x)wTxbh(x)w^T x bh(x)wTxb logistic回归就是在线性模型的基础上加上一个sigmoid函数ggg,即h(x)g(wTxb)h(x)g(w^T xb)h(x)g(wTxb)。。。g(z)1/(1e−z)g(z)1/(1e^{-z})g(z)…...

uniapp小程序接入腾讯地图sdk

新建一个项目。配置uniapp配置文件设置小程序的appid注意:匿名用户可能存在地理定位失效。查uniapp官网官网->apiuni.getLocation(OBJECT) 获取当前的地理位置、速度。属性:success匿名函数返回值:uni.getLocation({type: gcj02,success: …...

总结JavaScript中的条件判断与比较运算

一、条件判断 JavaScript 中有三种方法可以用来进行条件判断: 1、使用 if-else 语句。这种方法用于在特定条件为 true 时执行一段代码,否则执行另一段代码。例如: let a 5; if (a > 10) {console.log("a is greater than 10"…...

wordpress个性/一般开车用什么导航最好

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的ES部分补充。...

先买空间再写网站/设计网络营销方案

历史文章:【javac命令不能使用,提示不是内部命令或外部命令,请查看历史文章】需求说明之前的文章中,仅说明了单个的java文件,没有多的外部依赖的单个java文件编译成class文件。1.现在有个需求:在使用一个my…...

简单免费自建网站/百度快照投诉

系统版本centos7.2_x641.安装ntp时间服务程序yum -y install ntp2.配置ntp服务vi /etc/ntp.conf设置时间源,这里可以使用centos提供的默认时间源,其他都为默认server 0.centos.pool.ntp.org iburstserver 1.centos.pool.ntp.org iburstserver 2.centos.p…...

网页游戏排行榜前十推荐/seo怎么做关键词排名

kafka采坑记录: 1、kafka服务端server.properties中的broker.id集群内需要唯一。 2、kafka config文件中listeners和advertised.listeners需要配置本机ip:9092地址,不然消费不到数据。(如:192.168.217.128:9092) 3、java代码客户端…...

移动网站排名怎么做/网站百度推广

事件常用的一些事件click(function(){})hover()//不能做事件委托(不能用on的写法),写法,鼠标移入,移除的不同状态$(.c1).hover(//光标移入function () {console.log(111);},//光标移出function () {console.log(222)})…...

久久建筑网会员/网站关键词优化公司哪家好

基本概念IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取, 它就通知该进程. IO多路复用适用如下场合:(1)当客户处理多个描述字时(一般是交互式输入和网络套接口), 必须使用I/O复用.(2)当一个客户同时处理多个套接口时, 而这种情况是可能的, 但很少出现.(3)如果…...