当前位置: 首页 > news >正文

论文阅读:Long-Term Visual Simultaneous Localization and Mapping

论文摘要指出,为了在长期变化的环境中准确进行定位,提出了一种新型的长期视觉SLAM(同步定位与地图构建)系统,该系统具备地图预测和动态物体移除功能。系统首先设计了一个高效的视觉点云匹配算法,将2D像素信息和3D体素信息有效融合。其次,使用贝叶斯持久性过滤器对地图点进行静态、半静态和动态分类,并移除动态点以消除其影响。通过对半静态地图点的时间序列建模,可以获得全局预测地图。最后,将预测的全局地图整合到先进的SLAM方法中,从而实现了一种适用于长期动态环境的高效视觉SLAM系统。通过在室内环境中对轮椅机器人进行数月的广泛实验,结果表明该方法在地图预测精度和定位性能方面优于现有方法。

论文中实现的算法过程主要包括以下几个步骤:

  1. 视觉点云匹配算法:设计一个算法来高效地融合2D像素信息和3D体素信息。

  2. 地图点分类:使用贝叶斯持久性过滤器(BPF)将每个地图点分类为静态、半静态和动态。

  3. 动态地图点移除:移除动态地图点以消除它们对地图的影响。

  4. 全局预测地图:通过对半静态地图点的时间序列建模来获得一个全局预测地图。

  5. 系统集成:将预测的全局地图整合到现有的SLAM方法中,以提高长期动态环境下视觉SLAM系统的效率。

  6. 实验验证:通过在室内环境中对轮椅机器人进行数月的实验,验证了方法的有效性,并展示了该方法在地图预测精度和定位性能方面相较现有方法的优越性。

此外,论文还提出了一种基于长短期指数模型的预测方法,以更准确地预测半静态地图点的未来状态,并定义了一个新的3D地图点描述符,用于在不同时间序列的地图中匹配地图点。通过贝叶斯持久性过滤和生存分析,可以计算每个地图点在时间序列中的生存函数,并据此预测其未来状态。

根据文中描述,动态地图点的移除过程如下:

  1. 使用贝叶斯持久性过滤器(Bayesian Persistence Filter,BPF)对每个地图点进行分类,将它们分为静态、半静态和动态。

  2. 识别出的动态地图点通常是在单次机器人遍历的短时间内出现并快速移动的,例如周围移动的人类。

  3. 动态地图点的移除是为了消除这些点对地图的影响,这样做可以通过多次访问同一地点来检测到并移除这些点。

  4. 文章中提出的系统使用BPF来移除环境中的动态地图点。首先,通过追踪每个地图点的观察情况来准确使用持久性过滤器。

  5. 在追踪观察模块中,可以追踪相应地图点的所有观察情况来更新持久性过滤器。当新的帧到达时,将当前帧中的关键点与候选地图点匹配。

  6. 如果地图点匹配,则在此时间戳中被定义为存活,并将“命中观察”分配给持久性过滤器。否则,地图点被定义为在此时间戳中死亡,并将“未命中观察”分配给持久性过滤器。

  7. 对于持久性概率低于某一阈值的地图点,将其视为动态地图点并从地图中移除。

  8. 如果一个地图点在多个帧中都没有被观察到,就不能立即定义为动态地图点。每个地图点与观察它的关键帧中的一些关键点相对应。当移除一个地图点时,将相应的关键点设置为“不可用”。

通过以上步骤,系统能够有效地移除影响地图准确性的动态地图点,从而提高了SLAM系统在长期动态环境下的表现。

论文中将预测的全局地图整合到现有SLAM方法中的过程主要包括以下几个步骤:

  1. 局部地图构建:使用局部地图构建线程获取环境的精确地图。

  2. 地图整合:依照ORB-SLAM3方法,将局部地图合并入全局地图中。这一步骤确保了在动态环境中对地图进行持续更新。

  3. 重定位算法:使用重定位算法来获取对应的光度信息,并利用迭代最近点(Iterative Closest Point,ICP)算法得到匹配的地图点云,这是为了在不同的会话之间获取准确的机器人初始位置。

  4. 定位性能评估:通过在不同速度下收集的测试数据集来评估定位性能。这些数据集在Github上开源,以便社区使用和验证。

  5. 真实世界数据集的地面真实值获取:使用3D激光雷达和激光雷达惯性里程计平滑和映射(LIO-SAM)方法获取。

通过上述步骤,研究者们成功地将时间序列建模和全局地图预测整合到了现有的SLAM框架中,提高了在长期动态环境下的定位和地图构建性能。实验结果表明,该系统在定位准确性、鲁棒性和内存消耗方面都达到了较好的效果。

在论文中,评定算法性能的方法包括以下几个主要方面:

  1. 绝对轨迹误差(ATE): ATE用于评估算法预测的轨迹和实际轨迹之间的差异。这是一个常用的衡量SLAM系统定位准确性的指标。

  2. 动态环境下的性能: 评估算法在处理动态环境,尤其是在移动物体和长期环境变化方面的能力。

  3. 内存消耗: 衡量算法运行时对内存的需求。对于长期运行的系统,内存效率是一个重要指标。

  4. 实验验证: 通过在不同环境和条件下进行的实验来评估算法的性能。这些实验通常包括在真实世界数据集和模拟数据集上的测试。

  5. 与现有方法的比较: 将所提算法的性能与其他现有SLAM方法进行比较,以展示其相对优势和缺点。

  6. 正确率(CR): 评估系统在整个数据期间的稳健性。这是基于每个估计位姿的绝对轨迹误差和绝对方向误差来计算的。

通过这些评估方法,作者展示了他们提出的系统在长期动态环境下的有效性和优势,特别是在地图预测精度、定位性能和对动态物体处理方面。

论文的主要创新点包括:

  1. 长期视觉SLAM系统:提出了一种结合贝叶斯持久性过滤器和全局地图预测的长期视觉SLAM系统,适用于长时间、动态变化的环境中。

  2. 贝叶斯持久性过滤器(BPF):利用BPF对地图点进行静态、半静态和动态分类,以及有效地移除动态地图点,减少它们对地图准确性的影响。

  3. 全局地图预测:通过对半静态地图点的时间序列建模,实现了对环境的长期、动态变化的有效预测。

  4. 融合视觉点云匹配算法:开发了一种新型的视觉点云匹配算法,结合2D像素信息和3D体素信息,以提高匹配的精确度。

  5. 实验验证:通过在实际室内环境中对轮椅机器人进行长期实验,证明了方法的有效性,并与现有方法进行了比较,展示了其在地图预测精度和定位性能方面的优势。

这些创新点表明了该研究在长期动态环境中视觉SLAM系统的发展方面取得了重要进步。

在论文中,作者将提出的算法与以下现有的SLAM方法进行了比较:

  1. ORB-SLAM2:一种广泛使用的基于特征的SLAM方法,适用于单目、双目和RGB-D相机。

  2. ORB-SLAM3:ORB-SLAM的最新版本,支持视觉、视觉-惯性和多地图SLAM。

  3. DVO SLAM:基于稠密视觉里程计(Dense Visual Odometry)的SLAM方法。

  4. Depth-Edge SLAM:一种利用深度和边缘信息进行SLAM的方法。

  5. DynaSLAM:针对动态环境设计的一种SLAM系统,能够在存在动态物体的环境中进行地图构建和定位。

  6. 其他变体:包括没有运动物体移除(MPR)、没有全局地图预测(GMP)、没有动态物体检测(OD)、没有3D匹配等方法的LTVS-BPF变体。

这些对比方法覆盖了不同类型的SLAM系统,包括基于特征、基于深度、以及针对动态环境的方法。通过与这些方法的比较,论文能够展示所提出系统在不同情境下的性能优势和适用性。

相关文章:

论文阅读:Long-Term Visual Simultaneous Localization and Mapping

论文摘要指出,为了在长期变化的环境中准确进行定位,提出了一种新型的长期视觉SLAM(同步定位与地图构建)系统,该系统具备地图预测和动态物体移除功能。系统首先设计了一个高效的视觉点云匹配算法,将2D像素信…...

Docker 学习总结(80)—— 轻松驾驭容器,玩转 LazyDocker

前言 LazyDocker 是一个用户友好的命令行工具,简化了 Docker 的管理。它能够通过单一命令执行常见的 Docker 任务,如启动、停止、重启和移除容器。LazyDocker 还能轻松查看日志、清理未使用的容器和镜像,并自定义指标。 简绍 LazyDocker 是一个用户友好的 CLI 工具,可以轻…...

Android 13 - Media框架(24)- MediaCodecList

这一节我们要了解 MediaCodecList 中的信息是如何加载的&#xff0c;以及这些信息是如何使用到的。 // static sp<IMediaCodecList> MediaCodecList::getLocalInstance() {Mutex::Autolock autoLock(sInitMutex);if (sCodecList nullptr) {MediaCodecList *codecList n…...

【稳定检索|投稿优惠】2024年交通运输与能源动力国际学术会议(IACTEP 2024)

2024年交通运输与能源动力国际学术会议(IACTEP 2024) 2024 International Academic Conference on Transportation and Energy Power(IACTEP) 一、【会议简介】 2024年交通运输与能源动力国际学术会议(IACTEP 2024)将在美丽的三亚盛大启幕。本次会议将聚焦交通运输与能源动力等…...

React学习计划-React16--React基础(三)收集表单数据、高阶函数柯里化、类的复习

1. 收集表单数据 包含表单的组件分类 受控组件——页面中所有输入类的DOM,随着输入&#xff0c;把值存维护在状态里&#xff0c;需要用的时候去状态里取值&#xff08;推荐&#xff0c;避免了过渡使用ref&#xff09;非受控组件——页面中所有输入类的DOM&#xff0c;现用现取…...

研究生课程 |《数值分析》复习

搭配往年真题册食用最佳。...

55 回溯算法解黄金矿工问题

问题描述&#xff1a;你要开发一座金矿&#xff0c;地质学家已经探明了这座金矿中的资源分布&#xff0c;并用大小为m*n的网格grid进行了标注&#xff0c;每个单元格中的整数就表示这一单元格中的黄金数量&#xff1b;如果单元格是空的&#xff0c;那么就是0&#xff0c;为了使…...

[笔记]ByteBuffer垃圾回收

参考&#xff1a;https://blog.csdn.net/lom9357bye/article/details/133702169 public static void main(String[] args) throws Throwable {List<Object> list new ArrayList<>();Thread thread new Thread(() -> {ByteBuffer byteBuffer ByteBuffer.alloc…...

c++ opencv中unsigned char *、Mat、Qimage互相转换

unsigned char * 转Mat unsinged char * data img.data; Mat mat (h,w,cv_8UC3,data,0);void * 转Qimage uchar * bit (uchar*)pRknnInputData; QImage image QImage(bit, 2048,1536, QImage::Format_RGB888);qimage转Mat QImage image QImage (MODEL_INPUT_WIDTH_SIZE,MODE…...

法线贴图实现衣服上皱褶特效

在线工具推荐&#xff1a; 3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 法线贴图在3D建模中扮演着重要的角色&#xff0c;它通过模拟表面的微…...

2017年第六届数学建模国际赛小美赛B题电子邮件中的笔迹分析解题全过程文档及程序

2017年第六届数学建模国际赛小美赛 B题 电子邮件中的笔迹分析 原题再现&#xff1a; 笔迹分析是一种非常特殊的调查形式&#xff0c;用于将人们与书面证据联系起来。在法庭或刑事调查中&#xff0c;通常要求笔迹鉴定人确认笔迹样本是否来自特定的人。由于许多语言证据出现在电…...

CentOS安装Python解释,CentOS设置python虚拟环境,linux设置python虚拟环境

一、安装python解释器 1、创建解释器安装的目录&#xff1a;/usr/local/python39 cd /usr/local mkdir python39 2、下载依赖 yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc make libffi-devel xz-devel …...

在线智能防雷监控(检测)系统应用方案

在线智能防雷监控系统是一种利用现代信息技术&#xff0c;对防雷设施的运行状态进行实时监测、管理和控制的系统&#xff0c;它可以有效提高防雷保护的安全性、可靠性和智能化程度&#xff0c;降低运维成本和风险&#xff0c;为用户提供全方位的防雷解决方案。 在线智能防雷监控…...

flutter + firebase 云消息通知教程 (android-安卓、ios-苹果)

如果能看到这篇文章的 一定已经对手机端的 消息推送通知 有了一定了解。 国内安卓厂商这里不提都有自己的FCM 可自行查找。&#xff08;国内因无法科学原因 &#xff0c;不能使用谷歌服务&#xff09;只说海外的。 目前 adnroid 和 ios 推送消息分别叫 FCM 和 APNs。这里通过…...

2024年PMP考试新考纲-PMBOK第七版-项目管理原则真题解析

从战争中学习战争。对于参加2024年PMP考试的小伙伴来说&#xff0c;最有效的学习方式是这样地&#xff1a;①阅读了教材&#xff08;PMBOK6、7和敏捷&#xff09;&#xff0c;了解基本概念&#xff1b;②反复刷近期的PMP考试真题&#xff0c;查漏补缺。 为此&#xff0c;华研荟…...

vscode开发python环境配置

前言 vscode作为一款好用的轻量级代码编辑器&#xff0c;不仅支持代码调试&#xff0c;而且还有丰富的插件库&#xff0c;可以说是免费好用&#xff0c;对于初学者来说用来写写python是再合适不过了。下面就推荐几款个人觉得还不错的插件&#xff0c;希望可以帮助大家更好地写…...

数据库客户案例:每个物种都需要一个数据库!

1、GERDH——花卉多组学数据库 项目名称&#xff1a;GERDH&#xff1a;花卉多组学数据库 链接地址&#xff1a;https://dphdatabase.com 项目描述&#xff1a;GERDH包含了来自150多种园艺花卉植物种质的 12961个观赏植物。将不同花卉植物转录组学、表观组学等数据进行比较&am…...

数据分析思维导图

参考&#xff1a; https://zhuanlan.zhihu.com/p/567761684?utm_id0 1、数据分析步骤地图 2、数据分析基础知识地图 3、数据分析技术知识地图 4、数据分析业务流程 5、数据分析师能力体系 6、数据分析思路体系 7、电商数据分析核心主题 8、数据科学技能书知识地图 9、数据挖掘…...

网络基础【网线的制作、OSI七层模型、集线器、交换机介绍、路由器的配置】

目录 一.网线的制作 1.1.网线的标准 1.2.水晶头的做法 二.OSI七层模型、集线器、交换机介绍 集线器&#xff08;Hub&#xff09;&#xff1a; 交换机&#xff08;Switch&#xff09;&#xff1a; 三.路由器的配置 3.1.使用 3.2.常用的功能介绍 1、如何管理路由器 2、家…...

C++中的继承(二)

文章目录 前言多继承虚继承虚继承的底层组合 前言 上一篇文章我们C的正常继承其实已经讲完了&#xff0c;但是后面还有一个大坑。 实际当中继承有单继承和多继承。 单继承就是直接继承一个类。 只有一个直接父类的就叫做单继承。 如果是单继承那就比较简单。 现实世界除了有…...

python打卡day49

知识点回顾&#xff1a; 通道注意力模块复习空间注意力模块CBAM的定义 作业&#xff1a;尝试对今天的模型检查参数数目&#xff0c;并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

day52 ResNet18 CBAM

在深度学习的旅程中&#xff0c;我们不断探索如何提升模型的性能。今天&#xff0c;我将分享我在 ResNet18 模型中插入 CBAM&#xff08;Convolutional Block Attention Module&#xff09;模块&#xff0c;并采用分阶段微调策略的实践过程。通过这个过程&#xff0c;我不仅提升…...

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

linux 下常用变更-8

1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行&#xff0c;YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID&#xff1a; YW3…...

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包&#xff1a; for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问&#xff1a;说说对 IP 数据报中 TTL 的理解&#xff1f;我们都知道&#xff0c;IP 数据报由首部和数据两部分组成&#xff0c;首部又分为两部分&#xff1a;固定部分和可变部分&#xff0c;共占 20 字节&#xff0c;而即将讨论的 TTL 就位于首…...

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念&#xff0c;其实 Fiori当中还有 V4&#xff0c;咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)&#xff0c;代理中间件&#xff08;ui5-middleware-simpleproxy&#xff09;-CSDN博客…...

HarmonyOS运动开发:如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit&#xff08;传感器服务&#xff09;# 前言 在运动类应用中&#xff0c;运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据&#xff0c;如配速、距离、卡路里消耗等&#xff0c;用户可以更清晰…...

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币&#xff0c;另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额&#xff0c;返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...