2025-11-13T13:49:10.872331

Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation

Wang, Cheng, Wang et al.
Visual Teach-and-Repeat Navigation is a direct solution for mobile robot to be deployed in unknown environments. However, robust trajectory repeat navigation still remains challenged due to environmental changing and dynamic objects. In this paper, we propose a novel visual teach-and-repeat navigation system, which consists of a flexible map representation, robust map matching and a map-less local navigation module. During the teaching process, the recorded keyframes are formulated as a topo-metric graph and each node can be further extended to save new observations. Such representation also alleviates the requirement of globally consistent mapping. To enhance the place recognition performance during repeating process, instead of using frame-to-frame matching, we firstly implement keyframe clustering to aggregate similar connected keyframes into local map and perform place recognition based on visual frame-tolocal map matching strategy. To promote the local goal persistent tracking performance, a long-term goal management algorithm is constructed, which can avoid the robot getting lost due to environmental changes or obstacle occlusion. To achieve the goal without map, a local trajectory-control candidate optimization algorithm is proposed. Extensively experiments are conducted on our mobile platform. The results demonstrate that our system is superior to the baselines in terms of robustness and effectiveness.
academic

Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation

基本信息

  • 论文ID: 2510.09089
  • 标题: Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation
  • 作者: Jikai Wang, Yunqi Cheng, Kezhi Wang, and Zonghai Chen (中国科学技术大学)
  • 分类: cs.RO (机器人学)
  • 发表时间: 2025年10月10日
  • 论文链接: https://arxiv.org/abs/2510.09089

摘要

本文提出了一种新颖的视觉教学-重复导航系统,通过灵活的地图表示、鲁棒的地图匹配和无地图局部导航模块来解决环境变化和动态物体带来的挑战。系统采用拓扑-度量图结构存储关键帧,支持节点扩展以保存新观测。通过关键帧聚类和帧到局部地图的匹配策略提升位置识别性能,并构建长期目标管理算法避免机器人因环境变化或障碍物遮挡而迷失。

研究背景与动机

问题定义

视觉教学-重复(VTR)导航是移动机器人在未知环境中部署的直接解决方案,但在环境变化和动态物体存在的情况下,实现鲁棒的轨迹重复导航仍然具有挑战性。

重要性

  1. 实用价值:VTR导航避免了对任务环境的完全建图,使机器人部署更加高效
  2. 应用需求:在固定路线导航场景(如工厂站点间导航)中需求广泛
  3. 技术挑战:需要在环境变化、动态物体和路径偏离等条件下保持导航鲁棒性

现有方法局限性

  1. 地图表示问题:传统方法依赖全局一致性建图,对定位精度要求高
  2. 位置识别脆弱:帧到帧匹配在视点变化和遮挡情况下不够鲁棒
  3. 导航模块依赖:现有系统过度依赖准确的位置识别,匹配失败时容易失效
  4. 环境适应性差:难以处理环境变化和动态障碍物

核心贡献

  1. 提出了灵活的地图表示方法:设计了可适应环境变化和里程计漂移误差的拓扑-度量图结构
  2. 构建了鲁棒的VTR导航系统:能够适应环境变化、动态物体和视点遮挡,导航模块可嵌入其他VTR系统
  3. 实现了用户友好的系统:易于适应新的任务环境,具有良好的实用性
  4. 验证了系统有效性:在移动平台上进行了广泛实验,证明了相比基线方法的优越性

方法详解

任务定义

VTR导航包含两个阶段:

  • 教学阶段:人工操控机器人沿任务路线行驶,实时记录视觉帧作为地图
  • 重复阶段:机器人尝试匹配当前视觉帧与地图,并在匹配成功时更新下一步目标

系统架构

1. 地图表示错误分析

传统SLAM地图表示为:

M̂ = {[Ki, T̂Wi], i = 1, ···, N}

其中估计的全局位姿存在累积漂移误差。本文提出的表示为:

M̄ = {[Ki, T̂ij], i, j = 1, ···, N}

每个关键帧仅保存与邻近关键帧的可信相对位姿变换。

2. 拓扑-度量关键帧地图

关键帧定义为:

Ki = {Ti-1i, Ui, Pi, Ii}

包含相对变换、2D特征点、3D位置和图像信息。检测到回环时扩展为:

Ki = {Ti-1i, Ui, Pi, Ii, TL(i)i, L(i)}

3. 地图冗余减少

通过关键帧聚类合并相似帧:

  • 计算DBoW相似性,阈值以下停止
  • 将相似关键帧的3D特征点变换到保留帧坐标系
  • 移除冗余关键帧,保持链表结构

视觉重复阶段

1. 帧到关键帧匹配

采用约束搜索策略:

Rn = {[u,v]T | ||[u,v]T - [un,vn]T||2 < γ}

在圆形区域内搜索对应特征,通过PnP求解相对位姿。

2. 地图扩展

当机器人偏离教学路线时,将新观测添加到地图:

Ki = {Ti-1i, Ūi, P̄i, Ii, TL(i)i, L(i), TiS(i), S(i), {K}}

3. 目标列表管理

构建目标列表而非单一目标:

Tkg0 = inv(Tik) · TiS(i)
Tkg1 = Tkg0 · TS(i)S(S(i))

目标列表Lg = {tg0, tg1, ···, tgM}在匹配成功时更新。

4. 局部运动规划

通过轨迹候选评分实现多目标跟踪:

si = (1/3) Σ(m=0 to 2) (1 - (0.005 · Θ(tie - x, tgm - x))^(1/2))

考虑前三个目标进行评分,选择最优轨迹。

实验设置

移动平台配置

  • 硬件:差分驱动平台,搭载IMU嵌入式相机(MYNTEYE-SC)和激光雷达(Livox Mid-360)
  • 定位系统:使用OpenVINS进行视觉里程计,iG-LIO记录轨迹用于评估

评价指标

  • 终点距离:实际到达终点与预设教学路线终点的距离
  • 成功率:机器人能否从起点导航到终点(不要求严格跟随路线)

数据集

  • 环境:办公室和走廊场景
  • 路线类型:直线和弯曲路径
  • 测试条件:正常状态、障碍物遮挡、环境变化

对比方法

  • BVTR:经典的生物启发VTR方法
  • 消融实验:无关键帧聚类、单目标跟踪等变体

实验结果

主要结果

1. 正常条件下导航

  • 办公室场景:本方法终点距离0.08m,BVTR为0.10m
  • 两种方法都能成功完成导航,在转弯处有轻微偏离

2. 障碍物遮挡测试

  • 本方法:终点距离0.08m,成功避障并回到教学路线
  • BVTR:终点距离5.58m,在障碍物前停止无法继续
  • 单目标版本:终点距离5.20m,验证了多目标策略的重要性

3. 弯曲路径导航(走廊场景)

  • 本方法:终点距离0.37m,成功跟随整条路线
  • BVTR:终点距离11.44m,导航到未知位置后停止
  • 无关键帧聚类:终点距离10.49m,说明聚类策略的关键作用

4. 关键帧聚类验证

关键帧聚类显著提高了回环检测密度,特别是在转弯处,为运动规划模块提供了更及时的反馈。

5. 地图扩展验证

系统能够在重复过程中添加新的环境信息,扩展的关键帧与原地图保持关联,不破坏拓扑结构。

实验发现

  1. 长期目标管理:多目标策略显著提高了系统对回环检测失败的鲁棒性
  2. 关键帧聚类:在纹理缺乏环境中对鲁棒匹配至关重要
  3. 地图扩展:有效处理了环境变化,支持长期导航任务

相关工作

主要研究方向

  1. 生物启发方法:直接图像比较和模式识别
  2. 视觉几何方法:基于特征的图像匹配和PnP求解
  3. 深度学习方法:端到端学习和神经网络匹配
  4. 拓扑-度量融合:结合拓扑和度量信息的导航

本文优势

  • 相比生物启发方法:更鲁棒的特征匹配
  • 相比深度学习方法:计算效率高,可解释性强
  • 相比传统几何方法:无需全局一致性,适应性强

结论与讨论

主要结论

  1. 灵活地图表示:拓扑-度量图有效缓解了全局建图要求
  2. 鲁棒导航系统:多目标管理和关键帧聚类显著提升了系统鲁棒性
  3. 实用性验证:在多种挑战性场景下验证了系统的有效性

局限性

  1. 相对位姿依赖:系统性能依赖于关键帧间相对位姿的准确性
  2. 长期漂移:如果长时间无法匹配地图,里程计漂移可能导致发散
  3. 环境假设:假设相对位姿估计足够准确,在某些环境下可能不成立

未来方向

构建基于深度学习的端到端视觉导航模型,进一步摆脱对准确全局位姿跟踪和环境建图的需求。

深度评价

优点

  1. 技术创新:提出了新颖的拓扑-度量地图表示,有效解决了传统方法的局限性
  2. 系统完整:从地图构建到导航执行的完整解决方案
  3. 实验充分:在多种场景和条件下进行了全面验证
  4. 实用价值:系统设计考虑了实际部署需求,用户友好

不足

  1. 理论分析不足:缺乏对系统收敛性和稳定性的理论保证
  2. 计算复杂度:未详细分析关键帧聚类和多目标管理的计算开销
  3. 环境限制:主要在室内结构化环境中测试,户外复杂环境的适应性未知
  4. 比较基线有限:主要与经典BVTR方法比较,缺乏与最新深度学习方法的对比

影响力

  1. 学术贡献:为VTR导航提供了新的技术路径,具有一定的理论价值
  2. 实用价值:方法可直接应用于工业和家用机器人导航
  3. 可复现性:技术细节描述较为完整,便于复现和改进

适用场景

  1. 固定路线导航:工厂内部站点间导航、仓储机器人路径跟随
  2. 环境变化场景:需要适应轻微环境变化的长期导航任务
  3. 计算资源受限:相比深度学习方法,对硬件要求较低

参考文献

论文包含31篇参考文献,涵盖了视觉SLAM、机器人导航、位置识别等相关领域的重要工作,为研究提供了坚实的理论基础。


总体评价:本文提出了一种实用的VTR导航解决方案,在技术上有一定创新性,实验验证较为充分。虽然在理论分析和环境适应性方面还有提升空间,但为移动机器人导航领域提供了有价值的技术贡献。