Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation
Wang, Cheng, Wang et al.
Visual Teach-and-Repeat Navigation is a direct solution for mobile robot to be deployed in unknown environments. However, robust trajectory repeat navigation still remains challenged due to environmental changing and dynamic objects. In this paper, we propose a novel visual teach-and-repeat navigation system, which consists of a flexible map representation, robust map matching and a map-less local navigation module. During the teaching process, the recorded keyframes are formulated as a topo-metric graph and each node can be further extended to save new observations. Such representation also alleviates the requirement of globally consistent mapping. To enhance the place recognition performance during repeating process, instead of using frame-to-frame matching, we firstly implement keyframe clustering to aggregate similar connected keyframes into local map and perform place recognition based on visual frame-tolocal map matching strategy. To promote the local goal persistent tracking performance, a long-term goal management algorithm is constructed, which can avoid the robot getting lost due to environmental changes or obstacle occlusion. To achieve the goal without map, a local trajectory-control candidate optimization algorithm is proposed. Extensively experiments are conducted on our mobile platform. The results demonstrate that our system is superior to the baselines in terms of robustness and effectiveness.
academic
Navigation Visuelle Robuste d'Enseignement et de Répétition avec Représentation Flexible de Carte Topo-métrique
Cet article propose un nouveau système de navigation visuelle d'enseignement-répétition qui résout les défis posés par les changements environnementaux et les objets dynamiques grâce à une représentation de carte flexible, une mise en correspondance robuste de cartes et un module de navigation locale sans carte. Le système adopte une structure de graphe topo-métrique pour stocker les images-clés, supportant l'expansion des nœuds pour préserver les nouvelles observations. Les performances de reconnaissance de localisation sont améliorées par le clustering d'images-clés et une stratégie d'appariement image-vers-carte locale, et un algorithme de gestion des objectifs à long terme est construit pour éviter que le robot ne se perde en raison de changements environnementaux ou d'occlusions d'obstacles.
La navigation visuelle d'enseignement-répétition (VTR) est une solution directe pour le déploiement de robots mobiles dans des environnements inconnus, mais la réalisation d'une navigation de trajectoire robuste et répétée reste un défi en présence de changements environnementaux et d'objets dynamiques.
Valeur pratique : La navigation VTR évite la cartographie complète de l'environnement de tâche, rendant le déploiement des robots plus efficace
Besoins applicatifs : Largement demandée dans les scénarios de navigation à itinéraire fixe (tels que la navigation entre sites d'usines)
Défis techniques : Nécessite de maintenir la robustesse de la navigation dans les conditions de changements environnementaux, d'objets dynamiques et de déviation de trajectoire
Problèmes de représentation de carte : Les méthodes traditionnelles dépendent de la cartographie avec cohérence globale, exigeant une haute précision de localisation
Fragilité de la reconnaissance de localisation : L'appariement image-vers-image n'est pas suffisamment robuste aux changements de point de vue et aux occlusions
Dépendance du module de navigation : Les systèmes existants dépendent excessivement d'une reconnaissance de localisation précise, échouant facilement lorsque l'appariement échoue
Faible adaptabilité environnementale : Difficultés à traiter les changements environnementaux et les obstacles dynamiques
Proposition d'une méthode de représentation de carte flexible : Conception d'une structure de graphe topo-métrique adaptable aux changements environnementaux et aux erreurs de dérive odomètrique
Construction d'un système VTR de navigation robuste : Capable de s'adapter aux changements environnementaux, aux objets dynamiques et aux occlusions de point de vue, avec un module de navigation pouvant être intégré dans d'autres systèmes VTR
Implémentation d'un système convivial : Facile à adapter à de nouveaux environnements de tâche, avec une bonne praticité
Vérification de l'efficacité du système : Expériences étendues menées sur des plates-formes mobiles, démontrant la supériorité par rapport aux méthodes de base
Phase d'enseignement : Opération manuelle du robot le long de l'itinéraire de tâche, enregistrement en temps réel des images visuelles comme carte
Phase de répétition : Le robot tente de mettre en correspondance les images visuelles actuelles avec la carte et met à jour l'objectif suivant lorsque l'appariement réussit
contenant la transformation relative, les points caractéristiques 2D, la position 3D et les informations d'image. Lors de la détection d'une boucle fermée, elle s'étend à :
Le clustering d'images-clés augmente significativement la densité de détection de boucles fermées, particulièrement aux virages, fournissant des retours plus opportuns au module de planification de mouvement.
Le système peut ajouter de nouvelles informations environnementales pendant la phase de répétition, les images-clés étendues maintenant l'association avec la carte originale sans compromettre la structure topologique.
Gestion des objectifs à long terme : La stratégie multi-objectif améliore significativement la robustesse du système aux défaillances de détection de boucles fermées
Clustering d'images-clés : Crucial pour l'appariement robuste dans les environnements pauvres en texture
Expansion de carte : Traite efficacement les changements environnementaux, supportant les tâches de navigation à long terme
Dépendance à la pose relative : Les performances du système dépendent de la précision des poses relatives entre images-clés
Dérive à long terme : Si le robot ne peut pas mettre en correspondance la carte pendant une longue période, la dérive odomètrique peut causer une divergence
Hypothèses environnementales : Suppose que l'estimation de pose relative est suffisamment précise, ce qui peut ne pas être valide dans certains environnements
Construction d'un modèle de navigation visuelle bout-à-bout basé sur l'apprentissage profond, se libérant davantage de la dépendance au suivi précis de pose globale et à la cartographie environnementale.
Innovation technique : Proposition d'une nouvelle représentation de carte topo-métrique, résolvant efficacement les limitations des méthodes traditionnelles
Complétude du système : Solution complète de la construction de carte à l'exécution de navigation
Expériences suffisantes : Vérification complète dans plusieurs scènes et conditions
Valeur pratique : Conception du système considérant les besoins de déploiement réel, conviviale
Analyse théorique insuffisante : Manque de garanties théoriques sur la convergence et la stabilité du système
Complexité computationnelle : Analyse détaillée manquante de la charge computationnelle du clustering d'images-clés et de la gestion multi-objectif
Limitations environnementales : Tests principalement dans des environnements structurés intérieurs, adaptabilité en environnements extérieurs complexes inconnue
Bases de comparaison limitées : Comparaison principalement avec la méthode classique BVTR, manque de comparaison avec les méthodes récentes d'apprentissage profond
L'article contient 31 références bibliographiques couvrant les domaines pertinents du SLAM visuel, de la navigation robotique et de la reconnaissance de localisation, fournissant une base théorique solide pour la recherche.
Évaluation Globale : Cet article propose une solution VTR de navigation pratique avec une certaine innovation technique et une vérification expérimentale suffisante. Bien qu'il y ait encore de l'espace pour l'amélioration dans l'analyse théorique et l'adaptabilité environnementale, il fournit une contribution technique précieuse au domaine de la navigation des robots mobiles.