Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation
Wang, Cheng, Wang et al.
Visual Teach-and-Repeat Navigation is a direct solution for mobile robot to be deployed in unknown environments. However, robust trajectory repeat navigation still remains challenged due to environmental changing and dynamic objects. In this paper, we propose a novel visual teach-and-repeat navigation system, which consists of a flexible map representation, robust map matching and a map-less local navigation module. During the teaching process, the recorded keyframes are formulated as a topo-metric graph and each node can be further extended to save new observations. Such representation also alleviates the requirement of globally consistent mapping. To enhance the place recognition performance during repeating process, instead of using frame-to-frame matching, we firstly implement keyframe clustering to aggregate similar connected keyframes into local map and perform place recognition based on visual frame-tolocal map matching strategy. To promote the local goal persistent tracking performance, a long-term goal management algorithm is constructed, which can avoid the robot getting lost due to environmental changes or obstacle occlusion. To achieve the goal without map, a local trajectory-control candidate optimization algorithm is proposed. Extensively experiments are conducted on our mobile platform. The results demonstrate that our system is superior to the baselines in terms of robustness and effectiveness.
academic
Navigazione Visiva Robusta di Insegnamento-Ripetizione con Rappresentazione Flessibile di Mappe Grafo Topometrico
Questo articolo propone un innovativo sistema di navigazione visiva di insegnamento-ripetizione che affronta le sfide poste dai cambiamenti ambientali e dagli oggetti dinamici attraverso una rappresentazione flessibile della mappa, un robusto abbinamento della mappa e un modulo di navigazione locale senza mappa. Il sistema impiega una struttura di grafo topometrico per memorizzare fotogrammi chiave, supportando l'espansione dei nodi per preservare nuove osservazioni. Attraverso strategie di clustering di fotogrammi chiave e abbinamento da fotogramma a mappa locale, migliora le prestazioni di riconoscimento della posizione e costruisce un algoritmo di gestione degli obiettivi a lungo termine per evitare che il robot si perda a causa di cambiamenti ambientali o occlusioni da ostacoli.
La navigazione visiva di insegnamento-ripetizione (VTR) rappresenta una soluzione diretta per il dispiegamento di robot mobili in ambienti sconosciuti, tuttavia la realizzazione di una navigazione di ripetizione della traiettoria robusta in presenza di cambiamenti ambientali e oggetti dinamici rimane una sfida significativa.
Valore Pratico: La navigazione VTR evita la mappatura completa dell'ambiente di lavoro, rendendo il dispiegamento dei robot più efficiente
Esigenze Applicative: Ampia domanda in scenari di navigazione su percorsi fissi (come la navigazione tra stazioni in ambienti industriali)
Sfide Tecniche: Necessità di mantenere la robustezza della navigazione in condizioni di cambiamento ambientale, oggetti dinamici e deviazioni dal percorso
Problemi di Rappresentazione della Mappa: I metodi tradizionali dipendono dalla mappatura con coerenza globale, richiedendo elevata precisione di localizzazione
Fragilità del Riconoscimento della Posizione: L'abbinamento da fotogramma a fotogramma non è sufficientemente robusto in caso di variazioni di punto di vista e occlusioni
Dipendenza dal Modulo di Navigazione: I sistemi esistenti dipendono eccessivamente da un riconoscimento della posizione accurato, fallendo facilmente quando l'abbinamento non riesce
Scarsa Adattabilità Ambientale: Difficoltà nel gestire cambiamenti ambientali e ostacoli dinamici
Proposta di un Metodo di Rappresentazione Flessibile della Mappa: Progettazione di una struttura di grafo topometrico adattabile ai cambiamenti ambientali e agli errori di deriva dell'odometria
Costruzione di un Sistema VTR Robusto: Capacità di adattarsi ai cambiamenti ambientali, agli oggetti dinamici e alle occlusioni di punto di vista, con modulo di navigazione incorporabile in altri sistemi VTR
Implementazione di un Sistema Intuitivo: Facile adattamento a nuovi ambienti di lavoro con buona praticità
Verifica dell'Efficacia del Sistema: Ampi esperimenti su piattaforme mobili che dimostrano la superiorità rispetto ai metodi di base
Fase di Insegnamento: Controllo manuale del robot lungo il percorso di lavoro, registrazione in tempo reale dei fotogrammi visivi come mappa
Fase di Ripetizione: Il robot tenta di abbinare i fotogrammi visivi attuali con la mappa e aggiorna il prossimo obiettivo quando l'abbinamento ha successo
Il clustering di fotogrammi chiave aumenta significativamente la densità di rilevamento dei cicli, in particolare nelle curve, fornendo feedback più tempestivo al modulo di pianificazione del movimento.
Il sistema è in grado di aggiungere nuove informazioni ambientali durante la fase di ripetizione, mantenendo l'associazione tra fotogrammi chiave espansi e la mappa originale senza compromettere la struttura topologica.
Gestione degli Obiettivi a Lungo Termine: La strategia multi-obiettivo migliora significativamente la robustezza del sistema ai fallimenti di rilevamento dei cicli
Clustering di Fotogrammi Chiave: Critico per l'abbinamento robusto in ambienti con texture scarsa
Espansione della Mappa: Gestione efficace dei cambiamenti ambientali, supporto per compiti di navigazione a lungo termine
Rappresentazione Flessibile della Mappa: Il grafo topometrico mitiga efficacemente i requisiti di mappatura globale
Sistema di Navigazione Robusto: La gestione multi-obiettivo e il clustering di fotogrammi chiave migliorano significativamente la robustezza del sistema
Verifica della Praticità: Efficacia del sistema verificata in molteplici scenari impegnativi
Costruzione di modelli di navigazione visiva end-to-end basati su apprendimento profondo, per liberarsi ulteriormente dalla necessità di tracciamento accurato della posa globale e dalla mappatura ambientale.
Analisi Teorica Limitata: Mancanza di garanzie teoriche sulla convergenza e stabilità del sistema
Complessità Computazionale: Analisi dettagliata del costo computazionale del clustering di fotogrammi chiave e della gestione multi-obiettivo non fornita
Limitazioni Ambientali: Test principalmente in ambienti strutturati interni, adattabilità in ambienti esterni complessi sconosciuta
Linee di Base di Confronto Limitate: Confronto principalmente con il metodo classico BVTR, mancanza di confronto con metodi recenti di apprendimento profondo
L'articolo contiene 31 riferimenti bibliografici, che coprono importanti lavori nei campi della SLAM visiva, navigazione robotica, riconoscimento della posizione e altri ambiti correlati, fornendo una base teorica solida per la ricerca.
Valutazione Complessiva: Questo articolo propone una soluzione pratica di navigazione VTR con una certa innovazione tecnica e verifica sperimentale completa. Sebbene vi sia spazio per miglioramenti nell'analisi teorica e nell'adattabilità ambientale, fornisce un contributo tecnico prezioso al campo della navigazione dei robot mobili.