Asynchronous Event-Inertial Odometry using a Unified Gaussian Process Regression Framework
Li, Wang, Liu et al.
Recent works have combined monocular event camera and inertial measurement unit to estimate the $SE(3)$ trajectory. However, the asynchronicity of event cameras brings a great challenge to conventional fusion algorithms. In this paper, we present an asynchronous event-inertial odometry under a unified Gaussian Process (GP) regression framework to naturally fuse asynchronous data associations and inertial measurements. A GP latent variable model is leveraged to build data-driven motion prior and acquire the analytical integration capacity. Then, asynchronous event-based feature associations and integral pseudo measurements are tightly coupled using the same GP framework. Subsequently, this fusion estimation problem is solved by underlying factor graph in a sliding-window manner. With consideration of sparsity, those historical states are marginalized orderly. A twin system is also designed for comparison, where the traditional inertial preintegration scheme is embedded in the GP-based framework to replace the GP latent variable model. Evaluations on public event-inertial datasets demonstrate the validity of both systems. Comparison experiments show competitive precision compared to the state-of-the-art synchronous scheme.
academic
Asynchrone ereignisgesteuerte Trägheits-Odometrie unter Verwendung eines einheitlichen Gaußschen Prozess-Regressions-Rahmens
Dieses Paper präsentiert eine asynchrone ereignisgesteuerte Trägheits-Odometrie-Methode basierend auf einem einheitlichen Gaußschen Prozess (GP) Regressions-Rahmen zur natürlichen Fusion asynchroner Datenzuordnung und Trägheitsmessungen. Die Methode nutzt GP-Latent-Variable-Modelle zur Konstruktion datengestützter Bewegungspriors und zur Erlangung analytischer Integrationsfähigkeiten. Anschließend werden asynchrone Merkmalszuordnungen und integrierte Pseudo-Messungen im gleichen GP-Rahmen eng gekoppelt. Das Fusionsschätzproblem wird durch ein Schiebefenster-Faktorgraph gelöst, wobei Sparsität durch geordnete Marginalisierung historischer Zustände berücksichtigt wird. Die Autoren entwerfen auch ein Vergleichssystem, das traditionelle Trägheits-Präintegrations-Schemata in den GP-Rahmen einbettet. Die Bewertung auf öffentlichen ereignisgesteuerten Trägheits-Datensätzen demonstriert die Wirksamkeit beider Systeme, wobei Vergleichsexperimente eine mit modernen synchronen Methoden vergleichbare Genauigkeit zeigen.
Ereigniskameras sind bionik-inspirierte Bildsensoren mit asynchronem Auslösemechanismus, die auf Pixel-Ebene unabhängig Änderungen der Lichtstärke erfassen. Dieser spezielle Mechanismus verleiht Ereigniskameras erhebliche Vorteile gegenüber herkömmlichen Kameras: niedriger Stromverbrauch, niedrige Latenz, hoher Dynamikbereich und hohe zeitliche Auflösung. Die Asynchronität von Ereigniskameras stellt jedoch traditionelle Fusionsalgorithmen vor enorme Herausforderungen.
Rahmen-basierte diskrete Zeitschemata: Akkumulieren Ereignisse in Ereignisrahmen mit festen Zeitfenstern, verlieren die zeitliche Vielfalt der Ereignisse, führen zu Bewegungsunschärfe und erfordern zusätzliche Entschärfungsoperationen
Traditionelle IMU-Präintegration: Anwendung im diskreten Zeitrahmen, viele Messungen zwischen Rahmen gehen verloren, feinkörnige Bewegungsinformationen werden verloren
Rechnerische Effizienz: Bestehende GP-Methoden verwenden typischerweise vollständige Glättungs-Backends mit hohen Rechenkosten
Um die hohe zeitliche Auflösung von Ereigniskameras vollständig zu nutzen, besteht ein dringender Bedarf an neuen Methoden zur Fusion asynchroner und hochauflösender ereignisgesteuerter Trägheitsmessungen. Dieses Paper konzentriert sich auf die Frage der asynchronen Messfusion und schlägt eine Lösung basierend auf einem einheitlichen GP-Rahmen vor.
Einheitlicher GP-Rahmen: Präsentation eines einheitlichen Gaußschen Prozess-Regressions-Rahmens, der natürlich asynchrone ereignisgesteuerte Merkmalszuordnungen und Trägheitsmessungsfusion verarbeitet
GP-Latent-Variable-Modell: Einführung eines Latent-Variable-Modells in den GP-Regressions-Rahmen zur analytischen Integration von Trägheitsmessungen und impliziten Induktion datengestützter GPs
Duales Systemdesign: Implementierung zweier Fusionsmethoden zum Vergleich:
CT-IMU: Sparsamer GP-Prior + IMU-Präintegration
GP-IMU: GP-Regressions-Präintegration
Effizientes Schiebefenster: Schiebefenster-Faktorgraph-Optimierung mit Marginalisierungsstrategie zur Aufrechterhaltung der Recheneffizienz
Vollständig asynchrone Verarbeitung: Verwendung von EKLT für ereignisgesteuerte Merkmalserkennung und -verfolgung unter Beibehaltung der hohen zeitlichen Auflösung der Ereigniskamera
wobei ϖbwb(t) die Geschwindigkeit im Körperkoordinatensystem ist und w(t) ein als Nullmittel-Weißrausch-GP modellierter verallgemeinerter Beschleunigungsvektor ist.
Modellierung relativer Beschleunigung und Rotationsvektorgeschwindigkeit als unabhängige GPs:
ṙbkb(t) ∼ GP(0,kr(t,t'))
abbk(t) ∼ GP(0,ka(t,t'))
Durch Latent-Zustände ρ̂ und α̂ werden verrauschte Beobachtungen des GP erhalten, dann werden die Inferenzfähigkeiten des GP zur Berechnung präintegrierter Geschwindigkeit, Position und Rotationsinkremente genutzt.
Verwendung einer dynamischen Marginalisierungsstrategie mit Priorisierung der Marginalisierung neuester Zustände und zugehöriger Landmarkenpunkte zur Aufrechterhaltung der Sparsität der Hessian-Matrix.
Genauigkeitsleistung: Beide Methoden zeigen in den meisten Sequenzen mit diskreten Optimierungsmethoden vergleichbare Genauigkeit, in einigen Sequenzen sogar bessere Leistung
Recheneffizienz: GP-IMU hat aufgrund weniger Variablen typischerweise niedrigere Rechenkosten
Robustheit: GP-IMU ist empfindlicher gegenüber IMU-Rauschen, da es auf IMU-gesteuerte GP-Konstruktion für visuelle Residuen angewiesen ist
Der EKLT-Tracker verbraucht etwa 80% der Gesamtzeit und ist der zeitaufwändigste Teil. GP-IMU ist bei der Graphoptimierung schneller, aber die IMU-Präintegration ist etwas langsamer.
Kontinuierliche Zeitdarstellungsmethoden mit GP wurden früh für Bewegungstrajektoren-Inferenz bei Scan-Lidar und nicht-synchronen Sensoren verwendet. Neuere Forschungen wenden GP auf monokulare ereignisgesteuerte visuellen Odometrie-Systeme an, weisen aber hohe Rechenkosten auf.
Echtzeitprobleme: Da alle asynchronen Frontend-Messungen zur Optimierung beibehalten werden, kann das System derzeit nicht in Echtzeit ausgeführt werden
Unzureichende Robustheit: Fehlende Ausreißer-Ausschlussmechanismen oder Bewegungskompensation
IMU-Qualitätsabhängigkeit: Die GP-IMU-Methode erfordert hohe IMU-Datenqualität
Einschränkungen bei aggressiven Bewegungen: Beide Methoden können bei starken Beschleunigungsänderungen beeinträchtigt werden
Das Paper zitiert 26 relevante Arbeiten, die wichtige Werke in Schlüsselbereichen wie Ereigniskamera-Überblick, IMU-Präintegration, kontinuierliche Zeitsschätzung und Gaußsche Prozess-Regression abdecken. Die Literaturzitate sind umfassend und autoritativ.
Gesamtbewertung: Dies ist eine innovative Arbeit im Bereich der ereignisgesteuerten Trägheits-Odometrie, die einen neuen Ansatz für die Verarbeitung asynchroner Sensorfusion durch den einheitlichen GP-Rahmen bietet. Obwohl es Einschränkungen wie Echtzeitprobleme gibt, sind die theoretischen Beiträge erheblich und die experimentelle Bewertung umfassend, was eine solide Grundlage für nachfolgende Forschung in diesem Bereich schafft.