Asynchronous Event-Inertial Odometry using a Unified Gaussian Process Regression Framework
Li, Wang, Liu et al.
Recent works have combined monocular event camera and inertial measurement unit to estimate the $SE(3)$ trajectory. However, the asynchronicity of event cameras brings a great challenge to conventional fusion algorithms. In this paper, we present an asynchronous event-inertial odometry under a unified Gaussian Process (GP) regression framework to naturally fuse asynchronous data associations and inertial measurements. A GP latent variable model is leveraged to build data-driven motion prior and acquire the analytical integration capacity. Then, asynchronous event-based feature associations and integral pseudo measurements are tightly coupled using the same GP framework. Subsequently, this fusion estimation problem is solved by underlying factor graph in a sliding-window manner. With consideration of sparsity, those historical states are marginalized orderly. A twin system is also designed for comparison, where the traditional inertial preintegration scheme is embedded in the GP-based framework to replace the GP latent variable model. Evaluations on public event-inertial datasets demonstrate the validity of both systems. Comparison experiments show competitive precision compared to the state-of-the-art synchronous scheme.
academic
Odomètrie Asynchrone Événement-Inertielle utilisant un Cadre Unifié de Régression par Processus Gaussien
Cet article propose une méthode d'odomètrie asynchrone événement-inertielle basée sur un cadre unifié de régression par processus gaussien (PG), permettant une fusion naturelle de l'association de données asynchrones et des mesures inertielles. La méthode utilise un modèle de variable latente PG pour construire un a priori de mouvement piloté par les données et obtenir des capacités d'intégration analytique, puis couple étroitement l'association de caractéristiques événementielles asynchrones et les pseudo-mesures intégrées dans le même cadre PG. Le problème d'estimation fusionnée est résolu via un graphe de facteurs à fenêtre glissante, avec marginalisation ordonnée des états historiques en tenant compte de la parcimonie. Les auteurs conçoivent également un système de comparaison intégrant le schéma traditionnel de préintégration inertielle dans le cadre PG. L'évaluation sur des ensembles de données événement-inertiel publics démontre l'efficacité des deux systèmes, les expériences comparatives montrant une précision comparable aux approches synchrones de pointe.
Les caméras événementielles, en tant que capteurs visuels inspirés biologiquement, possèdent un mécanisme de déclenchement asynchrone, enregistrant indépendamment les changements d'intensité lumineuse au niveau de chaque pixel. Ce mécanisme particulier confère aux caméras événementielles des avantages significatifs par rapport aux caméras traditionnelles : faible consommation d'énergie, faible latence, plage dynamique élevée et résolution temporelle élevée. Cependant, l'asynchronicité des caméras événementielles pose des défis considérables aux algorithmes de fusion traditionnels.
Schémas discrets en temps discrétisé : accumulent les événements dans des fenêtres temporelles fixes, perdant la diversité temporelle des événements, entraînant un flou de mouvement et nécessitant des opérations de défloutage supplémentaires
Préintégration IMU traditionnelle : appliquée dans un cadre temporel discret, de nombreuses mesures temporelles inter-images sont perdues, entraînant une perte d'informations de mouvement à grain fin
Efficacité computationnelle : les méthodes PG existantes utilisent généralement un lisseur complet coûteux en calcul
Pour exploiter pleinement les caractéristiques de résolution temporelle élevée des caméras événementielles, il est impératif d'introduire de nouvelles méthodes pour fusionner les observations événement-inertielle asynchrones et à haute résolution temporelle. Cet article se concentre sur la question de la fusion de mesures asynchrones, proposant une solution basée sur un cadre PG unifié.
Cadre PG Unifié : propose un cadre unifié de régression par processus gaussien capable de traiter naturellement la fusion de l'association de caractéristiques événementielles asynchrones et des mesures inertielles
Modèle de Variable Latente PG : introduit un modèle de variable latente dans le cadre de régression PG pour intégrer analytiquement les mesures inertielles et induire implicitement un PG piloté par les données
Conception Duale : implémente deux approches de fusion comparatives :
CT-IMU : a priori PG clairsemé + préintégration IMU
GP-IMU : préintégration par régression PG
Fenêtre Glissante Efficace : adopte l'optimisation par graphe de facteurs à fenêtre glissante, maintenant l'efficacité computationnelle via des stratégies de marginalisation
Traitement Entièrement Asynchrone : utilise EKLT pour la détection et le suivi de caractéristiques pilotés par événements, préservant la résolution temporelle élevée de la caméra événementielle
où ϖbwb(t) est la vitesse en coordonnées du corps, et w(t) est le vecteur d'accélération généralisée modélisé comme un PG de bruit blanc de moyenne nulle.
Modélise l'accélération relative et la vitesse du vecteur de rotation comme des PG indépendants :
ṙbkb(t) ∼ PG(0,kr(t,t'))
abbk(t) ∼ PG(0,ka(t,t'))
Obtient les observations bruitées du PG via les états latents ρ̂ et α̂, puis utilise les capacités d'inférence du PG pour calculer la vitesse préintégrée, la position et les incréments de rotation.
Adopte une stratégie de marginalisation dynamique, marginalisant en priorité les états les plus récents et les points de repère associés, maintenant la structure creuse de la matrice Hessienne.
Performance de Précision : les deux méthodes démontrent une précision comparable aux méthodes d'optimisation discrètes sur la plupart des séquences, surpassant certaines séquences
Efficacité Computationnelle : GP-IMU possède généralement un coût computationnel inférieur en raison de moins de variables
Robustesse : GP-IMU est plus sensible au bruit IMU, car il dépend du PG piloté par IMU pour construire les résidus visuels
Le suivi EKLT consomme environ 80% du temps total, constituant la partie la plus coûteuse. GP-IMU est plus rapide en optimisation graphique, mais la préintégration IMU est légèrement plus lente.
Schémas discrets en temps discrétisé : héritent des algorithmes de caméra à images traditionnels, effectuant l'association de données sur l'accumulation d'événements
Méthodes événement-pilotées en temps continu : traitent directement le flux d'événements, adoptant un backend en temps continu
Les représentations en temps continu par PG ont été utilisées précocement pour l'inférence de trajectoire de mouvement avec LIDAR de balayage et capteurs non synchronisés. Les recherches récentes appliquent le PG aux systèmes d'odomètrie visuelle événementielle monoculaire, mais rencontrent des problèmes de coût computationnel élevé.
Problème de Temps Réel : en raison de la conservation de toutes les mesures asynchrones du frontend pour l'optimisation, le système ne peut actuellement pas fonctionner en temps réel
Robustesse Insuffisante : manque de mécanismes d'exclusion des valeurs aberrantes ou de compensation de mouvement
Dépendance à la Qualité IMU : la méthode GP-IMU exige une qualité de données IMU élevée
Limitation de Mouvement Agressif : les deux méthodes peuvent être affectées lors de changements d'accélération abruptes
Cet article cite 27 travaux connexes, couvrant des domaines clés incluant les synthèses sur les caméras événementielles, la préintégration IMU, l'estimation en temps continu, la régression par processus gaussien, etc. Les citations sont complètes et faisant autorité.
Évaluation Globale : Il s'agit d'un travail innovant dans le domaine de l'odomètrie événement-inertielle, proposant un cadre PG unifié offrant une nouvelle perspective pour traiter la fusion de capteurs asynchrones. Bien que présentant des limitations telles que les problèmes de temps réel, les contributions théoriques sont significatives, l'évaluation expérimentale est complète, et le travail établit une base solide pour les recherches futures dans ce domaine.