CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic
CKANIO : Polynômes de Chebyshev Apprenables pour l'Odométrie Inertielle
L'odométrie inertielle (OI) reposant uniquement sur les signaux des unités de mesure inertielle (IMU) offre une voie prometteuse pour la localisation grand public. Cependant, la modélisation précise des motifs de mouvement non linéaires présents dans les signaux IMU demeure la principale limitation de la précision de l'OI. Pour relever ce défi, les auteurs proposent CKANIO, un cadre d'OI intégrant des réseaux de Kolmogorov-Arnold basés sur Chebyshev (Chebyshev KAN). Spécifiquement, une architecture résiduelle novatrice a été conçue, exploitant la capacité d'approximation non linéaire des polynômes de Chebyshev au sein du cadre KAN pour modéliser plus efficacement les caractéristiques de mouvement complexes inhérentes aux signaux IMU. À la connaissance des auteurs, il s'agit du premier travail appliquant des modèles KAN interprétables à l'OI. Les résultats expérimentaux sur cinq ensembles de données publiques démontrent l'efficacité de CKANIO.
L'odométrie inertielle (OI) est une technique d'estimation de position et d'orientation utilisant uniquement des capteurs IMU, possédant une valeur applicative importante dans les domaines de la conduite autonome et de la navigation robotique. Lorsque les signaux GPS ne sont pas disponibles ou que les capteurs externes sont limités, l'OI peut servir de solution de localisation complémentaire ou alternative.
Problème d'accumulation d'erreurs : Les méthodes d'OI traditionnelles basées sur la mécanique newtonienne accumulent des erreurs au fil du temps en raison du bruit de mesure inhérent à l'IMU, affectant gravement la précision de localisation sur longue distance
Difficulté de modélisation du mouvement non linéaire : Les motifs de mouvement non linéaires complexes dans les signaux IMU (tels que les rotations) sont difficiles à modéliser avec précision
Limitations des fonctions d'activation fixes : Les méthodes existantes pilotées par les données dépendent de fonctions d'activation fixes, incapables de capturer pleinement les caractéristiques dynamiques complexes des signaux IMU
Inspirés par les performances exceptionnelles des réseaux de Kolmogorov-Arnold (KAN) en approximation de fonctions non linéaires, les auteurs proposent d'utiliser des KAN basés sur les polynômes de Chebyshev pour remplacer les fonctions d'activation fixes traditionnelles, afin de mieux modéliser les caractéristiques non linéaires complexes des signaux IMU.
Introduction pour la première fois de Chebyshev KAN dans le domaine de l'OI : Conception d'une architecture de réseau résiduel exploitant la capacité d'approximation non linéaire des polynômes de Chebyshev pour améliorer la capacité de représentation des dynamiques non linéaires
Développement d'un module d'auto-attention efficace basé sur noyaux (EKSA) : Amélioration de la modélisation du mouvement contextuel, réalisant une utilisation plus complète des signaux IMU, tout en réduisant la complexité computationnelle de O(L²) à O(L)
Fourniture de la première analyse quantitative de l'impact de la gravité sur la précision de l'OI : Analyse quantitative dans le système de coordonnées global de l'impact spécifique de la gravité sur les performances de l'OI
Étant donné un signal IMU X ∈ R^(C×L) dans une fenêtre temporelle (où C=6 représente l'accélération triaxiale et la vitesse angulaire triaxiale, L étant le nombre d'échantillons), prédire le vecteur de vitesse v̂, minimisant l'erreur quadratique moyenne avec la vitesse réelle v.
La fonction tanh restreint l'entrée à la plage (-1,1), puis arccos est utilisé pour obtenir une représentation de phase numériquement stable.
Définition des polynômes de Chebyshev :
T_n(x) = cos(n·arccos(x)) (x ∈ [-1,1])
Fonction d'activation apprenable :
Y = Σ(i=0 to n) W_i × T_i(tanh(X))
où W_i est un tenseur de paramètres apprenant, n=4 étant l'ordre du polynôme. Cette conception permet à la fonction d'activation de s'adapter dynamiquement aux caractéristiques des signaux IMU.
Concept fondamental : Utilisation de fonctions noyaux pour approximer la matrice d'attention, évitant le calcul explicite de la matrice d'attention complète.
Similarité par Coefficient de Corrélation de Pearson :
ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²
où q̄ = q - μ(q), k̄ = k - μ(k), cette mesure étant robuste aux décalages et bruits de gain courants dans les signaux IMU.
Fonction noyau exponentielle :
K_F(q,k) = exp(ρ(q,k)²)
Approximation par Développement de Taylor :
K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ
Calcul EKSA :
EKSA(Q,K,V) = f_Q(f_K^T V)
réduisant la complexité de O(C_R L_R²) à O(L_R C_R²).
Modélisation non linéaire adaptative : La combinaison apprenable de polynômes de Chebyshev peut s'adapter dynamiquement à différentes caractéristiques des signaux IMU
Optimisation de l'efficacité computationnelle : Le module EKSA réalise une modélisation des dépendances globales avec complexité temporelle linéaire
Robustesse au bruit : L'invariance du coefficient de corrélation de Pearson aux décalages et bruits de gain améliore la robustesse du système
La comparaison des performances inter-ensembles de données sur cinq ensembles montre que CKANIO surpasse régulièrement les méthodes de comparaison sur la plupart des ensembles de données :
Performance sur l'ensemble de données RoNIN :
ATE : 5.365m → 3.814m (par rapport à RoNIN ResNet)
RTE : 3.390m → 3.272m
Performance globale : CKANIO obtient les valeurs ATE et RTE meilleures ou quasi-optimales sur tous les ensembles de données de test.
Les expériences révèlent que la suppression de l'accélération gravitationnelle dans le système de coordonnées global réduit significativement les erreurs pour presque tous les algorithmes :
La gravité agit comme un biais constant dans le système de coordonnées aligné globalement
La suppression de la composante gravitationnelle permet aux mesures de l'accéléromètre de mieux refléter le mouvement de translation du porteur
Améliore l'efficacité d'apprentissage et la stabilité numérique
Dans les scénarios simples, RoNIN ResNet s'écarte progressivement en raison de l'accumulation d'erreurs de cap, tandis que CKANIO démontre une robustesse au bruit supérieure
Dans les scénarios complexes, RoNIN ResNet présente une dérive significative après des manœuvres non linéaires telles que les rotations, tandis que CKANIO capture mieux ces caractéristiques dynamiques
Reposent principalement sur la mécanique newtonienne pour l'estimation de position et d'orientation, mais souffrent de l'accumulation d'erreurs due au bruit IMU.
Apprennent les motifs de mouvement à partir de données IMU à grande échelle, surpassant les méthodes traditionnelles en précision et applicabilité, mais présentant toujours des limitations dans la modélisation des mouvements non linéaires complexes.
Les réseaux de Kolmogorov-Arnold remplacent les fonctions d'activation fixes traditionnelles par des fonctions d'activation apprenables, démontrant des capacités d'approximation non linéaire exceptionnelles dans divers domaines.
CKANIO intègre avec succès Chebyshev KAN dans le domaine de l'OI, améliorant significativement la capacité de modélisation des mouvements non linéaires
Le module EKSA équilibre efficacement performance et efficacité computationnelle
La suppression de la gravité a un impact positif significatif sur les performances de l'OI
L'article cite 26 travaux connexes, couvrant plusieurs domaines incluant la navigation inertielle, l'apprentissage profond et les réseaux KAN, fournissant une base théorique substantielle et des repères de comparaison pour cette recherche.