2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO : Polynômes de Chebyshev Apprenables pour l'Odométrie Inertielle

Informations Fondamentales

  • ID de l'article : 2507.16865
  • Titre : CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
  • Auteurs : Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • Classification : cs.RO (Robotique)
  • Date de publication : 16 octobre 2025 (arXiv v2)
  • Lien de l'article : https://arxiv.org/abs/2507.16865

Résumé

L'odométrie inertielle (OI) reposant uniquement sur les signaux des unités de mesure inertielle (IMU) offre une voie prometteuse pour la localisation grand public. Cependant, la modélisation précise des motifs de mouvement non linéaires présents dans les signaux IMU demeure la principale limitation de la précision de l'OI. Pour relever ce défi, les auteurs proposent CKANIO, un cadre d'OI intégrant des réseaux de Kolmogorov-Arnold basés sur Chebyshev (Chebyshev KAN). Spécifiquement, une architecture résiduelle novatrice a été conçue, exploitant la capacité d'approximation non linéaire des polynômes de Chebyshev au sein du cadre KAN pour modéliser plus efficacement les caractéristiques de mouvement complexes inhérentes aux signaux IMU. À la connaissance des auteurs, il s'agit du premier travail appliquant des modèles KAN interprétables à l'OI. Les résultats expérimentaux sur cinq ensembles de données publiques démontrent l'efficacité de CKANIO.

Contexte et Motivation de la Recherche

Définition du Problème

L'odométrie inertielle (OI) est une technique d'estimation de position et d'orientation utilisant uniquement des capteurs IMU, possédant une valeur applicative importante dans les domaines de la conduite autonome et de la navigation robotique. Lorsque les signaux GPS ne sont pas disponibles ou que les capteurs externes sont limités, l'OI peut servir de solution de localisation complémentaire ou alternative.

Problèmes Fondamentaux

  1. Problème d'accumulation d'erreurs : Les méthodes d'OI traditionnelles basées sur la mécanique newtonienne accumulent des erreurs au fil du temps en raison du bruit de mesure inhérent à l'IMU, affectant gravement la précision de localisation sur longue distance
  2. Difficulté de modélisation du mouvement non linéaire : Les motifs de mouvement non linéaires complexes dans les signaux IMU (tels que les rotations) sont difficiles à modéliser avec précision
  3. Limitations des fonctions d'activation fixes : Les méthodes existantes pilotées par les données dépendent de fonctions d'activation fixes, incapables de capturer pleinement les caractéristiques dynamiques complexes des signaux IMU

Motivation de la Recherche

Inspirés par les performances exceptionnelles des réseaux de Kolmogorov-Arnold (KAN) en approximation de fonctions non linéaires, les auteurs proposent d'utiliser des KAN basés sur les polynômes de Chebyshev pour remplacer les fonctions d'activation fixes traditionnelles, afin de mieux modéliser les caractéristiques non linéaires complexes des signaux IMU.

Contributions Fondamentales

  1. Introduction pour la première fois de Chebyshev KAN dans le domaine de l'OI : Conception d'une architecture de réseau résiduel exploitant la capacité d'approximation non linéaire des polynômes de Chebyshev pour améliorer la capacité de représentation des dynamiques non linéaires
  2. Développement d'un module d'auto-attention efficace basé sur noyaux (EKSA) : Amélioration de la modélisation du mouvement contextuel, réalisant une utilisation plus complète des signaux IMU, tout en réduisant la complexité computationnelle de O(L²) à O(L)
  3. Fourniture de la première analyse quantitative de l'impact de la gravité sur la précision de l'OI : Analyse quantitative dans le système de coordonnées global de l'impact spécifique de la gravité sur les performances de l'OI

Détails de la Méthode

Définition de la Tâche

Étant donné un signal IMU X ∈ R^(C×L) dans une fenêtre temporelle (où C=6 représente l'accélération triaxiale et la vitesse angulaire triaxiale, L étant le nombre d'échantillons), prédire le vecteur de vitesse v̂, minimisant l'erreur quadratique moyenne avec la vitesse réelle v.

Architecture du Modèle

1. KAN Chebyshev Résiduel (ResCKAN)

Prétraitement des entrées :

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

La fonction tanh restreint l'entrée à la plage (-1,1), puis arccos est utilisé pour obtenir une représentation de phase numériquement stable.

Définition des polynômes de Chebyshev :

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

Fonction d'activation apprenable :

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

où W_i est un tenseur de paramètres apprenant, n=4 étant l'ordre du polynôme. Cette conception permet à la fonction d'activation de s'adapter dynamiquement aux caractéristiques des signaux IMU.

2. Auto-attention Efficace Basée sur Noyaux (EKSA)

Concept fondamental : Utilisation de fonctions noyaux pour approximer la matrice d'attention, évitant le calcul explicite de la matrice d'attention complète.

Similarité par Coefficient de Corrélation de Pearson :

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

où q̄ = q - μ(q), k̄ = k - μ(k), cette mesure étant robuste aux décalages et bruits de gain courants dans les signaux IMU.

Fonction noyau exponentielle :

K_F(q,k) = exp(ρ(q,k)²)

Approximation par Développement de Taylor :

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

Calcul EKSA :

EKSA(Q,K,V) = f_Q(f_K^T V)

réduisant la complexité de O(C_R L_R²) à O(L_R C_R²).

Points d'Innovation Technique

  1. Modélisation non linéaire adaptative : La combinaison apprenable de polynômes de Chebyshev peut s'adapter dynamiquement à différentes caractéristiques des signaux IMU
  2. Optimisation de l'efficacité computationnelle : Le module EKSA réalise une modélisation des dépendances globales avec complexité temporelle linéaire
  3. Robustesse au bruit : L'invariance du coefficient de corrélation de Pearson aux décalages et bruits de gain améliore la robustesse du système

Configuration Expérimentale

Ensembles de Données

Utilisation de cinq ensembles de données inertiques publics :

  • IMUNet, RoNIN, RIDI, RNIN, TLIO
  • Les ensembles de données sont divisés aléatoirement dans un rapport 8:1:1 en ensembles d'entraînement, validation et test
  • Un ensemble de données TLIO (w/o gravity) a été spécialement construit pour l'analyse de l'impact de la gravité

Métriques d'Évaluation

  1. Position Drift Error (PDE) : Erreur de dérive au point final
  2. Relative Trajectory Error (RTE) : Précision de la trajectoire locale
  3. Absolute Trajectory Error (ATE) : Précision de localisation globale

Méthodes de Comparaison

  • RoNIN (variantes ResNet, TCN, LSTM)
  • IMUNet
  • Réseau TLIO
  • Réseau RNIN

Détails d'Implémentation

  • GPU : NVIDIA RTX A40 (48 GB)
  • Taux d'apprentissage : 10⁻⁴
  • Taille de lot : 512
  • Nombre d'épochs : 100
  • Version CUDA : 11.3
  • Version PyTorch : 1.11

Résultats Expérimentaux

Résultats Principaux

La comparaison des performances inter-ensembles de données sur cinq ensembles montre que CKANIO surpasse régulièrement les méthodes de comparaison sur la plupart des ensembles de données :

Performance sur l'ensemble de données RoNIN :

  • ATE : 5.365m → 3.814m (par rapport à RoNIN ResNet)
  • RTE : 3.390m → 3.272m

Performance globale : CKANIO obtient les valeurs ATE et RTE meilleures ou quasi-optimales sur tous les ensembles de données de test.

Analyse de l'Impact de la Gravité

Les expériences révèlent que la suppression de l'accélération gravitationnelle dans le système de coordonnées global réduit significativement les erreurs pour presque tous les algorithmes :

  • La gravité agit comme un biais constant dans le système de coordonnées aligné globalement
  • La suppression de la composante gravitationnelle permet aux mesures de l'accéléromètre de mieux refléter le mouvement de translation du porteur
  • Améliore l'efficacité d'apprentissage et la stabilité numérique

Études d'Ablation

  • CKANIO (w/o EKSA) : L'utilisation de ResCKAN seul surpasse déjà RoNIN ResNet
  • CKANIO complet : L'ajout d'EKSA réduit davantage l'ATE et le RTE, améliorant la précision de prédiction de vitesse

Analyse de Visualisation

La comparaison des trajectoires montre :

  1. Dans les scénarios simples, RoNIN ResNet s'écarte progressivement en raison de l'accumulation d'erreurs de cap, tandis que CKANIO démontre une robustesse au bruit supérieure
  2. Dans les scénarios complexes, RoNIN ResNet présente une dérive significative après des manœuvres non linéaires telles que les rotations, tandis que CKANIO capture mieux ces caractéristiques dynamiques

Travaux Connexes

Méthodes Traditionnelles d'OI

Reposent principalement sur la mécanique newtonienne pour l'estimation de position et d'orientation, mais souffrent de l'accumulation d'erreurs due au bruit IMU.

Méthodes d'OI Pilotées par les Données

Apprennent les motifs de mouvement à partir de données IMU à grande échelle, surpassant les méthodes traditionnelles en précision et applicabilité, mais présentant toujours des limitations dans la modélisation des mouvements non linéaires complexes.

Réseaux KAN

Les réseaux de Kolmogorov-Arnold remplacent les fonctions d'activation fixes traditionnelles par des fonctions d'activation apprenables, démontrant des capacités d'approximation non linéaire exceptionnelles dans divers domaines.

Conclusion et Discussion

Conclusions Principales

  1. CKANIO intègre avec succès Chebyshev KAN dans le domaine de l'OI, améliorant significativement la capacité de modélisation des mouvements non linéaires
  2. Le module EKSA équilibre efficacement performance et efficacité computationnelle
  3. La suppression de la gravité a un impact positif significatif sur les performances de l'OI

Limitations

  1. Validation uniquement sur les signaux IMU de piétons, manque d'évaluation pour d'autres types de porteurs
  2. La complexité computationnelle, bien qu'améliorée, reste plus élevée que les méthodes traditionnelles
  3. La capacité de traitement des motifs de mouvement extrêmes nécessite une vérification supplémentaire

Directions Futures

Les auteurs proposent que l'extension de l'évaluation aux signaux IMU non-piétons soit une direction de recherche prometteuse.

Évaluation Approfondie

Avantages

  1. Forte innovativité technique : Introduction pionnière de KAN dans le domaine de l'OI, d'une importance fondatrice
  2. Fondations théoriques solides : La théorie d'approximation non linéaire des polynômes de Chebyshev fournit une base solide à la méthode
  3. Conception expérimentale complète : Expériences comparatives sur cinq ensembles de données et études d'ablation détaillées
  4. Valeur pratique élevée : Amélioration significative de la précision tout en maintenant l'efficacité computationnelle

Insuffisances

  1. Portée d'application limitée : Validation uniquement en scénarios piétons, généralisation pour applications industrielles à vérifier
  2. Analyse théorique insuffisante : Manque d'explication théorique sur pourquoi les polynômes de Chebyshev sont particulièrement adaptés aux signaux IMU
  3. Analyse insuffisante des frais computationnels : Bien que la complexité soit réduite, manque de comparaison des temps d'exécution réels

Impact

  1. Impact académique : Introduction d'un nouveau paradigme d'architecture réseau dans le domaine de l'OI
  2. Valeur pratique : Nouvelle voie technologique pour les dispositifs de localisation grand public
  3. Reproductibilité : Configuration expérimentale détaillée facilitant les recherches ultérieures

Scénarios d'Application

  1. Localisation intérieure pour dispositifs mobiles grand public
  2. Systèmes de navigation en environnements refusant le GPS
  3. Systèmes de navigation inertielle haute précision pour robots

Références Bibliographiques

L'article cite 26 travaux connexes, couvrant plusieurs domaines incluant la navigation inertielle, l'apprentissage profond et les réseaux KAN, fournissant une base théorique substantielle et des repères de comparaison pour cette recherche.