CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic
CKANIO: Lernbare Chebyshev-Polynome für Trägheitsodometrie
Die Trägheitsodometrie (IO) ermöglicht die Positionierung ausschließlich durch Signale von Trägheitsmesseinheiten (IMU) und bietet einen vielversprechenden Weg für die Positionierung auf Verbraucherebene. Die genaue Modellierung nichtlinearer Bewegungsmuster in IMU-Signalen bleibt jedoch eine Hauptbeschränkung der IO-Genauigkeit. Um diese Herausforderung zu bewältigen, präsentieren die Autoren CKANIO, ein IO-Framework, das auf Chebyshev-basierten Kolmogorov-Arnold-Netzwerken (Chebyshev KAN) integriert ist. Insbesondere wurde eine neuartige Residualarchitektur entwickelt, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen im KAN-Framework nutzt, um komplexe Bewegungsmerkmale in IMU-Signalen effektiver zu modellieren. Nach Kenntnis der Autoren ist dies die erste Arbeit, die interpretierbare KAN-Modelle auf IO anwendet. Experimentelle Ergebnisse auf fünf öffentlichen Datensätzen demonstrieren die Wirksamkeit von CKANIO.
Die Trägheitsodometrie (IO) ist eine Technik zur Positions- und Orientierungsschätzung ausschließlich mit IMU-Sensoren und hat wichtige Anwendungen in autonomem Fahren, Roboternavigation und anderen Bereichen. Wenn GPS-Signale nicht verfügbar sind oder externe Sensoren begrenzt sind, kann IO als ergänzende oder alternative Positionierungslösung dienen.
Fehlerakkumulationsproblem: Traditionelle auf Newtonscher Mechanik basierende IO-Methoden führen zu zeitabhängiger Fehlerakkumulation aufgrund von IMU-Messunsicherheiten, was die Positionierungsgenauigkeit über lange Distanzen erheblich beeinträchtigt
Schwierigkeiten bei der nichtlinearen Bewegungsmodellierung: Komplexe nichtlineare Bewegungsmuster in IMU-Signalen (wie Rotationen) sind schwer genau zu modellieren
Einschränkungen fester Aktivierungsfunktionen: Bestehende datengesteuerte Methoden verlassen sich auf feste Aktivierungsfunktionen und können die komplexen Dynamiken von IMU-Signalen nicht vollständig erfassen
Inspiriert durch die hervorragende Leistung von Kolmogorov-Arnold-Netzwerken (KAN) bei der nichtlinearen Funktionsapproximation schlagen die Autoren vor, auf Chebyshev-Polynomen basierende KAN zu verwenden, um traditionelle feste Aktivierungsfunktionen zu ersetzen und komplexe nichtlineare Merkmale in IMU-Signalen besser zu modellieren.
Erstmalige Einführung von Chebyshev KAN im IO-Bereich: Entwicklung einer Residualnetzwerk-Architektur, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen nutzt, um die Darstellungsfähigkeit des Modells für nichtlineare Dynamiken zu verbessern
Entwicklung eines effizienten kernelbasierten Selbstaufmerksamkeitsmoduls (EKSA): Verbesserung der kontextabhängigen Bewegungsmodellierung für umfassendere Nutzung von IMU-Signalen, während die Rechenkomplexität von O(L²) auf O(L) reduziert wird
Bereitstellung der ersten quantitativen Analyse der Auswirkungen der Schwerkraft auf die IO-Genauigkeit: Quantitative Analyse der spezifischen Auswirkungen der Schwerkraft auf die IO-Leistung im globalen Koordinatensystem
Gegeben sind IMU-Signale X ∈ R^(C×L) innerhalb eines Zeitfensters (wobei C=6 für dreiachsige Beschleunigung und dreiachsige Winkelgeschwindigkeit steht, L ist die Anzahl der Abtastpunkte), wird der Geschwindigkeitsvektor v̂ vorhergesagt, um den mittleren quadratischen Fehler mit der tatsächlichen Geschwindigkeit v zu minimieren.
Die Eingabe wird durch die tanh-Funktion auf den Bereich (-1,1) begrenzt und dann wird arccos verwendet, um eine numerisch stabile Phasendarstellung zu erhalten.
Definition von Chebyshev-Polynomen:
T_n(x) = cos(n·arccos(x)) (x ∈ [-1,1])
Lernbare Aktivierungsfunktion:
Y = Σ(i=0 to n) W_i × T_i(tanh(X))
wobei W_i lernbare Parametertensoren sind und n=4 die Polynomordnung ist. Dieses Design ermöglicht es der Aktivierungsfunktion, sich dynamisch an IMU-Signalmerkmale anzupassen.
Kernidee: Verwendung von Kernelfunktionen zur Approximation der Aufmerksamkeitsmatrix, um die explizite Berechnung der vollständigen Aufmerksamkeitsmatrix zu vermeiden.
Pearson-Korrelationskoeffizient-Ähnlichkeit:
ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²
wobei q̄ = q - μ(q), k̄ = k - μ(k), dieses Maß ist robust gegenüber Offset- und Verstärkungsrauschen, das häufig in IMU-Signalen vorkommt.
Exponentialkernfunktion:
K_F(q,k) = exp(ρ(q,k)²)
Taylor-Reihen-Approximation:
K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ
EKSA-Berechnung:
EKSA(Q,K,V) = f_Q(f_K^T V)
reduziert die Komplexität von O(C_R L_R²) auf O(L_R C_R²).
Adaptive nichtlineare Modellierung: Die lernbare Kombination von Chebyshev-Polynomen kann sich dynamisch an unterschiedliche IMU-Signalmerkmale anpassen
Optimierung der Recheneffizienz: Das EKSA-Modul ermöglicht die Modellierung globaler Abhängigkeiten mit linearer Zeitkomplexität
Rauschrobustheit: Die Invarianz des Pearson-Korrelationskoeffizienten gegenüber Offset- und Verstärkungsrauschen erhöht die Systemrobustheit
Der Vergleich der datensatzübergreifenden Leistung auf fünf Datensätzen zeigt, dass CKANIO auf den meisten Datensätzen konsistent die Vergleichsmethoden übertrifft:
Leistung auf dem RoNIN-Datensatz:
ATE: 5.365m → 3.814m (im Vergleich zu RoNIN ResNet)
RTE: 3.390m → 3.272m
Gesamtleistung: CKANIO erreicht auf allen Test-Datensätzen die besten oder nahezu besten ATE- und RTE-Werte.
Experimente zeigen, dass das Entfernen der Gravitationsbeschleunigung im globalen Koordinatensystem die Fehler fast aller Algorithmen erheblich reduziert:
Die Schwerkraft wirkt als konstante Vorspannung im global ausgerichteten Koordinatensystem
Das Entfernen der Schwerkraftkomponente ermöglicht es, dass Beschleunigungsmessungen die Translationsbewegung des Trägers besser widerspiegeln
Dies verbessert die Lerneffektivität und numerische Stabilität
In einfachen Szenarien weicht RoNIN ResNet aufgrund kumulativer Orientierungsfehler allmählich ab, während CKANIO eine stärkere Rauschrobustheit aufweist
In komplexen Szenarien zeigt RoNIN ResNet nach nichtlinearen Manövern wie Rotationen deutliche Abweichungen, während CKANIO diese Dynamiken besser erfassen kann
Basieren hauptsächlich auf Newtonscher Mechanik für Positions- und Orientierungsschätzung, leiden aber unter Fehlerakkumulation aufgrund von IMU-Rauschen.
Lernen Bewegungsmuster aus großen IMU-Datensätzen und übertreffen traditionelle Methoden in Genauigkeit und Anwendbarkeit, haben aber immer noch Einschränkungen bei der Modellierung komplexer nichtlinearer Bewegungen.
Kolmogorov-Arnold-Netzwerke ersetzen traditionelle feste Aktivierungsfunktionen durch lernbare Aktivierungsfunktionen und zeigen hervorragende nichtlineare Approximationsfähigkeiten in verschiedenen Bereichen.
Das Papier zitiert 26 verwandte Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie Trägheitsnavigation, tiefes Lernen und KAN-Netzwerke abdecken und eine umfassende theoretische Grundlage und Vergleichsbenchmarks für diese Forschung bieten.