2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.

Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.

academic

CKANIO: Lernbare Chebyshev-Polynome für Trägheitsodometrie

Grundlegende Informationen

Papier-ID: 2507.16865
Titel: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Autoren: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
Klassifizierung: cs.RO (Robotik)
Veröffentlichungsdatum: 16. Oktober 2025 (arXiv v2)
Papierlink: https://arxiv.org/abs/2507.16865

Zusammenfassung

Die Trägheitsodometrie (IO) ermöglicht die Positionierung ausschließlich durch Signale von Trägheitsmesseinheiten (IMU) und bietet einen vielversprechenden Weg für die Positionierung auf Verbraucherebene. Die genaue Modellierung nichtlinearer Bewegungsmuster in IMU-Signalen bleibt jedoch eine Hauptbeschränkung der IO-Genauigkeit. Um diese Herausforderung zu bewältigen, präsentieren die Autoren CKANIO, ein IO-Framework, das auf Chebyshev-basierten Kolmogorov-Arnold-Netzwerken (Chebyshev KAN) integriert ist. Insbesondere wurde eine neuartige Residualarchitektur entwickelt, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen im KAN-Framework nutzt, um komplexe Bewegungsmerkmale in IMU-Signalen effektiver zu modellieren. Nach Kenntnis der Autoren ist dies die erste Arbeit, die interpretierbare KAN-Modelle auf IO anwendet. Experimentelle Ergebnisse auf fünf öffentlichen Datensätzen demonstrieren die Wirksamkeit von CKANIO.

Forschungshintergrund und Motivation

Problemdefinition

Die Trägheitsodometrie (IO) ist eine Technik zur Positions- und Orientierungsschätzung ausschließlich mit IMU-Sensoren und hat wichtige Anwendungen in autonomem Fahren, Roboternavigation und anderen Bereichen. Wenn GPS-Signale nicht verfügbar sind oder externe Sensoren begrenzt sind, kann IO als ergänzende oder alternative Positionierungslösung dienen.

Kernprobleme

Fehlerakkumulationsproblem: Traditionelle auf Newtonscher Mechanik basierende IO-Methoden führen zu zeitabhängiger Fehlerakkumulation aufgrund von IMU-Messunsicherheiten, was die Positionierungsgenauigkeit über lange Distanzen erheblich beeinträchtigt
Schwierigkeiten bei der nichtlinearen Bewegungsmodellierung: Komplexe nichtlineare Bewegungsmuster in IMU-Signalen (wie Rotationen) sind schwer genau zu modellieren
Einschränkungen fester Aktivierungsfunktionen: Bestehende datengesteuerte Methoden verlassen sich auf feste Aktivierungsfunktionen und können die komplexen Dynamiken von IMU-Signalen nicht vollständig erfassen

Forschungsmotivation

Inspiriert durch die hervorragende Leistung von Kolmogorov-Arnold-Netzwerken (KAN) bei der nichtlinearen Funktionsapproximation schlagen die Autoren vor, auf Chebyshev-Polynomen basierende KAN zu verwenden, um traditionelle feste Aktivierungsfunktionen zu ersetzen und komplexe nichtlineare Merkmale in IMU-Signalen besser zu modellieren.

Kernbeiträge

Erstmalige Einführung von Chebyshev KAN im IO-Bereich: Entwicklung einer Residualnetzwerk-Architektur, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen nutzt, um die Darstellungsfähigkeit des Modells für nichtlineare Dynamiken zu verbessern
Entwicklung eines effizienten kernelbasierten Selbstaufmerksamkeitsmoduls (EKSA): Verbesserung der kontextabhängigen Bewegungsmodellierung für umfassendere Nutzung von IMU-Signalen, während die Rechenkomplexität von O(L²) auf O(L) reduziert wird
Bereitstellung der ersten quantitativen Analyse der Auswirkungen der Schwerkraft auf die IO-Genauigkeit: Quantitative Analyse der spezifischen Auswirkungen der Schwerkraft auf die IO-Leistung im globalen Koordinatensystem

Methodische Details

Aufgabendefinition

Gegeben sind IMU-Signale X ∈ R^(C×L) innerhalb eines Zeitfensters (wobei C=6 für dreiachsige Beschleunigung und dreiachsige Winkelgeschwindigkeit steht, L ist die Anzahl der Abtastpunkte), wird der Geschwindigkeitsvektor v̂ vorhergesagt, um den mittleren quadratischen Fehler mit der tatsächlichen Geschwindigkeit v zu minimieren.

Modellarchitektur

1. Residuales Chebyshev KAN (ResCKAN)

Eingabevorverarbeitung:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

Die Eingabe wird durch die tanh-Funktion auf den Bereich (-1,1) begrenzt und dann wird arccos verwendet, um eine numerisch stabile Phasendarstellung zu erhalten.

Definition von Chebyshev-Polynomen:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

Lernbare Aktivierungsfunktion:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

wobei W_i lernbare Parametertensoren sind und n=4 die Polynomordnung ist. Dieses Design ermöglicht es der Aktivierungsfunktion, sich dynamisch an IMU-Signalmerkmale anzupassen.

2. Effiziente kernelbasierte Selbstaufmerksamkeit (EKSA)

Kernidee: Verwendung von Kernelfunktionen zur Approximation der Aufmerksamkeitsmatrix, um die explizite Berechnung der vollständigen Aufmerksamkeitsmatrix zu vermeiden.

Pearson-Korrelationskoeffizient-Ähnlichkeit:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

wobei q̄ = q - μ(q), k̄ = k - μ(k), dieses Maß ist robust gegenüber Offset- und Verstärkungsrauschen, das häufig in IMU-Signalen vorkommt.

Exponentialkernfunktion:

K_F(q,k) = exp(ρ(q,k)²)

Taylor-Reihen-Approximation:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

EKSA-Berechnung:

EKSA(Q,K,V) = f_Q(f_K^T V)

reduziert die Komplexität von O(C_R L_R²) auf O(L_R C_R²).

Technische Innovationen

Adaptive nichtlineare Modellierung: Die lernbare Kombination von Chebyshev-Polynomen kann sich dynamisch an unterschiedliche IMU-Signalmerkmale anpassen
Optimierung der Recheneffizienz: Das EKSA-Modul ermöglicht die Modellierung globaler Abhängigkeiten mit linearer Zeitkomplexität
Rauschrobustheit: Die Invarianz des Pearson-Korrelationskoeffizienten gegenüber Offset- und Verstärkungsrauschen erhöht die Systemrobustheit

Experimentelle Einrichtung

Datensätze

Fünf öffentliche Trägheitsdatensätze werden verwendet:

IMUNet, RoNIN, RIDI, RNIN, TLIO
Datensätze werden zufällig im Verhältnis 8:1:1 in Trainings-, Validierungs- und Testsätze aufgeteilt
Ein speziell konstruierter TLIO (w/o gravity) Datensatz wird für die Analyse der Schwerkraftauswirkungen verwendet

Bewertungsmetriken

Position Drift Error (PDE): Endpunktdriftfehler
Relative Trajectory Error (RTE): Lokale Trajektoriengenauigkeit
Absolute Trajectory Error (ATE): Globale Positionierungsgenauigkeit

Vergleichsmethoden

RoNIN (ResNet, TCN, LSTM-Varianten)
IMUNet
TLIO-Netzwerk
RNIN-Netzwerk

Implementierungsdetails

GPU: NVIDIA RTX A40 (48 GB)
Lernrate: 10⁻⁴
Batch-Größe: 512
Trainingsrunden: 100
CUDA-Version: 11.3
PyTorch-Version: 1.11

Experimentelle Ergebnisse

Hauptergebnisse

Der Vergleich der datensatzübergreifenden Leistung auf fünf Datensätzen zeigt, dass CKANIO auf den meisten Datensätzen konsistent die Vergleichsmethoden übertrifft:

Leistung auf dem RoNIN-Datensatz:

ATE: 5.365m → 3.814m (im Vergleich zu RoNIN ResNet)
RTE: 3.390m → 3.272m

Gesamtleistung: CKANIO erreicht auf allen Test-Datensätzen die besten oder nahezu besten ATE- und RTE-Werte.

Analyse der Schwerkraftauswirkungen

Experimente zeigen, dass das Entfernen der Gravitationsbeschleunigung im globalen Koordinatensystem die Fehler fast aller Algorithmen erheblich reduziert:

Die Schwerkraft wirkt als konstante Vorspannung im global ausgerichteten Koordinatensystem
Das Entfernen der Schwerkraftkomponente ermöglicht es, dass Beschleunigungsmessungen die Translationsbewegung des Trägers besser widerspiegeln
Dies verbessert die Lerneffektivität und numerische Stabilität

Ablationsstudien

CKANIO (w/o EKSA): Die alleinige Verwendung von ResCKAN übertrifft bereits RoNIN ResNet
Vollständiges CKANIO: Mit hinzugefügtem EKSA werden ATE und RTE weiter reduziert und die Geschwindigkeitsvorhersagegenauigkeit verbessert

Visualisierungsanalyse

Der Trajektorienvergleich zeigt:

In einfachen Szenarien weicht RoNIN ResNet aufgrund kumulativer Orientierungsfehler allmählich ab, während CKANIO eine stärkere Rauschrobustheit aufweist
In komplexen Szenarien zeigt RoNIN ResNet nach nichtlinearen Manövern wie Rotationen deutliche Abweichungen, während CKANIO diese Dynamiken besser erfassen kann

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

CKANIO führt erfolgreich Chebyshev KAN im IO-Bereich ein und verbessert die Fähigkeit zur nichtlinearen Bewegungsmodellierung erheblich
Das EKSA-Modul balanciert Leistung und Recheneffizienz effektiv
Die Schwerkraftentfernung hat einen signifikanten positiven Einfluss auf die IO-Leistung

Einschränkungen

Validierung nur auf Fußgänger-IMU-Signalen durchgeführt, Bewertung anderer Trägertypen fehlt
Obwohl die Rechenkomplexität verbessert wurde, ist sie immer noch höher als bei traditionellen Methoden
Die Handhabung extremer Bewegungsmuster erfordert weitere Verifikation

Zukünftige Richtungen

Die Autoren schlagen vor, dass die Erweiterung der Bewertung auf Nicht-Fußgänger-IMU-Signale eine vielversprechende Forschungsrichtung darstellt.

Tiefgreifende Bewertung

Stärken

Starke technische Innovation: Erstmalige Anwendung von KAN im IO-Bereich mit bahnbrechender Bedeutung
Solide theoretische Grundlagen: Die nichtlineare Approximationstheorie von Chebyshev-Polynomen bietet eine solide Grundlage für die Methode
Umfassende Experimentalgestaltung: Vergleichende Experimente auf fünf Datensätzen und detaillierte Ablationsstudien
Hoher praktischer Wert: Signifikante Genauigkeitsverbesserung bei Beibehaltung der Recheneffizienz

Mängel

Begrenzte Anwendbarkeit: Nur in Fußgängerszenarien validiert, die Generalisierbarkeit für industrielle Anwendungen ist unklar
Unzureichende theoretische Analyse: Mangel an theoretischer Erklärung, warum Chebyshev-Polynome besonders für IMU-Signale geeignet sind
Unzureichende Analyse des Rechenaufwands: Obwohl die Komplexität reduziert wurde, fehlt der Vergleich der tatsächlichen Laufzeiten

Auswirkungen

Akademische Auswirkungen: Führt ein neues Netzwerk-Architektur-Paradigma in den IO-Bereich ein
Praktischer Wert: Bietet einen neuen technologischen Weg für Positionierungsgeräte auf Verbraucherebene
Reproduzierbarkeit: Detaillierte experimentelle Einrichtung fördert nachfolgende Forschung

Anwendungsszenarien

Innenpositionierung von Verbrauchergeräten
Navigationssysteme in GPS-verweigerter Umgebung
Robotersysteme, die hochpräzise Trägheitsnavigation erfordern

Literaturverzeichnis

Das Papier zitiert 26 verwandte Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie Trägheitsnavigation, tiefes Lernen und KAN-Netzwerke abdecken und eine umfassende theoretische Grundlage und Vergleichsbenchmarks für diese Forschung bieten.