2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO: Lernbare Chebyshev-Polynome für Trägheitsodometrie

Grundlegende Informationen

  • Papier-ID: 2507.16865
  • Titel: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
  • Autoren: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • Klassifizierung: cs.RO (Robotik)
  • Veröffentlichungsdatum: 16. Oktober 2025 (arXiv v2)
  • Papierlink: https://arxiv.org/abs/2507.16865

Zusammenfassung

Die Trägheitsodometrie (IO) ermöglicht die Positionierung ausschließlich durch Signale von Trägheitsmesseinheiten (IMU) und bietet einen vielversprechenden Weg für die Positionierung auf Verbraucherebene. Die genaue Modellierung nichtlinearer Bewegungsmuster in IMU-Signalen bleibt jedoch eine Hauptbeschränkung der IO-Genauigkeit. Um diese Herausforderung zu bewältigen, präsentieren die Autoren CKANIO, ein IO-Framework, das auf Chebyshev-basierten Kolmogorov-Arnold-Netzwerken (Chebyshev KAN) integriert ist. Insbesondere wurde eine neuartige Residualarchitektur entwickelt, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen im KAN-Framework nutzt, um komplexe Bewegungsmerkmale in IMU-Signalen effektiver zu modellieren. Nach Kenntnis der Autoren ist dies die erste Arbeit, die interpretierbare KAN-Modelle auf IO anwendet. Experimentelle Ergebnisse auf fünf öffentlichen Datensätzen demonstrieren die Wirksamkeit von CKANIO.

Forschungshintergrund und Motivation

Problemdefinition

Die Trägheitsodometrie (IO) ist eine Technik zur Positions- und Orientierungsschätzung ausschließlich mit IMU-Sensoren und hat wichtige Anwendungen in autonomem Fahren, Roboternavigation und anderen Bereichen. Wenn GPS-Signale nicht verfügbar sind oder externe Sensoren begrenzt sind, kann IO als ergänzende oder alternative Positionierungslösung dienen.

Kernprobleme

  1. Fehlerakkumulationsproblem: Traditionelle auf Newtonscher Mechanik basierende IO-Methoden führen zu zeitabhängiger Fehlerakkumulation aufgrund von IMU-Messunsicherheiten, was die Positionierungsgenauigkeit über lange Distanzen erheblich beeinträchtigt
  2. Schwierigkeiten bei der nichtlinearen Bewegungsmodellierung: Komplexe nichtlineare Bewegungsmuster in IMU-Signalen (wie Rotationen) sind schwer genau zu modellieren
  3. Einschränkungen fester Aktivierungsfunktionen: Bestehende datengesteuerte Methoden verlassen sich auf feste Aktivierungsfunktionen und können die komplexen Dynamiken von IMU-Signalen nicht vollständig erfassen

Forschungsmotivation

Inspiriert durch die hervorragende Leistung von Kolmogorov-Arnold-Netzwerken (KAN) bei der nichtlinearen Funktionsapproximation schlagen die Autoren vor, auf Chebyshev-Polynomen basierende KAN zu verwenden, um traditionelle feste Aktivierungsfunktionen zu ersetzen und komplexe nichtlineare Merkmale in IMU-Signalen besser zu modellieren.

Kernbeiträge

  1. Erstmalige Einführung von Chebyshev KAN im IO-Bereich: Entwicklung einer Residualnetzwerk-Architektur, die die nichtlineare Approximationsfähigkeit von Chebyshev-Polynomen nutzt, um die Darstellungsfähigkeit des Modells für nichtlineare Dynamiken zu verbessern
  2. Entwicklung eines effizienten kernelbasierten Selbstaufmerksamkeitsmoduls (EKSA): Verbesserung der kontextabhängigen Bewegungsmodellierung für umfassendere Nutzung von IMU-Signalen, während die Rechenkomplexität von O(L²) auf O(L) reduziert wird
  3. Bereitstellung der ersten quantitativen Analyse der Auswirkungen der Schwerkraft auf die IO-Genauigkeit: Quantitative Analyse der spezifischen Auswirkungen der Schwerkraft auf die IO-Leistung im globalen Koordinatensystem

Methodische Details

Aufgabendefinition

Gegeben sind IMU-Signale X ∈ R^(C×L) innerhalb eines Zeitfensters (wobei C=6 für dreiachsige Beschleunigung und dreiachsige Winkelgeschwindigkeit steht, L ist die Anzahl der Abtastpunkte), wird der Geschwindigkeitsvektor v̂ vorhergesagt, um den mittleren quadratischen Fehler mit der tatsächlichen Geschwindigkeit v zu minimieren.

Modellarchitektur

1. Residuales Chebyshev KAN (ResCKAN)

Eingabevorverarbeitung:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

Die Eingabe wird durch die tanh-Funktion auf den Bereich (-1,1) begrenzt und dann wird arccos verwendet, um eine numerisch stabile Phasendarstellung zu erhalten.

Definition von Chebyshev-Polynomen:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

Lernbare Aktivierungsfunktion:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

wobei W_i lernbare Parametertensoren sind und n=4 die Polynomordnung ist. Dieses Design ermöglicht es der Aktivierungsfunktion, sich dynamisch an IMU-Signalmerkmale anzupassen.

2. Effiziente kernelbasierte Selbstaufmerksamkeit (EKSA)

Kernidee: Verwendung von Kernelfunktionen zur Approximation der Aufmerksamkeitsmatrix, um die explizite Berechnung der vollständigen Aufmerksamkeitsmatrix zu vermeiden.

Pearson-Korrelationskoeffizient-Ähnlichkeit:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

wobei q̄ = q - μ(q), k̄ = k - μ(k), dieses Maß ist robust gegenüber Offset- und Verstärkungsrauschen, das häufig in IMU-Signalen vorkommt.

Exponentialkernfunktion:

K_F(q,k) = exp(ρ(q,k)²)

Taylor-Reihen-Approximation:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

EKSA-Berechnung:

EKSA(Q,K,V) = f_Q(f_K^T V)

reduziert die Komplexität von O(C_R L_R²) auf O(L_R C_R²).

Technische Innovationen

  1. Adaptive nichtlineare Modellierung: Die lernbare Kombination von Chebyshev-Polynomen kann sich dynamisch an unterschiedliche IMU-Signalmerkmale anpassen
  2. Optimierung der Recheneffizienz: Das EKSA-Modul ermöglicht die Modellierung globaler Abhängigkeiten mit linearer Zeitkomplexität
  3. Rauschrobustheit: Die Invarianz des Pearson-Korrelationskoeffizienten gegenüber Offset- und Verstärkungsrauschen erhöht die Systemrobustheit

Experimentelle Einrichtung

Datensätze

Fünf öffentliche Trägheitsdatensätze werden verwendet:

  • IMUNet, RoNIN, RIDI, RNIN, TLIO
  • Datensätze werden zufällig im Verhältnis 8:1:1 in Trainings-, Validierungs- und Testsätze aufgeteilt
  • Ein speziell konstruierter TLIO (w/o gravity) Datensatz wird für die Analyse der Schwerkraftauswirkungen verwendet

Bewertungsmetriken

  1. Position Drift Error (PDE): Endpunktdriftfehler
  2. Relative Trajectory Error (RTE): Lokale Trajektoriengenauigkeit
  3. Absolute Trajectory Error (ATE): Globale Positionierungsgenauigkeit

Vergleichsmethoden

  • RoNIN (ResNet, TCN, LSTM-Varianten)
  • IMUNet
  • TLIO-Netzwerk
  • RNIN-Netzwerk

Implementierungsdetails

  • GPU: NVIDIA RTX A40 (48 GB)
  • Lernrate: 10⁻⁴
  • Batch-Größe: 512
  • Trainingsrunden: 100
  • CUDA-Version: 11.3
  • PyTorch-Version: 1.11

Experimentelle Ergebnisse

Hauptergebnisse

Der Vergleich der datensatzübergreifenden Leistung auf fünf Datensätzen zeigt, dass CKANIO auf den meisten Datensätzen konsistent die Vergleichsmethoden übertrifft:

Leistung auf dem RoNIN-Datensatz:

  • ATE: 5.365m → 3.814m (im Vergleich zu RoNIN ResNet)
  • RTE: 3.390m → 3.272m

Gesamtleistung: CKANIO erreicht auf allen Test-Datensätzen die besten oder nahezu besten ATE- und RTE-Werte.

Analyse der Schwerkraftauswirkungen

Experimente zeigen, dass das Entfernen der Gravitationsbeschleunigung im globalen Koordinatensystem die Fehler fast aller Algorithmen erheblich reduziert:

  • Die Schwerkraft wirkt als konstante Vorspannung im global ausgerichteten Koordinatensystem
  • Das Entfernen der Schwerkraftkomponente ermöglicht es, dass Beschleunigungsmessungen die Translationsbewegung des Trägers besser widerspiegeln
  • Dies verbessert die Lerneffektivität und numerische Stabilität

Ablationsstudien

  • CKANIO (w/o EKSA): Die alleinige Verwendung von ResCKAN übertrifft bereits RoNIN ResNet
  • Vollständiges CKANIO: Mit hinzugefügtem EKSA werden ATE und RTE weiter reduziert und die Geschwindigkeitsvorhersagegenauigkeit verbessert

Visualisierungsanalyse

Der Trajektorienvergleich zeigt:

  1. In einfachen Szenarien weicht RoNIN ResNet aufgrund kumulativer Orientierungsfehler allmählich ab, während CKANIO eine stärkere Rauschrobustheit aufweist
  2. In komplexen Szenarien zeigt RoNIN ResNet nach nichtlinearen Manövern wie Rotationen deutliche Abweichungen, während CKANIO diese Dynamiken besser erfassen kann

Verwandte Arbeiten

Traditionelle IO-Methoden

Basieren hauptsächlich auf Newtonscher Mechanik für Positions- und Orientierungsschätzung, leiden aber unter Fehlerakkumulation aufgrund von IMU-Rauschen.

Datengesteuerte IO-Methoden

Lernen Bewegungsmuster aus großen IMU-Datensätzen und übertreffen traditionelle Methoden in Genauigkeit und Anwendbarkeit, haben aber immer noch Einschränkungen bei der Modellierung komplexer nichtlinearer Bewegungen.

KAN-Netzwerke

Kolmogorov-Arnold-Netzwerke ersetzen traditionelle feste Aktivierungsfunktionen durch lernbare Aktivierungsfunktionen und zeigen hervorragende nichtlineare Approximationsfähigkeiten in verschiedenen Bereichen.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. CKANIO führt erfolgreich Chebyshev KAN im IO-Bereich ein und verbessert die Fähigkeit zur nichtlinearen Bewegungsmodellierung erheblich
  2. Das EKSA-Modul balanciert Leistung und Recheneffizienz effektiv
  3. Die Schwerkraftentfernung hat einen signifikanten positiven Einfluss auf die IO-Leistung

Einschränkungen

  1. Validierung nur auf Fußgänger-IMU-Signalen durchgeführt, Bewertung anderer Trägertypen fehlt
  2. Obwohl die Rechenkomplexität verbessert wurde, ist sie immer noch höher als bei traditionellen Methoden
  3. Die Handhabung extremer Bewegungsmuster erfordert weitere Verifikation

Zukünftige Richtungen

Die Autoren schlagen vor, dass die Erweiterung der Bewertung auf Nicht-Fußgänger-IMU-Signale eine vielversprechende Forschungsrichtung darstellt.

Tiefgreifende Bewertung

Stärken

  1. Starke technische Innovation: Erstmalige Anwendung von KAN im IO-Bereich mit bahnbrechender Bedeutung
  2. Solide theoretische Grundlagen: Die nichtlineare Approximationstheorie von Chebyshev-Polynomen bietet eine solide Grundlage für die Methode
  3. Umfassende Experimentalgestaltung: Vergleichende Experimente auf fünf Datensätzen und detaillierte Ablationsstudien
  4. Hoher praktischer Wert: Signifikante Genauigkeitsverbesserung bei Beibehaltung der Recheneffizienz

Mängel

  1. Begrenzte Anwendbarkeit: Nur in Fußgängerszenarien validiert, die Generalisierbarkeit für industrielle Anwendungen ist unklar
  2. Unzureichende theoretische Analyse: Mangel an theoretischer Erklärung, warum Chebyshev-Polynome besonders für IMU-Signale geeignet sind
  3. Unzureichende Analyse des Rechenaufwands: Obwohl die Komplexität reduziert wurde, fehlt der Vergleich der tatsächlichen Laufzeiten

Auswirkungen

  1. Akademische Auswirkungen: Führt ein neues Netzwerk-Architektur-Paradigma in den IO-Bereich ein
  2. Praktischer Wert: Bietet einen neuen technologischen Weg für Positionierungsgeräte auf Verbraucherebene
  3. Reproduzierbarkeit: Detaillierte experimentelle Einrichtung fördert nachfolgende Forschung

Anwendungsszenarien

  1. Innenpositionierung von Verbrauchergeräten
  2. Navigationssysteme in GPS-verweigerter Umgebung
  3. Robotersysteme, die hochpräzise Trägheitsnavigation erfordern

Literaturverzeichnis

Das Papier zitiert 26 verwandte Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie Trägheitsnavigation, tiefes Lernen und KAN-Netzwerke abdecken und eine umfassende theoretische Grundlage und Vergleichsbenchmarks für diese Forschung bieten.