2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.

Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.

academic

CKANIO: Polinomi di Chebyshev Apprendibili per l'Odometria Inerziale

Informazioni Fondamentali

ID Articolo: 2507.16865
Titolo: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Autori: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
Classificazione: cs.RO (Robotica)
Data di Pubblicazione: 16 ottobre 2025 (arXiv v2)
Link Articolo: https://arxiv.org/abs/2507.16865

Riassunto

L'odometria inerziale (IO) si basa esclusivamente sui segnali dell'unità di misurazione inerziale (IMU) per la localizzazione, offrendo una soluzione promettente per la localizzazione di consumo. Tuttavia, la modellazione accurata dei pattern di movimento non lineari presenti nei segnali IMU rimane il principale limite della precisione dell'IO. Per affrontare questa sfida, gli autori propongono CKANIO, un framework di IO integrato con reti di Kolmogorov-Arnold basate su Chebyshev (Chebyshev KAN). Nello specifico, è stata progettata una nuova architettura residuale che sfrutta la capacità di approssimazione non lineare dei polinomi di Chebyshev all'interno del framework KAN per modellare più efficacemente le complesse caratteristiche di movimento intrinseche ai segnali IMU. A conoscenza degli autori, questo è il primo lavoro che applica modelli KAN interpretabili all'IO. I risultati sperimentali su cinque dataset pubblici dimostrano l'efficacia di CKANIO.

Contesto di Ricerca e Motivazione

Definizione del Problema

L'odometria inerziale (IO) è una tecnica che utilizza esclusivamente sensori IMU per la stima della posizione e dell'orientamento, con importanti applicazioni nella guida autonoma, nella navigazione robotica e in altri campi. Quando i segnali GPS non sono disponibili o i sensori esterni sono limitati, l'IO può fungere da soluzione di localizzazione complementare o alternativa.

Problemi Fondamentali

Problema dell'accumulo di errori: I metodi tradizionali di IO basati sulla meccanica newtoniana soffrono dell'accumulo di errori nel tempo a causa del rumore di misurazione intrinseco dell'IMU, compromettendo seriamente la precisione della localizzazione a lunga distanza
Difficoltà nella modellazione del movimento non lineare: I complessi pattern di movimento non lineare nei segnali IMU (come le rotazioni) sono difficili da modellare accuratamente
Limitazioni delle funzioni di attivazione fisse: I metodi attuali basati sui dati si affidano a funzioni di attivazione fisse, incapaci di catturare pienamente le caratteristiche dinamiche complesse dei segnali IMU

Motivazione della Ricerca

Ispirati dalle eccellenti prestazioni delle reti di Kolmogorov-Arnold (KAN) nell'approssimazione di funzioni non lineari, gli autori propongono di utilizzare KAN basate su polinomi di Chebyshev per sostituire le tradizionali funzioni di attivazione fisse, al fine di modellare meglio le complesse caratteristiche non lineari nei segnali IMU.

Contributi Fondamentali

Introduzione per la prima volta di Chebyshev KAN nel campo dell'IO: È stata progettata un'architettura di rete residuale che sfrutta la capacità di approssimazione non lineare dei polinomi di Chebyshev per migliorare la capacità di rappresentazione della dinamica non lineare del modello
Sviluppo di un modulo di auto-attenzione efficiente basato su funzioni kernel (EKSA): Migliora la modellazione del movimento contestuale, consentendo un utilizzo più completo dei segnali IMU, riducendo contemporaneamente la complessità computazionale da O(L²) a O(L)
Fornisce la prima analisi quantitativa dell'impatto della gravità sulla precisione dell'IO: Quantifica e analizza nel sistema di coordinate globale l'impatto specifico della gravità sulle prestazioni dell'IO

Dettagli del Metodo

Definizione del Compito

Dato un segnale IMU X ∈ R^(C×L) in una finestra temporale (dove C=6 rappresenta l'accelerazione triassiale e la velocità angolare triassiale, L è il numero di punti di campionamento), prevedere il vettore di velocità v̂, minimizzando l'errore quadratico medio con la velocità reale v.

Architettura del Modello

1. KAN di Chebyshev Residuale (ResCKAN)

Preelaborazione dell'input:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

La funzione tanh limita l'input nell'intervallo (-1,1), mentre arccos ottiene una rappresentazione di fase numericamente stabile.

Definizione dei polinomi di Chebyshev:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

Funzione di attivazione apprendibile:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

dove W_i è un tensore di parametri apprendibile, n=4 è l'ordine del polinomio. Questo design consente alla funzione di attivazione di adattarsi dinamicamente alle caratteristiche del segnale IMU.

2. Auto-attenzione Efficiente Basata su Funzioni Kernel (EKSA)

Idea fondamentale: Utilizzare funzioni kernel per approssimare la matrice di attenzione, evitando il calcolo esplicito della matrice di attenzione completa.

Somiglianza del coefficiente di correlazione di Pearson:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

dove q̄ = q - μ(q), k̄ = k - μ(k), questa metrica è robusta rispetto al rumore di offset e guadagno comune nei segnali IMU.

Funzione kernel esponenziale:

K_F(q,k) = exp(ρ(q,k)²)

Approssimazione mediante sviluppo di Taylor:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

Calcolo EKSA:

EKSA(Q,K,V) = f_Q(f_K^T V)

Riduce la complessità da O(C_R L_R²) a O(L_R C_R²).

Punti di Innovazione Tecnica

Modellazione non lineare adattiva: La combinazione apprendibile di polinomi di Chebyshev può adattarsi dinamicamente a diverse caratteristiche dei segnali IMU
Ottimizzazione dell'efficienza computazionale: Il modulo EKSA realizza la modellazione delle dipendenze globali con complessità temporale lineare
Robustezza al rumore: L'invarianza del coefficiente di correlazione di Pearson rispetto al rumore di offset e guadagno migliora la robustezza del sistema

Configurazione Sperimentale

Dataset

Sono stati utilizzati cinque dataset pubblici di dati inerziali:

IMUNet, RoNIN, RIDI, RNIN, TLIO
I dataset sono stati suddivisi casualmente in rapporto 8:1:1 in set di addestramento, validazione e test
È stato costruito appositamente il dataset TLIO (w/o gravity) per l'analisi dell'impatto della gravità

Metriche di Valutazione

Position Drift Error (PDE): Errore di deriva del punto finale
Relative Trajectory Error (RTE): Precisione della traiettoria locale
Absolute Trajectory Error (ATE): Precisione della localizzazione globale

Metodi di Confronto

RoNIN (varianti ResNet, TCN, LSTM)
IMUNet
Rete TLIO
Rete RNIN

Dettagli di Implementazione

GPU: NVIDIA RTX A40 (48 GB)
Tasso di apprendimento: 10⁻⁴
Dimensione del batch: 512
Epoche di addestramento: 100
Versione CUDA: 11.3
Versione PyTorch: 1.11

Risultati Sperimentali

Risultati Principali

Il confronto delle prestazioni cross-dataset su cinque dataset mostra che CKANIO supera costantemente i metodi di confronto sulla maggior parte dei dataset:

Prestazioni sul dataset RoNIN:

ATE: 5.365m → 3.814m (rispetto a RoNIN ResNet)
RTE: 3.390m → 3.272m

Prestazioni complessive: CKANIO ha ottenuto i valori ATE e RTE migliori o quasi migliori su tutti i dataset di test.

Analisi dell'Impatto della Gravità

Gli esperimenti hanno rivelato che la rimozione dell'accelerazione gravitazionale nel sistema di coordinate globale riduce significativamente gli errori di quasi tutti gli algoritmi:

La gravità agisce come un bias costante nel sistema di coordinate allineato globalmente
La rimozione della componente gravitazionale consente alle misurazioni dell'accelerometro di riflettere meglio il movimento traslazionale del veicolo
Migliora l'efficacia dell'apprendimento e la stabilità numerica

Studi di Ablazione

CKANIO (w/o EKSA): L'utilizzo solo di ResCKAN supera già RoNIN ResNet
CKANIO completo: L'aggiunta di EKSA riduce ulteriormente ATE e RTE, migliorando la precisione della previsione della velocità

Analisi Visiva

Il confronto delle traiettorie mostra:

In scenari semplici, RoNIN ResNet si discosta gradualmente a causa dell'accumulo di errori di heading, mentre CKANIO dimostra una maggiore robustezza al rumore
In scenari complessi, RoNIN ResNet presenta una chiara deriva dopo manovre non lineari come le rotazioni, mentre CKANIO cattura meglio queste caratteristiche dinamiche

Lavori Correlati

Metodi Tradizionali di IO

Si basano principalmente sulla meccanica newtoniana per la stima della posizione e dell'orientamento, ma soffrono dell'accumulo di errori dovuto al rumore dell'IMU.

Metodi di IO Basati sui Dati

Apprendono i pattern di movimento da grandi quantità di dati IMU, mostrando prestazioni superiori in termini di precisione e applicabilità rispetto ai metodi tradizionali, ma presentano ancora limitazioni nella modellazione di complessi movimenti non lineari.

Reti KAN

Le reti di Kolmogorov-Arnold sostituiscono le tradizionali funzioni di attivazione fisse con funzioni di attivazione apprendibili, dimostrando eccellenti capacità di approssimazione non lineare in vari campi.

Conclusioni e Discussione

Conclusioni Principali

CKANIO ha introdotto con successo Chebyshev KAN nel campo dell'IO, migliorando significativamente la capacità di modellazione del movimento non lineare
Il modulo EKSA bilancia efficacemente le prestazioni e l'efficienza computazionale
La rimozione della gravità ha un impatto positivo significativo sulle prestazioni dell'IO

Limitazioni

La validazione è stata effettuata solo su segnali IMU di pedoni, mancando la valutazione su altri tipi di veicoli
Sebbene la complessità computazionale sia migliorata, rimane comunque più elevata rispetto ai metodi tradizionali
La capacità di gestire pattern di movimento estremi richiede ulteriore verifica

Direzioni Future

Gli autori suggeriscono che l'estensione della valutazione a segnali IMU non relativi a pedoni rappresenta una direzione di ricerca promettente.

Valutazione Approfondita

Punti di Forza

Forte innovazione tecnica: Introduzione per la prima volta di KAN nel campo dell'IO, con significato pioneristico
Fondamenti teorici solidi: La teoria dell'approssimazione non lineare dei polinomi di Chebyshev fornisce una base solida per il metodo
Progettazione sperimentale completa: Esperimenti comparativi su cinque dataset e ricerche di ablazione dettagliate
Alto valore pratico: Migliora significativamente la precisione mantenendo l'efficienza computazionale

Insufficienze

Ambito di applicabilità limitato: Validazione solo in scenari pedonali, la generalizzabilità per applicazioni industriali rimane da verificare
Analisi teorica insufficiente: Manca una spiegazione teorica del perché i polinomi di Chebyshev siano particolarmente adatti ai segnali IMU
Analisi insufficiente dei costi computazionali: Sebbene la complessità sia ridotta, manca il confronto dei tempi di esecuzione effettivi

Impatto

Impatto accademico: Introduce un nuovo paradigma di architettura di rete nel campo dell'IO
Valore pratico: Fornisce un nuovo percorso tecnologico per i dispositivi di localizzazione di consumo
Riproducibilità: La configurazione sperimentale dettagliata facilita la ricerca successiva

Scenari di Applicazione

Localizzazione interna di dispositivi mobili di consumo
Sistemi di navigazione in ambienti negati GPS
Sistemi di navigazione inerziale ad alta precisione per robot

Bibliografia

L'articolo cita 27 lavori correlati, coprendo molteplici campi tra cui navigazione inerziale, apprendimento profondo e reti KAN, fornendo una base teorica completa e benchmark comparativi per questa ricerca.