CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic
CKANIO: Polinomi di Chebyshev Apprendibili per l'Odometria Inerziale
L'odometria inerziale (IO) si basa esclusivamente sui segnali dell'unità di misurazione inerziale (IMU) per la localizzazione, offrendo una soluzione promettente per la localizzazione di consumo. Tuttavia, la modellazione accurata dei pattern di movimento non lineari presenti nei segnali IMU rimane il principale limite della precisione dell'IO. Per affrontare questa sfida, gli autori propongono CKANIO, un framework di IO integrato con reti di Kolmogorov-Arnold basate su Chebyshev (Chebyshev KAN). Nello specifico, è stata progettata una nuova architettura residuale che sfrutta la capacità di approssimazione non lineare dei polinomi di Chebyshev all'interno del framework KAN per modellare più efficacemente le complesse caratteristiche di movimento intrinseche ai segnali IMU. A conoscenza degli autori, questo è il primo lavoro che applica modelli KAN interpretabili all'IO. I risultati sperimentali su cinque dataset pubblici dimostrano l'efficacia di CKANIO.
L'odometria inerziale (IO) è una tecnica che utilizza esclusivamente sensori IMU per la stima della posizione e dell'orientamento, con importanti applicazioni nella guida autonoma, nella navigazione robotica e in altri campi. Quando i segnali GPS non sono disponibili o i sensori esterni sono limitati, l'IO può fungere da soluzione di localizzazione complementare o alternativa.
Problema dell'accumulo di errori: I metodi tradizionali di IO basati sulla meccanica newtoniana soffrono dell'accumulo di errori nel tempo a causa del rumore di misurazione intrinseco dell'IMU, compromettendo seriamente la precisione della localizzazione a lunga distanza
Difficoltà nella modellazione del movimento non lineare: I complessi pattern di movimento non lineare nei segnali IMU (come le rotazioni) sono difficili da modellare accuratamente
Limitazioni delle funzioni di attivazione fisse: I metodi attuali basati sui dati si affidano a funzioni di attivazione fisse, incapaci di catturare pienamente le caratteristiche dinamiche complesse dei segnali IMU
Ispirati dalle eccellenti prestazioni delle reti di Kolmogorov-Arnold (KAN) nell'approssimazione di funzioni non lineari, gli autori propongono di utilizzare KAN basate su polinomi di Chebyshev per sostituire le tradizionali funzioni di attivazione fisse, al fine di modellare meglio le complesse caratteristiche non lineari nei segnali IMU.
Introduzione per la prima volta di Chebyshev KAN nel campo dell'IO: È stata progettata un'architettura di rete residuale che sfrutta la capacità di approssimazione non lineare dei polinomi di Chebyshev per migliorare la capacità di rappresentazione della dinamica non lineare del modello
Sviluppo di un modulo di auto-attenzione efficiente basato su funzioni kernel (EKSA): Migliora la modellazione del movimento contestuale, consentendo un utilizzo più completo dei segnali IMU, riducendo contemporaneamente la complessità computazionale da O(L²) a O(L)
Fornisce la prima analisi quantitativa dell'impatto della gravità sulla precisione dell'IO: Quantifica e analizza nel sistema di coordinate globale l'impatto specifico della gravità sulle prestazioni dell'IO
Dato un segnale IMU X ∈ R^(C×L) in una finestra temporale (dove C=6 rappresenta l'accelerazione triassiale e la velocità angolare triassiale, L è il numero di punti di campionamento), prevedere il vettore di velocità v̂, minimizzando l'errore quadratico medio con la velocità reale v.
La funzione tanh limita l'input nell'intervallo (-1,1), mentre arccos ottiene una rappresentazione di fase numericamente stabile.
Definizione dei polinomi di Chebyshev:
T_n(x) = cos(n·arccos(x)) (x ∈ [-1,1])
Funzione di attivazione apprendibile:
Y = Σ(i=0 to n) W_i × T_i(tanh(X))
dove W_i è un tensore di parametri apprendibile, n=4 è l'ordine del polinomio. Questo design consente alla funzione di attivazione di adattarsi dinamicamente alle caratteristiche del segnale IMU.
Idea fondamentale: Utilizzare funzioni kernel per approssimare la matrice di attenzione, evitando il calcolo esplicito della matrice di attenzione completa.
Somiglianza del coefficiente di correlazione di Pearson:
ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²
dove q̄ = q - μ(q), k̄ = k - μ(k), questa metrica è robusta rispetto al rumore di offset e guadagno comune nei segnali IMU.
Funzione kernel esponenziale:
K_F(q,k) = exp(ρ(q,k)²)
Approssimazione mediante sviluppo di Taylor:
K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ
Calcolo EKSA:
EKSA(Q,K,V) = f_Q(f_K^T V)
Riduce la complessità da O(C_R L_R²) a O(L_R C_R²).
Modellazione non lineare adattiva: La combinazione apprendibile di polinomi di Chebyshev può adattarsi dinamicamente a diverse caratteristiche dei segnali IMU
Ottimizzazione dell'efficienza computazionale: Il modulo EKSA realizza la modellazione delle dipendenze globali con complessità temporale lineare
Robustezza al rumore: L'invarianza del coefficiente di correlazione di Pearson rispetto al rumore di offset e guadagno migliora la robustezza del sistema
Il confronto delle prestazioni cross-dataset su cinque dataset mostra che CKANIO supera costantemente i metodi di confronto sulla maggior parte dei dataset:
Prestazioni sul dataset RoNIN:
ATE: 5.365m → 3.814m (rispetto a RoNIN ResNet)
RTE: 3.390m → 3.272m
Prestazioni complessive: CKANIO ha ottenuto i valori ATE e RTE migliori o quasi migliori su tutti i dataset di test.
Gli esperimenti hanno rivelato che la rimozione dell'accelerazione gravitazionale nel sistema di coordinate globale riduce significativamente gli errori di quasi tutti gli algoritmi:
La gravità agisce come un bias costante nel sistema di coordinate allineato globalmente
La rimozione della componente gravitazionale consente alle misurazioni dell'accelerometro di riflettere meglio il movimento traslazionale del veicolo
Migliora l'efficacia dell'apprendimento e la stabilità numerica
In scenari semplici, RoNIN ResNet si discosta gradualmente a causa dell'accumulo di errori di heading, mentre CKANIO dimostra una maggiore robustezza al rumore
In scenari complessi, RoNIN ResNet presenta una chiara deriva dopo manovre non lineari come le rotazioni, mentre CKANIO cattura meglio queste caratteristiche dinamiche
Si basano principalmente sulla meccanica newtoniana per la stima della posizione e dell'orientamento, ma soffrono dell'accumulo di errori dovuto al rumore dell'IMU.
Apprendono i pattern di movimento da grandi quantità di dati IMU, mostrando prestazioni superiori in termini di precisione e applicabilità rispetto ai metodi tradizionali, ma presentano ancora limitazioni nella modellazione di complessi movimenti non lineari.
Le reti di Kolmogorov-Arnold sostituiscono le tradizionali funzioni di attivazione fisse con funzioni di attivazione apprendibili, dimostrando eccellenti capacità di approssimazione non lineare in vari campi.
CKANIO ha introdotto con successo Chebyshev KAN nel campo dell'IO, migliorando significativamente la capacità di modellazione del movimento non lineare
Il modulo EKSA bilancia efficacemente le prestazioni e l'efficienza computazionale
La rimozione della gravità ha un impatto positivo significativo sulle prestazioni dell'IO
L'articolo cita 27 lavori correlati, coprendo molteplici campi tra cui navigazione inerziale, apprendimento profondo e reti KAN, fornendo una base teorica completa e benchmark comparativi per questa ricerca.