2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

基本信息

  • 论文ID: 2507.16865
  • 标题: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
  • 作者: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • 分类: cs.RO (机器人学)
  • 发表时间: 2025年10月16日 (arXiv v2)
  • 论文链接: https://arxiv.org/abs/2507.16865

摘要

惯性里程计(IO)仅依靠惯性测量单元(IMU)信号进行定位,为消费级定位提供了一个有前景的途径。然而,准确建模IMU信号中存在的非线性运动模式仍然是IO精度的主要限制。为了应对这一挑战,作者提出了CKANIO,一个集成了基于切比雪夫的Kolmogorov-Arnold网络(Chebyshev KAN)的IO框架。具体来说,设计了一种新颖的残差架构,利用KAN框架内切比雪夫多项式的非线性逼近能力来更有效地建模IMU信号中固有的复杂运动特征。据作者所知,这是首次将可解释的KAN模型应用于IO的工作。在五个公开数据集上的实验结果证明了CKANIO的有效性。

研究背景与动机

问题定义

惯性里程计(IO)是一种仅使用IMU传感器进行位置和方向估计的技术,在自动驾驶、机器人导航等领域具有重要应用价值。当GPS信号不可用或外部传感器受限时,IO可作为补充或替代的定位解决方案。

核心问题

  1. 误差累积问题:传统基于牛顿力学的IO方法由于IMU固有的测量噪声导致误差随时间累积,严重影响长距离定位精度
  2. 非线性运动建模困难:IMU信号中的复杂非线性运动模式(如旋转)难以准确建模
  3. 固定激活函数的局限性:现有数据驱动方法依赖固定激活函数,无法充分捕获IMU信号的复杂动态特性

研究动机

受Kolmogorov-Arnold网络(KAN)在非线性函数逼近方面优异性能的启发,作者提出使用基于切比雪夫多项式的KAN来替代传统的固定激活函数,以更好地建模IMU信号中的复杂非线性特征。

核心贡献

  1. 首次将Chebyshev KAN引入IO领域:设计了一个残差网络架构,利用切比雪夫多项式的非线性逼近能力增强模型对非线性动态的表征能力
  2. 开发了高效的基于核函数的自注意力模块(EKSA):增强上下文运动建模,实现对IMU信号更全面的利用,同时将计算复杂度从O(L²)降低到O(L)
  3. 提供了重力对IO精度影响的首次定量分析:在全局坐标系下量化分析了重力对IO性能的具体影响

方法详解

任务定义

给定时间窗口内的IMU信号X ∈ R^(C×L)(其中C=6表示三轴加速度和三轴角速度,L为采样点数),预测速度向量v̂,最小化与真实速度v的均方误差。

模型架构

1. 残差切比雪夫KAN (ResCKAN)

输入预处理

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

通过tanh函数将输入限制在(-1,1)范围内,再使用arccos获得数值稳定的相位表示。

切比雪夫多项式定义

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

可学习激活函数

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

其中W_i为可学习参数张量,n=4为多项式阶数。这种设计使激活函数能动态适应IMU信号特征。

2. 高效基于核函数的自注意力(EKSA)

核心思想:使用核函数近似注意力矩阵,避免显式计算完整注意力矩阵。

Pearson相关系数相似度

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

其中q̄ = q - μ(q),k̄ = k - μ(k),该度量对IMU信号中常见的偏移和增益噪声具有鲁棒性。

指数核函数

K_F(q,k) = exp(ρ(q,k)²)

泰勒展开近似

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

EKSA计算

EKSA(Q,K,V) = f_Q(f_K^T V)

将复杂度从O(C_R L_R²)降低到O(L_R C_R²)。

技术创新点

  1. 自适应非线性建模:切比雪夫多项式的可学习组合能够动态适应不同的IMU信号特征
  2. 计算效率优化:EKSA模块实现线性时间复杂度的全局依赖建模
  3. 噪声鲁棒性:Pearson相关系数对偏移和增益噪声的不变性提高了系统鲁棒性

实验设置

数据集

使用五个公开的惯性数据集:

  • IMUNetRoNINRIDIRNINTLIO
  • 数据集按8:1:1随机划分为训练、验证和测试集
  • 特别构建了TLIO (w/o gravity)数据集用于重力影响分析

评价指标

  1. Position Drift Error (PDE):终点漂移误差
  2. Relative Trajectory Error (RTE):局部轨迹精度
  3. Absolute Trajectory Error (ATE):全局定位精度

对比方法

  • RoNIN (ResNet、TCN、LSTM变体)
  • IMUNet
  • TLIO网络
  • RNIN网络

实现细节

  • GPU: NVIDIA RTX A40 (48 GB)
  • 学习率: 10⁻⁴
  • 批大小: 512
  • 训练轮数: 100
  • CUDA版本: 11.3
  • PyTorch版本: 1.11

实验结果

主要结果

在五个数据集上的跨数据集性能对比显示,CKANIO在大多数数据集上consistently优于对比方法:

RoNIN数据集表现

  • ATE: 5.365m → 3.814m (相比RoNIN ResNet)
  • RTE: 3.390m → 3.272m

整体性能:CKANIO在所有测试数据集上都取得了最佳或接近最佳的ATE和RTE值。

重力影响分析

实验发现,移除全局坐标系中的重力加速度显著降低了几乎所有算法的误差:

  • 重力在全局对齐坐标系中起到常数偏置的作用
  • 移除重力分量使加速度计测量更好地反映载体的平移运动
  • 提高了学习效果和数值稳定性

消融实验

  • CKANIO (w/o EKSA):仅使用ResCKAN已优于RoNIN ResNet
  • 完整CKANIO:加入EKSA后进一步降低ATE和RTE,提升速度预测精度

可视化分析

轨迹对比显示:

  1. 在简单场景中,RoNIN ResNet由于累积航向误差逐渐偏离,而CKANIO表现出更强的噪声鲁棒性
  2. 在复杂场景中,RoNIN ResNet在旋转等非线性机动后出现明显漂移,CKANIO能更好地捕获这些动态特性

相关工作

传统IO方法

主要依赖牛顿力学进行位置和方向估计,但受IMU噪声影响导致误差累积。

数据驱动IO方法

通过大规模IMU数据学习运动模式,在精度和适用性方面优于传统方法,但在复杂非线性运动建模方面仍有局限。

KAN网络

Kolmogorov-Arnold网络通过可学习的激活函数替代传统的固定激活函数,在各个领域展现出优异的非线性逼近能力。

结论与讨论

主要结论

  1. CKANIO成功将切比雪夫KAN引入IO领域,显著提升了非线性运动建模能力
  2. EKSA模块有效平衡了性能和计算效率
  3. 重力移除对IO性能有显著正面影响

局限性

  1. 仅在行人IMU信号上进行了验证,缺乏对其他载体类型的评估
  2. 计算复杂度虽有改善,但相比传统方法仍较高
  3. 对极端运动模式的处理能力有待进一步验证

未来方向

作者提出将评估扩展到非行人IMU信号是一个有前景的研究方向。

深度评价

优点

  1. 技术创新性强:首次将KAN引入IO领域,具有开创性意义
  2. 理论基础扎实:切比雪夫多项式的非线性逼近理论为方法提供了坚实基础
  3. 实验设计comprehensive:五个数据集的对比实验和详细的消融研究
  4. 实用价值高:在保持计算效率的同时显著提升精度

不足

  1. 适用范围有限:仅验证了行人场景,工业应用的泛化性待验证
  2. 理论分析不够深入:缺乏对为什么切比雪夫多项式特别适合IMU信号的理论解释
  3. 计算开销分析不足:虽然降低了复杂度,但缺乏实际运行时间的对比

影响力

  1. 学术影响:为IO领域引入了新的网络架构范式
  2. 实用价值:为消费级定位设备提供了新的技术路径
  3. 可复现性:实验设置详细,有助于后续研究

适用场景

  1. 消费级移动设备的室内定位
  2. GPS拒止环境下的导航系统
  3. 需要高精度惯性导航的机器人系统

参考文献

论文引用了26篇相关文献,涵盖了惯性导航、深度学习、KAN网络等多个领域的重要工作,为本研究提供了充实的理论基础和对比基准。