2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO: 관성 주행거리 측정을 위한 학습 가능한 체비셰프 다항식

기본 정보

  • 논문 ID: 2507.16865
  • 제목: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
  • 저자: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • 분류: cs.RO (로봇공학)
  • 발표 시간: 2025년 10월 16일 (arXiv v2)
  • 논문 링크: https://arxiv.org/abs/2507.16865

초록

관성 주행거리 측정(IO)은 관성 측정 장치(IMU) 신호만을 사용하여 위치 결정을 수행하며, 소비자급 위치 결정을 위한 유망한 경로를 제공합니다. 그러나 IMU 신호에 존재하는 비선형 운동 패턴을 정확하게 모델링하는 것이 IO 정확도의 주요 제약 요소입니다. 이 문제를 해결하기 위해 저자들은 체비셰프 기반 Kolmogorov-Arnold 네트워크(Chebyshev KAN)를 통합한 IO 프레임워크인 CKANIO를 제안합니다. 구체적으로, KAN 프레임워크 내 체비셰프 다항식의 비선형 근사 능력을 활용하여 IMU 신호에 내재된 복잡한 운동 특성을 보다 효과적으로 모델링하는 새로운 잔차 아키텍처를 설계했습니다. 저자들의 지식으로는 해석 가능한 KAN 모델을 IO에 적용한 첫 번째 연구입니다. 5개의 공개 데이터셋에 대한 실험 결과는 CKANIO의 유효성을 입증합니다.

연구 배경 및 동기

문제 정의

관성 주행거리 측정(IO)은 IMU 센서만을 사용하여 위치 및 방향 추정을 수행하는 기술로, 자율주행, 로봇 네비게이션 등의 분야에서 중요한 응용 가치를 가집니다. GPS 신호를 사용할 수 없거나 외부 센서가 제한될 때, IO는 보완적이거나 대체적인 위치 결정 솔루션으로 작용할 수 있습니다.

핵심 문제

  1. 오차 누적 문제: 뉴턴 역학 기반의 전통적인 IO 방법은 IMU 고유의 측정 노이즈로 인해 시간에 따라 오차가 누적되어 장거리 위치 결정 정확도에 심각한 영향을 미칩니다.
  2. 비선형 운동 모델링의 어려움: IMU 신호의 복잡한 비선형 운동 패턴(예: 회전)을 정확하게 모델링하기 어렵습니다.
  3. 고정 활성화 함수의 한계: 기존 데이터 기반 방법은 고정 활성화 함수에 의존하여 IMU 신호의 복잡한 동역학 특성을 충분히 포착할 수 없습니다.

연구 동기

Kolmogorov-Arnold 네트워크(KAN)가 비선형 함수 근사에서 우수한 성능을 보인다는 점에 영감을 받아, 저자들은 체비셰프 다항식 기반 KAN을 사용하여 전통적인 고정 활성화 함수를 대체하고 IMU 신호의 복잡한 비선형 특성을 더 잘 모델링할 것을 제안합니다.

핵심 기여

  1. Chebyshev KAN을 IO 분야에 처음 도입: 체비셰프 다항식의 비선형 근사 능력을 활용하여 비선형 동역학에 대한 모델의 표현 능력을 향상시키는 잔차 네트워크 아키텍처를 설계했습니다.
  2. 효율적인 커널 기반 자기 주의 모듈(EKSA) 개발: 문맥 운동 모델링을 강화하여 IMU 신호의 보다 포괄적인 활용을 실현하면서 계산 복잡도를 O(L²)에서 O(L)로 감소시킵니다.
  3. 중력이 IO 정확도에 미치는 영향에 대한 첫 정량 분석 제공: 전역 좌표계에서 중력이 IO 성능에 미치는 구체적인 영향을 정량적으로 분석합니다.

방법 상세 설명

작업 정의

시간 윈도우 내 IMU 신호 X ∈ R^(C×L) (C=6은 3축 가속도와 3축 각속도를 나타내고, L은 샘플 포인트 수)이 주어졌을 때, 속도 벡터 v̂를 예측하여 실제 속도 v와의 평균 제곱 오차를 최소화합니다.

모델 아키텍처

1. 잔차 체비셰프 KAN (ResCKAN)

입력 전처리:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

tanh 함수를 통해 입력을 (-1,1) 범위로 제한한 후, arccos를 사용하여 수치적으로 안정적인 위상 표현을 얻습니다.

체비셰프 다항식 정의:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

학습 가능한 활성화 함수:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

여기서 W_i는 학습 가능한 매개변수 텐서이고, n=4는 다항식 차수입니다. 이러한 설계는 활성화 함수가 IMU 신호 특성에 동적으로 적응할 수 있게 합니다.

2. 효율적인 커널 기반 자기 주의(EKSA)

핵심 개념: 커널 함수를 사용하여 주의 행렬을 근사하여 완전한 주의 행렬의 명시적 계산을 피합니다.

피어슨 상관계수 유사도:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

여기서 q̄ = q - μ(q), k̄ = k - μ(k)이며, 이 측도는 IMU 신호에서 흔한 오프셋 및 이득 노이즈에 대해 강건합니다.

지수 커널 함수:

K_F(q,k) = exp(ρ(q,k)²)

테일러 전개 근사:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

EKSA 계산:

EKSA(Q,K,V) = f_Q(f_K^T V)

복잡도를 O(C_R L_R²)에서 O(L_R C_R²)로 감소시킵니다.

기술 혁신 포인트

  1. 적응형 비선형 모델링: 체비셰프 다항식의 학습 가능한 조합은 다양한 IMU 신호 특성에 동적으로 적응할 수 있습니다.
  2. 계산 효율성 최적화: EKSA 모듈은 선형 시간 복잡도의 전역 의존성 모델링을 실현합니다.
  3. 노이즈 강건성: 피어슨 상관계수의 오프셋 및 이득 노이즈 불변성은 시스템 강건성을 향상시킵니다.

실험 설정

데이터셋

5개의 공개 관성 데이터셋을 사용합니다:

  • IMUNet, RoNIN, RIDI, RNIN, TLIO
  • 데이터셋은 8:1:1의 비율로 무작위로 훈련, 검증 및 테스트 세트로 분할됩니다.
  • 중력 영향 분석을 위해 특별히 TLIO (w/o gravity) 데이터셋을 구성했습니다.

평가 지표

  1. Position Drift Error (PDE): 종점 드리프트 오차
  2. Relative Trajectory Error (RTE): 국소 궤적 정확도
  3. Absolute Trajectory Error (ATE): 전역 위치 결정 정확도

비교 방법

  • RoNIN (ResNet, TCN, LSTM 변형)
  • IMUNet
  • TLIO 네트워크
  • RNIN 네트워크

구현 세부사항

  • GPU: NVIDIA RTX A40 (48 GB)
  • 학습률: 10⁻⁴
  • 배치 크기: 512
  • 훈련 에포크: 100
  • CUDA 버전: 11.3
  • PyTorch 버전: 1.11

실험 결과

주요 결과

5개 데이터셋에 대한 교차 데이터셋 성능 비교에서 CKANIO는 대부분의 데이터셋에서 비교 방법을 일관되게 능가합니다:

RoNIN 데이터셋 성능:

  • ATE: 5.365m → 3.814m (RoNIN ResNet 대비)
  • RTE: 3.390m → 3.272m

전체 성능: CKANIO는 모든 테스트 데이터셋에서 최고 또는 거의 최고의 ATE 및 RTE 값을 달성했습니다.

중력 영향 분석

실험에서 전역 좌표계의 중력 가속도를 제거하면 거의 모든 알고리즘의 오차가 크게 감소함을 발견했습니다:

  • 중력은 전역 정렬 좌표계에서 상수 편향으로 작용합니다.
  • 중력 성분을 제거하면 가속도계 측정이 운반체의 평행 운동을 더 잘 반영합니다.
  • 학습 효과 및 수치 안정성을 향상시킵니다.

소거 실험

  • CKANIO (w/o EKSA): ResCKAN만 사용해도 이미 RoNIN ResNet을 능가합니다.
  • 완전한 CKANIO: EKSA를 추가하면 ATE 및 RTE가 추가로 감소하여 속도 예측 정확도가 향상됩니다.

시각화 분석

궤적 비교에서 다음을 보여줍니다:

  1. 단순한 시나리오에서 RoNIN ResNet은 누적 방위각 오차로 인해 점진적으로 벗어나는 반면, CKANIO는 더 강한 노이즈 강건성을 나타냅니다.
  2. 복잡한 시나리오에서 RoNIN ResNet은 회전 등의 비선형 기동 후 명백한 드리프트를 보이는 반면, CKANIO는 이러한 동역학 특성을 더 잘 포착할 수 있습니다.

관련 연구

전통적 IO 방법

주로 뉴턴 역학에 의존하여 위치 및 방향 추정을 수행하지만, IMU 노이즈의 영향으로 인한 오차 누적의 문제가 있습니다.

데이터 기반 IO 방법

대규모 IMU 데이터를 통해 운동 패턴을 학습하여 정확도 및 적용성 측면에서 전통적 방법을 능가하지만, 복잡한 비선형 운동 모델링 측면에서는 여전히 한계가 있습니다.

KAN 네트워크

Kolmogorov-Arnold 네트워크는 전통적인 고정 활성화 함수를 학습 가능한 활성화 함수로 대체하여 다양한 분야에서 우수한 비선형 근사 능력을 보여줍니다.

결론 및 논의

주요 결론

  1. CKANIO는 체비셰프 KAN을 IO 분야에 성공적으로 도입하여 비선형 운동 모델링 능력을 크게 향상시켰습니다.
  2. EKSA 모듈은 성능과 계산 효율성을 효과적으로 균형 있게 조정합니다.
  3. 중력 제거는 IO 성능에 현저한 긍정적 영향을 미칩니다.

한계

  1. 보행자 IMU 신호에서만 검증되었으며, 다른 운반체 유형에 대한 평가가 부족합니다.
  2. 계산 복잡도가 개선되었지만, 전통적 방법에 비해 여전히 높습니다.
  3. 극단적 운동 패턴에 대한 처리 능력은 추가 검증이 필요합니다.

향후 방향

저자들은 평가를 비보행자 IMU 신호로 확장하는 것이 유망한 연구 방향임을 제안합니다.

심층 평가

장점

  1. 기술 혁신성이 강함: KAN을 IO 분야에 처음 도입하여 개척적 의의를 가집니다.
  2. 이론적 기초가 견고함: 체비셰프 다항식의 비선형 근사 이론이 방법에 견고한 기초를 제공합니다.
  3. 실험 설계가 포괄적임: 5개 데이터셋의 비교 실험 및 상세한 소거 연구를 수행했습니다.
  4. 실용 가치가 높음: 계산 효율성을 유지하면서 정확도를 크게 향상시킵니다.

부족한 점

  1. 적용 범위가 제한적임: 보행자 시나리오만 검증되었으며, 산업 응용의 일반화 가능성은 미검증입니다.
  2. 이론 분석이 충분하지 않음: 체비셰프 다항식이 특히 IMU 신호에 적합한 이유에 대한 이론적 설명이 부족합니다.
  3. 계산 오버헤드 분석 부족: 복잡도는 감소했지만, 실제 실행 시간의 비교가 부족합니다.

영향력

  1. 학술적 영향: IO 분야에 새로운 네트워크 아키텍처 패러다임을 도입했습니다.
  2. 실용 가치: 소비자급 위치 결정 장치에 새로운 기술 경로를 제공합니다.
  3. 재현성: 실험 설정이 상세하여 후속 연구에 도움이 됩니다.

적용 시나리오

  1. 소비자급 모바일 장치의 실내 위치 결정
  2. GPS 거부 환경에서의 네비게이션 시스템
  3. 고정밀 관성 네비게이션이 필요한 로봇 시스템

참고문헌

논문은 관성 네비게이션, 심층 학습, KAN 네트워크 등 여러 분야의 중요한 연구를 포함한 26편의 관련 문헌을 인용하여 본 연구에 충실한 이론적 기초와 비교 기준을 제공합니다.