2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.

Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.

academic

CKANIO: Обучаемые полиномы Чебышева для инерциальной одометрии

Основная информация

ID статьи: 2507.16865
Название: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
Авторы: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
Категория: cs.RO (Робототехника)
Дата публикации: 16 октября 2025 г. (arXiv v2)
Ссылка на статью: https://arxiv.org/abs/2507.16865

Аннотация

Инерциальная одометрия (IO) обеспечивает перспективный подход к позиционированию потребительского уровня, полагаясь исключительно на сигналы инерциального измерительного блока (ИИБ). Однако точное моделирование нелинейных закономерностей движения в сигналах ИИБ остаётся основным ограничением точности IO. Для решения этой проблемы авторы предлагают CKANIO — фреймворк IO, интегрирующий сеть Колмогорова-Арнольда на основе Чебышева (Chebyshev KAN). В частности, разработана новая остаточная архитектура, которая использует нелинейные аппроксимационные возможности полиномов Чебышева в рамках KAN для более эффективного моделирования сложных характеристик движения, присущих сигналам ИИБ. Насколько известно авторам, это первая работа, применяющая интерпретируемые модели KAN к IO. Экспериментальные результаты на пяти открытых наборах данных демонстрируют эффективность CKANIO.

Исследовательский контекст и мотивация

Определение проблемы

Инерциальная одометрия (IO) — это метод оценки положения и ориентации, использующий только датчики ИИБ. Он имеет важное практическое применение в автономном вождении, навигации робототехнических систем и других областях. Когда сигналы GPS недоступны или внешние датчики ограничены, IO может служить дополнительным или альтернативным решением для позиционирования.

Основные проблемы

Проблема накопления ошибок: Традиционные методы IO, основанные на ньютоновской механике, страдают от накопления ошибок во времени из-за присущих ИИБ шумов измерения, что серьёзно влияет на точность позиционирования на больших расстояниях
Сложность моделирования нелинейного движения: Сложные нелинейные закономерности в сигналах ИИБ (такие как вращение) трудно моделировать с высокой точностью
Ограничения фиксированных функций активации: Существующие методы, управляемые данными, полагаются на фиксированные функции активации, которые не могут полностью захватить сложную динамику сигналов ИИБ

Исследовательская мотивация

Вдохновлённые превосходной производительностью сетей Колмогорова-Арнольда (KAN) в нелинейной аппроксимации функций, авторы предлагают использовать KAN на основе полиномов Чебышева для замены традиционных фиксированных функций активации с целью лучшего моделирования сложных нелинейных характеристик в сигналах ИИБ.

Основные вклады

Первое применение Chebyshev KAN в области IO: Разработана остаточная архитектура сети, которая использует нелинейные аппроксимационные возможности полиномов Чебышева для повышения способности модели представлять нелинейную динамику
Разработка эффективного модуля самовнимания на основе ядерных функций (EKSA): Улучшено контекстное моделирование движения, обеспечена более полная утилизация сигналов ИИБ при одновременном снижении вычислительной сложности с O(L²) до O(L)
Первый количественный анализ влияния гравитации на точность IO: Проведён количественный анализ конкретного влияния гравитации на производительность IO в глобальной системе координат

Описание методики

Определение задачи

Учитывая сигналы ИИБ X ∈ R^(C×L) в временном окне (где C=6 обозначает трёхосевое ускорение и трёхосевую угловую скорость, L — количество точек выборки), предсказать вектор скорости v̂, минимизируя среднеквадратичную ошибку относительно истинной скорости v.

Архитектура модели

1. Остаточная сеть Чебышева KAN (ResCKAN)

Предварительная обработка входных данных:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

Функция tanh ограничивает входные данные в диапазоне (-1,1), а затем arccos используется для получения численно стабильного фазового представления.

Определение полиномов Чебышева:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

Обучаемая функция активации:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

где W_i — обучаемые тензоры параметров, n=4 — порядок полинома. Такая конструкция позволяет функции активации динамически адаптироваться к характеристикам сигналов ИИБ.

2. Эффективное самовнимание на основе ядерных функций (EKSA)

Основная идея: Использование ядерных функций для аппроксимации матрицы внимания, избегая явного вычисления полной матрицы внимания.

Сходство коэффициента корреляции Пирсона:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

где q̄ = q - μ(q), k̄ = k - μ(k). Эта метрика обладает устойчивостью к смещениям и шумам усиления, часто встречающимся в сигналах ИИБ.

Экспоненциальная ядерная функция:

K_F(q,k) = exp(ρ(q,k)²)

Аппроксимация разложением Тейлора:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

Вычисление EKSA:

EKSA(Q,K,V) = f_Q(f_K^T V)

Сложность снижается с O(C_R L_R²) до O(L_R C_R²).

Технические инновации

Адаптивное нелинейное моделирование: Обучаемая комбинация полиномов Чебышева может динамически адаптироваться к различным характеристикам сигналов ИИБ
Оптимизация вычислительной эффективности: Модуль EKSA реализует моделирование глобальных зависимостей с линейной временной сложностью
Устойчивость к шумам: Инвариантность коэффициента корреляции Пирсона к смещениям и шумам усиления повышает робастность системы

Экспериментальная установка

Наборы данных

Использованы пять открытых наборов данных инерциальных измерений:

IMUNet, RoNIN, RIDI, RNIN, TLIO
Наборы данных случайным образом разделены в соотношении 8:1:1 на обучающий, валидационный и тестовый наборы
Специально построен набор данных TLIO (w/o gravity) для анализа влияния гравитации

Метрики оценки

Position Drift Error (PDE): Ошибка дрейфа конечной точки
Relative Trajectory Error (RTE): Точность локальной траектории
Absolute Trajectory Error (ATE): Точность глобального позиционирования

Методы сравнения

RoNIN (ResNet, TCN, варианты LSTM)
IMUNet
Сеть TLIO
Сеть RNIN

Детали реализации

GPU: NVIDIA RTX A40 (48 ГБ)
Скорость обучения: 10⁻⁴
Размер пакета: 512
Количество эпох: 100
Версия CUDA: 11.3
Версия PyTorch: 1.11

Экспериментальные результаты

Основные результаты

Сравнение кросс-датасетной производительности на пяти наборах данных показывает, что CKANIO последовательно превосходит методы сравнения на большинстве наборов данных:

Производительность на наборе данных RoNIN:

ATE: 5.365м → 3.814м (по сравнению с RoNIN ResNet)
RTE: 3.390м → 3.272м

Общая производительность: CKANIO достигает лучших или близких к лучшим значений ATE и RTE на всех тестовых наборах данных.

Анализ влияния гравитации

Эксперименты показали, что удаление гравитационного ускорения в глобальной системе координат значительно снижает ошибку почти всех алгоритмов:

Гравитация действует как постоянное смещение в глобально выровненной системе координат
Удаление компоненты гравитации позволяет измерениям акселерометра лучше отражать поступательное движение носителя
Повышает эффективность обучения и численную стабильность

Абляционные исследования

CKANIO (w/o EKSA): Использование только ResCKAN уже превосходит RoNIN ResNet
Полный CKANIO: Добавление EKSA дополнительно снижает ATE и RTE, улучшая точность предсказания скорости

Визуальный анализ

Сравнение траекторий показывает:

В простых сценариях RoNIN ResNet постепенно отклоняется из-за накопления ошибок курса, тогда как CKANIO демонстрирует большую устойчивость к шумам
В сложных сценариях RoNIN ResNet проявляет явный дрейф после нелинейных манёвров, таких как вращение, в то время как CKANIO лучше захватывает эти динамические характеристики

Связанные работы

Традиционные методы IO

Главным образом полагаются на ньютоновскую механику для оценки положения и ориентации, но страдают от накопления ошибок из-за шумов ИИБ.

Методы IO, управляемые данными

Обучаются на больших объёмах данных ИИБ для изучения закономерностей движения, превосходя традиционные методы по точности и применимости, но всё ещё имеют ограничения в моделировании сложного нелинейного движения.

Сети KAN

Сети Колмогорова-Арнольда заменяют традиционные фиксированные функции активации обучаемыми, демонстрируя превосходные нелинейные аппроксимационные возможности в различных областях.

Заключение и обсуждение

Основные выводы

CKANIO успешно внедрила Chebyshev KAN в область IO, значительно повысив способность моделирования нелинейного движения
Модуль EKSA эффективно балансирует производительность и вычислительную эффективность
Удаление гравитации оказывает значительное положительное влияние на производительность IO

Ограничения

Валидация проведена только на сигналах ИИБ пешеходов, отсутствует оценка для других типов носителей
Вычислительная сложность, хотя и улучшена, остаётся выше, чем у традиционных методов
Способность обработки экстремальных режимов движения требует дальнейшей проверки

Направления будущих исследований

Авторы предлагают расширение оценки на сигналы ИИБ непешеходных носителей как перспективное направление исследований.

Глубокая оценка

Преимущества

Сильная техническая инновационность: Первое применение KAN в области IO имеет пионерское значение
Прочная теоретическая база: Теория нелинейной аппроксимации полиномов Чебышева обеспечивает твёрдую основу для метода
Комплексный дизайн экспериментов: Сравнительные эксперименты на пяти наборах данных и детальные абляционные исследования
Высокая практическая ценность: Значительное повышение точности при сохранении вычислительной эффективности

Недостатки

Ограниченная область применения: Валидация только в пешеходных сценариях, обобщаемость для промышленных приложений требует проверки
Недостаточный теоретический анализ: Отсутствует теоретическое объяснение того, почему полиномы Чебышева особенно подходят для сигналов ИИБ
Недостаточный анализ вычислительных затрат: Хотя сложность и снижена, отсутствует сравнение фактического времени выполнения

Влияние

Академическое влияние: Внедрение новой парадигмы архитектуры сети в область IO
Практическая ценность: Новый технологический путь для устройств позиционирования потребительского уровня
Воспроизводимость: Детальная экспериментальная установка способствует последующим исследованиям

Применимые сценарии

Позиционирование в помещениях мобильных устройств потребительского уровня
Навигационные системы в условиях отказа GPS
Робототехнические системы, требующие высокоточной инерциальной навигации

Библиография

Статья цитирует 26 связанных работ, охватывающих множество областей, включая инерциальную навигацию, глубокое обучение и сети KAN, обеспечивая прочную теоретическую основу и базовые методы сравнения для данного исследования.