2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO: متعددات تشيبيشيف القابلة للتعلم لقياس المسافات بالقصور الذاتي

المعلومات الأساسية

  • معرّف الورقة البحثية: 2507.16865
  • العنوان: CKANIO: متعددات تشيبيشيف القابلة للتعلم لقياس المسافات بالقصور الذاتي
  • المؤلفون: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • التصنيف: cs.RO (الروبوتات)
  • تاريخ النشر: 16 أكتوبر 2025 (arXiv v2)
  • رابط الورقة: https://arxiv.org/abs/2507.16865

الملخص

يعتمد قياس المسافات بالقصور الذاتي (IO) بشكل حصري على إشارات وحدة القياس بالقصور الذاتي (IMU) للتحديد الموقعي، مما يوفر مسارًا واعدًا لتحديد المواقع على مستوى المستهلك. ومع ذلك، يظل النمذجة الدقيقة للأنماط الحركية غير الخطية الموجودة في إشارات IMU هو القيد الرئيسي لدقة IO. للتعامل مع هذا التحدي، يقترح المؤلفون CKANIO، وهو إطار عمل IO متكامل يتضمن شبكة Kolmogorov-Arnold القائمة على تشيبيشيف (Chebyshev KAN). بشكل محدد، تم تصميم معمارية بقايا جديدة تستفيد من القدرة التقريبية غير الخطية لمتعددات تشيبيشيف ضمن إطار عمل KAN لنمذجة الميزات الحركية المعقدة المتأصلة في إشارات IMU بشكل أكثر فعالية. وفقًا لعلم المؤلفين، هذا هو أول عمل يطبق نموذج KAN القابل للتفسير على IO. تثبت نتائج التجارب على خمس مجموعات بيانات عامة فعالية CKANIO.

الخلفية البحثية والدافع

تعريف المشكلة

قياس المسافات بالقصور الذاتي (IO) هو تقنية لتقدير الموضع والاتجاه باستخدام مستشعرات IMU فقط، وله قيمة تطبيقية مهمة في مجالات مثل القيادة الذاتية والملاحة الروبوتية. عندما تكون إشارات GPS غير متاحة أو تكون المستشعرات الخارجية محدودة، يمكن أن يكون IO بمثابة حل تحديد موقع تكميلي أو بديل.

المشاكل الأساسية

  1. مشكلة تراكم الأخطاء: تؤدي الطرق التقليدية لـ IO القائمة على ميكانيكا نيوتن إلى تراكم الأخطاء بمرور الوقت بسبب الضوضاء القياسية المتأصلة في IMU، مما يؤثر بشكل خطير على دقة التحديد الموقعي لمسافات طويلة
  2. صعوبة نمذجة الحركة غير الخطية: يصعب نمذجة الأنماط الحركية غير الخطية المعقدة في إشارات IMU (مثل الدوران) بدقة
  3. قيود دوال التفعيل الثابتة: تعتمد الطرق الحالية المدفوعة بالبيانات على دوال تفعيل ثابتة، وهي غير قادرة على التقاط الخصائص الديناميكية المعقدة بشكل كامل لإشارات IMU

الدافع البحثي

مستوحاة من الأداء الممتاز لشبكة Kolmogorov-Arnold (KAN) في التقريب الدوال غير الخطية، يقترح المؤلفون استخدام KAN القائمة على متعددات تشيبيشيف لاستبدال دوال التفعيل الثابتة التقليدية، بهدف نمذجة أفضل للميزات غير الخطية المعقدة في إشارات IMU.

المساهمات الأساسية

  1. إدخال Chebyshev KAN إلى مجال IO للمرة الأولى: تصميم معمارية شبكة بقايا تستفيد من القدرة التقريبية غير الخطية لمتعددات تشيبيشيف لتعزيز قدرة النموذج على تمثيل الديناميكيات غير الخطية
  2. تطوير وحدة انتباه ذاتي فعالة قائمة على النواة (EKSA): تعزيز نمذجة الحركة السياقية، وتحقيق استخدام أكثر شمولاً لإشارات IMU، مع تقليل التعقيد الحسابي من O(L²) إلى O(L)
  3. توفير أول تحليل كمي لتأثير الجاذبية على دقة IO: تحليل كمي في الإطار الإحداثي العام لتأثير الجاذبية المحدد على أداء IO

شرح الطريقة

تعريف المهمة

بالنظر إلى إشارات IMU X ∈ R^(C×L) ضمن نافذة زمنية (حيث C=6 يمثل التسارع ثلاثي المحاور والسرعة الزاوية ثلاثية المحاور، و L هو عدد نقاط العينة)، التنبؤ بمتجه السرعة v̂ بحيث يتم تقليل متوسط الخطأ التربيعي مع السرعة الحقيقية v.

معمارية النموذج

1. متعددات تشيبيشيف بقايا (ResCKAN)

معالجة المدخلات المسبقة:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

يتم تقييد المدخلات ضمن نطاق (-1,1) من خلال دالة tanh، ثم استخدام arccos للحصول على تمثيل طور مستقر عدديًا.

تعريف متعددات تشيبيشيف:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

دالة تفعيل قابلة للتعلم:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

حيث W_i هو موتر معاملات قابل للتعلم، و n=4 هو درجة متعددة الحدود. يسمح هذا التصميم لدالة التفعيل بالتكيف الديناميكي مع ميزات إشارة IMU.

2. الانتباه الذاتي الفعال القائم على النواة (EKSA)

الفكرة الأساسية: استخدام دوال النواة لتقريب مصفوفة الانتباه، مما يتجنب الحساب الصريح لمصفوفة الانتباه الكاملة.

تشابه معامل ارتباط بيرسون:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

حيث q̄ = q - μ(q)، k̄ = k - μ(k)، هذا المقياس قوي ضد الانحياز والضوضاء المكتسبة الشائعة في إشارات IMU.

دالة النواة الأسية:

K_F(q,k) = exp(ρ(q,k)²)

تقريب تايلور:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

حساب EKSA:

EKSA(Q,K,V) = f_Q(f_K^T V)

يقلل التعقيد من O(C_R L_R²) إلى O(L_R C_R²).

نقاط الابتكار التقني

  1. النمذجة غير الخطية التكيفية: يمكن للمزيج القابل للتعلم من متعددات تشيبيشيف أن يتكيف ديناميكيًا مع ميزات إشارة IMU المختلفة
  2. تحسين الكفاءة الحسابية: تحقق وحدة EKSA نمذجة التبعيات العامة بتعقيد زمني خطي
  3. قوة الضوضاء: عدم التغير لمعامل ارتباط بيرسون ضد الانحياز والضوضاء المكتسبة يحسن قوة النظام

إعداد التجارب

مجموعات البيانات

استخدام خمس مجموعات بيانات قصور ذاتي عامة:

  • IMUNet، RoNIN، RIDI، RNIN، TLIO
  • تم تقسيم مجموعات البيانات عشوائيًا بنسبة 8:1:1 إلى مجموعات التدريب والتحقق والاختبار
  • تم بناء مجموعة بيانات TLIO (بدون جاذبية) بشكل خاص لتحليل تأثير الجاذبية

مقاييس التقييم

  1. خطأ انجراف الموضع (PDE): خطأ انجراف نقطة النهاية
  2. خطأ المسار النسبي (RTE): دقة المسار المحلي
  3. خطأ المسار المطلق (ATE): دقة التحديد الموقعي العام

طرق المقارنة

  • RoNIN (ResNet، TCN، متغيرات LSTM)
  • IMUNet
  • شبكة TLIO
  • شبكة RNIN

تفاصيل التنفيذ

  • GPU: NVIDIA RTX A40 (48 GB)
  • معدل التعلم: 10⁻⁴
  • حجم الدفعة: 512
  • عدد الحقب: 100
  • إصدار CUDA: 11.3
  • إصدار PyTorch: 1.11

نتائج التجارب

النتائج الرئيسية

تُظهر مقارنة الأداء عبر مجموعات البيانات على خمس مجموعات بيانات أن CKANIO يتفوق باستمرار على طرق المقارنة على معظم مجموعات البيانات:

الأداء على مجموعة بيانات RoNIN:

  • ATE: 5.365m → 3.814m (مقارنة بـ RoNIN ResNet)
  • RTE: 3.390m → 3.272m

الأداء الإجمالي: حقق CKANIO أفضل قيم ATE و RTE أو قريبة من الأفضل على جميع مجموعات البيانات المختبرة.

تحليل تأثير الجاذبية

أظهرت التجارب أن إزالة تسارع الجاذبية في الإطار الإحداثي العام يقلل بشكل كبير من خطأ جميع الخوارزميات تقريبًا:

  • تعمل الجاذبية كانحياز ثابت في الإطار الإحداثي المحاذي عالميًا
  • تؤدي إزالة مكون الجاذبية إلى أن تعكس قياسات مقياس التسارع بشكل أفضل الحركة الانتقالية للناقل
  • تحسن تأثير التعلم والاستقرار العددي

دراسات الاستئصال

  • CKANIO (بدون EKSA): استخدام ResCKAN وحده يتفوق بالفعل على RoNIN ResNet
  • CKANIO الكامل: يؤدي إضافة EKSA إلى تقليل إضافي لـ ATE و RTE، مع تحسين دقة التنبؤ بالسرعة

التحليل المرئي

يُظهر مقارنة المسارات:

  1. في السيناريوهات البسيطة، ينحرف RoNIN ResNet تدريجيًا بسبب تراكم خطأ الاتجاه، بينما يُظهر CKANIO قوة ضوضاء أقوى
  2. في السيناريوهات المعقدة، يُظهر RoNIN ResNet انجرافًا واضحًا بعد المناورات غير الخطية مثل الدوران، ويمكن لـ CKANIO التقاط هذه الخصائص الديناميكية بشكل أفضل

الأعمال ذات الصلة

طرق IO التقليدية

تعتمد بشكل أساسي على ميكانيكا نيوتن لتقدير الموضع والاتجاه، لكنها تتأثر بضوضاء IMU مما يؤدي إلى تراكم الأخطاء.

طرق IO المدفوعة بالبيانات

تتعلم أنماط الحركة من بيانات IMU واسعة النطاق، وتتفوق على الطرق التقليدية من حيث الدقة والقابلية للتطبيق، لكنها لا تزال محدودة في نمذجة الحركة غير الخطية المعقدة.

شبكات KAN

تحل شبكات Kolmogorov-Arnold محل دوال التفعيل الثابتة التقليدية بدوال تفعيل قابلة للتعلم، مما يُظهر قدرة تقريب غير خطية ممتازة في مجالات مختلفة.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. نجح CKANIO في إدخال Chebyshev KAN إلى مجال IO، مما حسّن بشكل كبير قدرة نمذجة الحركة غير الخطية
  2. تعمل وحدة EKSA على موازنة فعالة بين الأداء والكفاءة الحسابية
  3. لإزالة الجاذبية تأثير إيجابي كبير على أداء IO

القيود

  1. تم التحقق منها فقط على إشارات IMU للمشاة، مع نقص التقييم لأنواع ناقلات أخرى
  2. التعقيد الحسابي، على الرغم من التحسن، لا يزال أعلى مقارنة بالطرق التقليدية
  3. تحتاج قدرة التعامل مع أنماط الحركة القصوى إلى مزيد من التحقق

الاتجاهات المستقبلية

يقترح المؤلفون توسيع التقييم ليشمل إشارات IMU غير الخاصة بالمشاة كاتجاه بحثي واعد.

التقييم المتعمق

المزايا

  1. قوة الابتكار التقني: إدخال KAN إلى مجال IO للمرة الأولى، ذو أهمية رائدة
  2. أساس نظري متين: توفر نظرية التقريب غير الخطي لمتعددات تشيبيشيف أساسًا قويًا للطريقة
  3. تصميم تجريبي شامل: تجارب مقارنة على خمس مجموعات بيانات ودراسات استئصال مفصلة
  4. قيمة عملية عالية: تحسين الدقة بشكل كبير مع الحفاظ على الكفاءة الحسابية

أوجه القصور

  1. نطاق التطبيق محدود: تم التحقق منها فقط في سيناريوهات المشاة، مع عدم التأكد من القابلية للتعميم للتطبيقات الصناعية
  2. التحليل النظري غير كافٍ: يفتقر إلى شرح نظري لسبب ملاءمة متعددات تشيبيشيف بشكل خاص لإشارات IMU
  3. تحليل النفقات الحسابية غير كافٍ: على الرغم من تقليل التعقيد، يفتقر إلى مقارنة وقت التشغيل الفعلي

التأثير

  1. التأثير الأكاديمي: إدخال نموذج معماري جديد إلى مجال IO
  2. القيمة العملية: توفير مسار تقني جديد لأجهزة التحديد الموقعي على مستوى المستهلك
  3. قابلية التكرار: إعدادات تجريبية مفصلة تساعد البحث اللاحق

السيناريوهات القابلة للتطبيق

  1. التحديد الموقعي الداخلي للأجهزة المحمولة الاستهلاكية
  2. أنظمة الملاحة في بيئات الحرمان من GPS
  3. أنظمة الملاحة بالقصور الذاتي عالية الدقة للروبوتات

المراجع

تستشهد الورقة البحثية بـ 26 مرجعًا ذا صلة، تغطي مجالات متعددة بما في ذلك الملاحة بالقصور الذاتي والتعلم العميق وشبكات KAN، مما يوفر أساسًا نظريًا شاملاً ومعايير مقارنة لهذا البحث.