2025-11-21T07:10:15.718224

CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry

Zhang, Wang, Wen et al.
Inertial odometry (IO) relies exclusively on signals from an inertial measurement unit (IMU) for localization and offers a promising avenue for consumer grade positioning. However, accurate modeling of the nonlinear motion patterns present in IMU signals remains the principal limitation on IO accuracy. To address this challenge, we propose CKANIO, an IO framework that integrates Chebyshev based Kolmogorov-Arnold Networks (Chebyshev KAN). Specifically, we design a novel residual architecture that leverages the nonlinear approximation capabilities of Chebyshev polynomials within the KAN framework to more effectively model the complex motion characteristics inherent in IMU signals. To the best of our knowledge, this work represents the first application of an interpretable KAN model to IO. Experimental results on five publicly available datasets demonstrate the effectiveness of CKANIO.
academic

CKANIO: জড় ওডোমেট্রির জন্য শিক্ষণযোগ্য চেবিশেভ বহুপদ

মৌলিক তথ্য

  • পেপার আইডি: 2507.16865
  • শিরোনাম: CKANIO: Learnable Chebyshev Polynomials for Inertial Odometry
  • লেখক: Shanshan Zhang, Siyue Wang, Tianshui Wen, Liqin Wu, Qi Zhang, Ziheng Zhou, Ao Peng, Xuemin Hong, Lingxiang Zheng, Yu Yang
  • শ্রেণীবিভাগ: cs.RO (রোবোটিক্স)
  • প্রকাশনার সময়: ২৫ অক্টোবর, ২০২৫ (arXiv v2)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2507.16865

সারসংক্ষেপ

জড় ওডোমেট্রি (IO) শুধুমাত্র জড় পরিমাপ ইউনিট (IMU) সংকেতের উপর নির্ভর করে অবস্থান নির্ধারণ করে, যা ভোক্তা-স্তরের অবস্থান নির্ধারণের জন্য একটি প্রতিশ্রুতিশীল পথ প্রদান করে। তবে, IMU সংকেতে বিদ্যমান অরৈখিক গতি প্যাটার্নগুলি সঠিকভাবে মডেল করা IO নির্ভুলতার প্রধান সীমাবদ্ধতা রয়ে গেছে। এই চ্যালেঞ্জ মোকাবেলা করার জন্য, লেখকরা CKANIO প্রস্তাব করেছেন, যা চেবিশেভ-ভিত্তিক Kolmogorov-Arnold নেটওয়ার্ক (Chebyshev KAN) সংহত করে একটি IO কাঠামো। বিশেষভাবে, একটি উপন্যাস অবশিষ্ট স্থাপত্য ডিজাইন করা হয়েছে যা KAN কাঠামোর মধ্যে চেবিশেভ বহুপদের অরৈখিক অনুমান ক্ষমতা ব্যবহার করে IMU সংকেতে অন্তর্নিহিত জটিল গতি বৈশিষ্ট্যগুলি আরও কার্যকরভাবে মডেল করে। লেখকদের জ্ঞান অনুযায়ী, এটি IO-তে ব্যাখ্যাযোগ্য KAN মডেল প্রয়োগের প্রথম কাজ। পাঁচটি জনসাধারণের ডেটাসেটে পরীক্ষামূলক ফলাফল CKANIO এর কার্যকারিতা প্রমাণ করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

জড় ওডোমেট্রি (IO) হল একটি কৌশল যা শুধুমাত্র IMU সেন্সর ব্যবহার করে অবস্থান এবং অভিমুখ অনুমান করে, স্বয়ংচালিত গাড়ি, রোবট নেভিগেশন এবং অন্যান্য ক্ষেত্রে গুরুত্বপূর্ণ প্রয়োগ মূল্য রয়েছে। যখন GPS সংকেত উপলব্ধ নয় বা বাহ্যিক সেন্সর সীমাবদ্ধ থাকে, তখন IO পরিপূরক বা বিকল্প অবস্থান নির্ধারণ সমাধান হিসাবে কাজ করতে পারে।

মূল সমস্যা

  1. ত্রুটি সংগ্রহের সমস্যা: ঐতিহ্যবাহী নিউটনীয় মেকানিক্স-ভিত্তিক IO পদ্ধতি IMU-এর অন্তর্নিহিত পরিমাপ শব্দের কারণে সময়ের সাথে ত্রুটি সংগ্রহ করে, যা দীর্ঘ দূরত্বের অবস্থান নির্ধারণ নির্ভুলতাকে গুরুতরভাবে প্রভাবিত করে
  2. অরৈখিক গতি মডেলিং কঠিনতা: IMU সংকেতে জটিল অরৈখিক গতি প্যাটার্ন (যেমন ঘূর্ণন) সঠিকভাবে মডেল করা কঠিন
  3. স্থির সক্রিয়করণ ফাংশনের সীমাবদ্ধতা: বিদ্যমান ডেটা-চালিত পদ্ধতিগুলি স্থির সক্রিয়করণ ফাংশনের উপর নির্ভর করে, IMU সংকেতের জটিল গতিশীলতা সম্পূর্ণভাবে ক্যাপচার করতে পারে না

গবেষণা প্রেরণা

Kolmogorov-Arnold নেটওয়ার্ক (KAN) অরৈখিক ফাংশন অনুমানে উৎকৃষ্ট কর্মক্ষমতা দ্বারা অনুপ্রাণিত, লেখকরা ঐতিহ্যবাহী স্থির সক্রিয়করণ ফাংশনগুলি প্রতিস্থাপন করতে চেবিশেভ বহুপদ-ভিত্তিক KAN ব্যবহার করার প্রস্তাব করেছেন, যাতে IMU সংকেতে জটিল অরৈখিক বৈশিষ্ট্যগুলি আরও ভালভাবে মডেল করা যায়।

মূল অবদান

  1. Chebyshev KAN-কে প্রথমবারের জন্য IO ক্ষেত্রে প্রবর্তন: একটি অবশিষ্ট নেটওয়ার্ক স্থাপত্য ডিজাইন করা হয়েছে যা চেবিশেভ বহুপদের অরৈখিক অনুমান ক্ষমতা ব্যবহার করে অরৈখিক গতিশীলতার প্রতি মডেলের প্রতিনিধিত্ব ক্ষমতা বৃদ্ধি করে
  2. দক্ষ কার্নেল-ভিত্তিক স্ব-মনোযোগ মডিউল (EKSA) বিকাশ: প্রসঙ্গ গতি মডেলিং উন্নত করে, IMU সংকেতের আরও ব্যাপক ব্যবহার অর্জন করে, একই সাথে গণনা জটিলতা O(L²) থেকে O(L) এ হ্রাস করে
  3. IO নির্ভুলতার উপর অভিকর্ষের প্রভাবের প্রথম পরিমাণগত বিশ্লেষণ প্রদান: বৈশ্বিক সমন্বয় ব্যবস্থায় অভিকর্ষের IO কর্মক্ষমতার উপর নির্দিষ্ট প্রভাব পরিমাণগতভাবে বিশ্লেষণ করে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

সময় উইন্ডোর মধ্যে IMU সংকেত X ∈ R^(C×L) দেওয়া (যেখানে C=6 তিন-অক্ষ ত্বরণ এবং তিন-অক্ষ কৌণিক বেগ প্রতিনিধিত্ব করে, L নমুনা পয়েন্টের সংখ্যা), বেগ ভেক্টর v̂ পূর্বাভাস দিন, প্রকৃত বেগ v এর সাথে গড় বর্গ ত্রুটি কমিয়ে দিন।

মডেল স্থাপত্য

1. অবশিষ্ট চেবিশেভ KAN (ResCKAN)

ইনপুট প্রাক-প্রক্রিয়াকরণ:

X' = arccos(tanh(X)) ∈ (0,π)^(C×L)

tanh ফাংশনের মাধ্যমে ইনপুটকে (-1,1) পরিসরে সীমাবদ্ধ করুন, তারপর সংখ্যাগতভাবে স্থিতিশীল পর্যায় প্রতিনিধিত্ব পেতে arccos ব্যবহার করুন।

চেবিশেভ বহুপদ সংজ্ঞা:

T_n(x) = cos(n·arccos(x))  (x ∈ [-1,1])

শিক্ষণযোগ্য সক্রিয়করণ ফাংশন:

Y = Σ(i=0 to n) W_i × T_i(tanh(X))

যেখানে W_i শিক্ষণযোগ্য পরামিতি টেনসর, n=4 বহুপদ ক্রম। এই ডিজাইন সক্রিয়করণ ফাংশনকে IMU সংকেত বৈশিষ্ট্যের সাথে গতিশীলভাবে খাপ খাইয়ে নিতে সক্ষম করে।

2. দক্ষ কার্নেল-ভিত্তিক স্ব-মনোযোগ (EKSA)

মূল ধারণা: সম্পূর্ণ মনোযোগ ম্যাট্রিক্স স্পষ্টভাবে গণনা এড়াতে কার্নেল ফাংশন ব্যবহার করে মনোযোগ ম্যাট্রিক্স অনুমান করুন।

পিয়ারসন সম্পর্ক সহগ সাদৃশ্য:

ρ(q,k)² = (q̄ᵀk̄ / (||q̄|| ||k̄||))²

যেখানে q̄ = q - μ(q), k̄ = k - μ(k), এই পরিমাপ IMU সংকেতে সাধারণ অফসেট এবং লাভ শব্দের প্রতি শক্তিশালী।

সূচকীয় কার্নেল ফাংশন:

K_F(q,k) = exp(ρ(q,k)²)

টেইলর সম্প্রসারণ অনুমান:

K_F(q,k) = Σ(n=0 to ∞) (q̃²ⁿ/√n!) · (k̃²ⁿ/√n!)ᵀ

EKSA গণনা:

EKSA(Q,K,V) = f_Q(f_K^T V)

জটিলতা O(C_R L_R²) থেকে O(L_R C_R²) এ হ্রাস করুন।

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. অভিযোজিত অরৈখিক মডেলিং: চেবিশেভ বহুপদের শিক্ষণযোগ্য সমন্বয় বিভিন্ন IMU সংকেত বৈশিষ্ট্যের সাথে গতিশীলভাবে খাপ খাইয়ে নিতে পারে
  2. গণনা দক্ষতা অপ্টিমাইজেশন: EKSA মডিউল বৈশ্বিক নির্ভরতা মডেলিংয়ের জন্য রৈখিক সময় জটিলতা অর্জন করে
  3. শব্দ শক্তিশালীতা: পিয়ারসন সম্পর্ক সহগের অফসেট এবং লাভ শব্দের অপরিবর্তনীয়তা সিস্টেমের শক্তিশালীতা বৃদ্ধি করে

পরীক্ষামূলক সেটআপ

ডেটাসেট

পাঁচটি জনসাধারণের জড় ডেটাসেট ব্যবহার করুন:

  • IMUNet, RoNIN, RIDI, RNIN, TLIO
  • ডেটাসেটগুলি 8:1:1 অনুপাতে প্রশিক্ষণ, যাচাইকরণ এবং পরীক্ষা সেটে র্যান্ডমভাবে বিভক্ত করা হয়
  • অভিকর্ষ প্রভাব বিশ্লেষণের জন্য বিশেষভাবে TLIO (w/o gravity) ডেটাসেট তৈরি করা হয়েছে

মূল্যায়ন মেট্রিক্স

  1. Position Drift Error (PDE): শেষ বিন্দু ড্রিফট ত্রুটি
  2. Relative Trajectory Error (RTE): স্থানীয় ট্র্যাজেক্টরি নির্ভুলতা
  3. Absolute Trajectory Error (ATE): বৈশ্বিক অবস্থান নির্ধারণ নির্ভুলতা

তুলনা পদ্ধতি

  • RoNIN (ResNet, TCN, LSTM ভেরিয়েন্ট)
  • IMUNet
  • TLIO নেটওয়ার্ক
  • RNIN নেটওয়ার্ক

বাস্তবায়ন বিবরণ

  • GPU: NVIDIA RTX A40 (48 GB)
  • শেখার হার: 10⁻⁴
  • ব্যাচ আকার: 512
  • প্রশিক্ষণ যুগ: 100
  • CUDA সংস্করণ: 11.3
  • PyTorch সংস্করণ: 1.11

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

পাঁচটি ডেটাসেটে ক্রস-ডেটাসেট কর্মক্ষমতা তুলনা দেখায় যে CKANIO বেশিরভাগ ডেটাসেটে ধারাবাহিকভাবে তুলনা পদ্ধতির চেয়ে ভাল:

RoNIN ডেটাসেট কর্মক্ষমতা:

  • ATE: 5.365m → 3.814m (RoNIN ResNet এর তুলনায়)
  • RTE: 3.390m → 3.272m

সামগ্রিক কর্মক্ষমতা: CKANIO সমস্ত পরীক্ষা ডেটাসেটে সর্বোত্তম বা কাছাকাছি সর্বোত্তম ATE এবং RTE মান অর্জন করেছে।

অভিকর্ষ প্রভাব বিশ্লেষণ

পরীক্ষা দেখায় যে বৈশ্বিক সমন্বয় ব্যবস্থায় অভিকর্ষ ত্বরণ অপসারণ প্রায় সমস্ত অ্যালগরিদমের ত্রুটি উল্লেখযোগ্যভাবে হ্রাস করে:

  • অভিকর্ষ বৈশ্বিক সারিবদ্ধ সমন্বয় ব্যবস্থায় একটি ধ্রুবক পক্ষপাত হিসাবে কাজ করে
  • অভিকর্ষ উপাদান অপসারণ ত্বরণমাপক পরিমাপকে বাহক অনুবাদ গতি আরও ভালভাবে প্রতিফলিত করতে করে তোলে
  • শেখার প্রভাব এবং সংখ্যাগত স্থিতিশীলতা উন্নত করে

অপসারণ পরীক্ষা

  • CKANIO (w/o EKSA): শুধুমাত্র ResCKAN ব্যবহার করে ইতিমধ্যে RoNIN ResNet এর চেয়ে ভাল
  • সম্পূর্ণ CKANIO: EKSA যোগ করার পরে ATE এবং RTE আরও হ্রাস পায়, বেগ পূর্বাভাস নির্ভুলতা উন্নত করে

ভিজ্যুয়ালাইজেশন বিশ্লেষণ

ট্র্যাজেক্টরি তুলনা দেখায়:

  1. সহজ দৃশ্যে, RoNIN ResNet সংগৃহীত শিরোনাম ত্রুটির কারণে ক্রমান্বয়ে বিচ্যুত হয়, যখন CKANIO শব্দ শক্তিশালীতায় শক্তিশালী কর্মক্ষমতা প্রদর্শন করে
  2. জটিল দৃশ্যে, RoNIN ResNet ঘূর্ণনের মতো অরৈখিক কৌশলের পরে স্পষ্ট ড্রিফট দেখায়, CKANIO এই গতিশীল বৈশিষ্ট্যগুলি আরও ভালভাবে ক্যাপচার করতে পারে

সম্পর্কিত কাজ

ঐতিহ্যবাহী IO পদ্ধতি

প্রধানত নিউটনীয় মেকানিক্স ব্যবহার করে অবস্থান এবং অভিমুখ অনুমান করে, তবে IMU শব্দ দ্বারা প্রভাবিত হয়ে ত্রুটি সংগ্রহ করে।

ডেটা-চালিত IO পদ্ধতি

বড় আকারের IMU ডেটা থেকে গতি প্যাটার্ন শিখে, নির্ভুলতা এবং প্রযোজ্যতার দিক থেকে ঐতিহ্যবাহী পদ্ধতির চেয়ে ভাল, তবে জটিল অরৈখিক গতি মডেলিংয়ে এখনও সীমাবদ্ধতা রয়েছে।

KAN নেটওয়ার্ক

Kolmogorov-Arnold নেটওয়ার্ক ঐতিহ্যবাহী স্থির সক্রিয়করণ ফাংশনগুলি শিক্ষণযোগ্য সক্রিয়করণ ফাংশন দিয়ে প্রতিস্থাপন করে, বিভিন্ন ক্ষেত্রে উৎকৃষ্ট অরৈখিক অনুমান ক্ষমতা প্রদর্শন করে।

সিদ্ধান্ত এবং আলোচনা

প্রধান সিদ্ধান্ত

  1. CKANIO সফলভাবে চেবিশেভ KAN-কে IO ক্ষেত্রে প্রবর্তন করেছে, অরৈখিক গতি মডেলিং ক্ষমতা উল্লেখযোগ্যভাবে উন্নত করেছে
  2. EKSA মডিউল কর্মক্ষমতা এবং গণনা দক্ষতার মধ্যে কার্যকরভাবে ভারসাম্য রাখে
  3. অভিকর্ষ অপসারণ IO কর্মক্ষমতায় উল্লেখযোগ্য ইতিবাচক প্রভাব ফেলে

সীমাবদ্ধতা

  1. শুধুমাত্র পথচারী IMU সংকেতে যাচাই করা হয়েছে, অন্যান্য বাহক প্রকারের মূল্যায়নের অভাব
  2. গণনা জটিলতা উন্নত হলেও ঐতিহ্যবাহী পদ্ধতির তুলনায় এখনও বেশি
  3. চরম গতি প্যাটার্নের পরিচালনা ক্ষমতা আরও যাচাইয়ের অপেক্ষায় রয়েছে

ভবিষ্যত দিকনির্দেশনা

লেখকরা মূল্যায়ন অ-পথচারী IMU সংকেতে প্রসারিত করা একটি প্রতিশ্রুতিশীল গবেষণা দিক হিসাবে প্রস্তাব করেছেন।

গভীর মূল্যায়ন

সুবিধা

  1. শক্তিশালী প্রযুক্তিগত উদ্ভাবনীতা: প্রথমবারের জন্য KAN-কে IO ক্ষেত্রে প্রবর্তন করে, যা যুগান্তকারী তাৎপর্য রাখে
  2. দৃঢ় তাত্ত্বিক ভিত্তি: চেবিশেভ বহুপদের অরৈখিক অনুমান তত্ত্ব পদ্ধতির জন্য একটি শক্তিশালী ভিত্তি প্রদান করে
  3. ব্যাপক পরীক্ষামূলক ডিজাইন: পাঁচটি ডেটাসেটের তুলনা পরীক্ষা এবং বিস্তারিত অপসারণ গবেষণা
  4. উচ্চ ব্যবহারিক মূল্য: গণনা দক্ষতা বজায় রেখে নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত করে

অপূর্ণতা

  1. সীমিত প্রযোজ্যতার পরিসীমা: শুধুমাত্র পথচারী দৃশ্যে যাচাই করা হয়েছে, শিল্প প্রয়োগের সাধারণীকরণ যাচাইয়ের অপেক্ষায়
  2. অপর্যাপ্ত তাত্ত্বিক বিশ্লেষণ: চেবিশেভ বহুপদ কেন বিশেষভাবে IMU সংকেতের জন্য উপযুক্ত তার তাত্ত্বিক ব্যাখ্যার অভাব
  3. গণনা ওভারহেড বিশ্লেষণ অপর্যাপ্ত: জটিলতা হ্রাস করা হয়েছে, তবে প্রকৃত চলমান সময়ের তুলনার অভাব

প্রভাব

  1. একাডেমিক প্রভাব: IO ক্ষেত্রে নতুন নেটওয়ার্ক স্থাপত্য প্যারাডাইম প্রবর্তন করে
  2. ব্যবহারিক মূল্য: ভোক্তা-স্তরের অবস্থান নির্ধারণ ডিভাইসের জন্য নতুন প্রযুক্তি পথ প্রদান করে
  3. পুনরুৎপাদনযোগ্যতা: বিস্তারিত পরীক্ষামূলক সেটআপ, পরবর্তী গবেষণা সহায়তা করে

প্রযোজ্য দৃশ্য

  1. ভোক্তা-স্তরের মোবাইল ডিভাইসের অভ্যন্তরীণ অবস্থান নির্ধারণ
  2. GPS অস্বীকৃত পরিবেশে নেভিগেশন সিস্টেম
  3. উচ্চ-নির্ভুলতা জড় নেভিগেশন প্রয়োজনীয় রোবট সিস্টেম

সংদর্ভ

পেপারটি 26টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, যা জড় নেভিগেশন, গভীর শেখা, KAN নেটওয়ার্ক এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, এই গবেষণার জন্য সমৃদ্ধ তাত্ত্বিক ভিত্তি এবং তুলনা মানদণ্ড প্রদান করে।