এই পেপারটি একটি ইউনিফাইড গাউসিয়ান প্রসেস (জিপি) রিগ্রেশন ফ্রেমওয়ার্ক ভিত্তিক অ্যাসিঙ্ক্রোনাস ইভেন্ট-ইনার্শিয়াল অডোমেট্রি পদ্ধতি প্রস্তাব করে, যা অ্যাসিঙ্ক্রোনাস ডেটা সংযোগ এবং ইনার্শিয়াল পরিমাপের প্রাকৃতিক সংমিশ্রণের জন্য ব্যবহৃত হয়। এই পদ্ধতিটি জিপি লেটেন্ট ভেরিয়েবল মডেল ব্যবহার করে ডেটা-চালিত গতি পূর্বাভাস তৈরি করে এবং বিশ্লেষণাত্মক ইন্টিগ্রেশন ক্ষমতা অর্জন করে, তারপর একই জিপি ফ্রেমওয়ার্কের অধীনে অ্যাসিঙ্ক্রোনাস ইভেন্ট বৈশিষ্ট্য সংযোগ এবং ইন্টিগ্রেটেড সিউডো-পরিমাপকে ঘনিষ্ঠভাবে সংযুক্ত করে। স্লাইডিং উইন্ডো ফ্যাক্টর গ্রাফ সমাধানকারী ব্যবহার করে সংমিশ্রণ অনুমান সমস্যা সমাধান করা হয় এবং স্পার্সিটি বিবেচনা করে ঐতিহাসিক অবস্থার ক্রমিক প্রান্তিককরণ করা হয়। লেখকরা একটি তুলনামূলক সিস্টেমও ডিজাইন করেছেন যা ঐতিহাসিক ইনার্শিয়াল প্রি-ইন্টিগ্রেশন স্কিমকে জিপি ফ্রেমওয়ার্কে এম্বেড করে। জনসাধারণের জন্য উপলব্ধ ইভেন্ট-ইনার্শিয়াল ডেটাসেটে মূল্যায়ন উভয় সিস্টেমের কার্যকারিতা প্রমাণ করে, এবং তুলনামূলক পরীক্ষা অত্যাধুনিক সিঙ্ক্রোনাস পদ্ধতির সাথে তুলনীয় নির্ভুলতা প্রদর্শন করে।
ইভেন্ট ক্যামেরা একটি জৈব-অনুপ্রাণিত ভিজ্যুয়াল সেন্সর যা অ্যাসিঙ্ক্রোনাস ট্রিগার মেকানিজম সহ আসে, প্রতিটি পিক্সেল স্তরে স্বাধীনভাবে আলোর তীব্রতা পরিবর্তন রেকর্ড করে। এই বিশেষ মেকানিজম ইভেন্ট ক্যামেরাকে ঐতিহ্যবাহী ক্যামেরার তুলনায় উল্লেখযোগ্য সুবিধা প্রদান করে: কম শক্তি খরচ, কম বিলম্ব, উচ্চ গতিশীল পরিসীমা এবং উচ্চ সময়ের রেজোলিউশন। তবে, ইভেন্ট ক্যামেরার অ্যাসিঙ্ক্রোনাস প্রকৃতি ঐতিহ্যবাহী সংমিশ্রণ অ্যালগরিদমের জন্য বিশাল চ্যালেঞ্জ উপস্থাপন করে।
ইভেন্ট ক্যামেরার উচ্চ সময়ের রেজোলিউশন বৈশিষ্ট্যকে সম্পূর্ণভাবে কাজে লাগানোর জন্য, অ্যাসিঙ্ক্রোনাস এবং উচ্চ সময়ের রেজোলিউশন ইভেন্ট-ইনার্শিয়াল পর্যবেক্ষণকে সংমিশ্রণ করার জন্য নতুন পদ্ধতি চালু করার জরুরি প্রয়োজন। এই পেপারটি অ্যাসিঙ্ক্রোনাস পরিমাপ সংমিশ্রণ পদ্ধতির সমস্যার উপর দৃষ্টি নিবদ্ধ করে এবং ইউনিফাইড জিপি ফ্রেমওয়ার্ক ভিত্তিক সমাধান প্রস্তাব করে।
ইনপুট: অ্যাসিঙ্ক্রোনাস ইভেন্ট স্ট্রিম এবং আইএমইউ পরিমাপ ডেটা আউটপুট: SE(3) ট্র্যাজেক্টরি অনুমান (অবস্থান, মনোভাব এবং বেগ অন্তর্ভুক্ত) সীমাবদ্ধতা: অ্যাসিঙ্ক্রোনাস ডেটা সংযোগ পরিচালনা করা, গণনামূলক দক্ষতা বজায় রাখা
সাদা শব্দ ত্বরণ (WNOA) গতি পূর্বাভাস ব্যবহার করে SE(3) মডেল করা:
Ṫwb(t) = Twb(t)ϖbwb(t)∧
ϖ̇bwb(t) = w(t), w(t) ∼ GP(0,Qcδ(t-t'))
যেখানে ϖbwb(t) হল বডি কোঅর্ডিনেট সিস্টেম বেগ, w(t) হল সাধারণীকৃত ত্বরণ ভেক্টর যা শূন্য-মানের সাদা শব্দ জিপি হিসাবে মডেল করা হয়।
আপেক্ষিক ত্বরণ এবং ঘূর্ণন ভেক্টর বেগকে স্বাধীন জিপি হিসাবে মডেল করা:
ṙbkb(t) ∼ GP(0,kr(t,t'))
abbk(t) ∼ GP(0,ka(t,t'))
লেটেন্ট স্টেট ρ̂ এবং α̂ এর মাধ্যমে জিপির শব্দ পর্যবেক্ষণ অর্জন করা, তারপর জিপির অনুমান ক্ষমতা ব্যবহার করে প্রি-ইন্টিগ্রেশন বেগ, অবস্থান এবং ঘূর্ণন বৃদ্ধি গণনা করা।
সম্পূর্ণ সিস্টেম দুটি সমান্তরাল থ্রেড অন্তর্ভুক্ত করে:
উভয় পদ্ধতি একই জিপি ফ্রেমওয়ার্কের অধীনে কাজ করে, কিন্তু আইএমইউ ডেটা প্রক্রিয়াকরণের উপায় ভিন্ন:
জিপি ইন্টারপোলেশনের মাধ্যমে পরিমাপ সময় tτ এ অবস্থান Twbτ অর্জন করা, ভিজ্যুয়াল অবশিষ্টাংশ ত্রুটি সংজ্ঞায়িত করা:
rV(Twbτ, li, ẑi) = ẑi - (1/di)K(TwbτTbτcτ)T li
গতিশীল প্রান্তিককরণ কৌশল গ্রহণ করা, সর্বশেষ অবস্থা এবং সম্পর্কিত ল্যান্ডমার্ক পয়েন্টগুলির প্রান্তিককরণকে অগ্রাধিকার দেওয়া, Hessian ম্যাট্রিক্সের স্পার্স কাঠামো বজায় রাখা।
| ক্রম | CT-IMU | GP-IMU | Ref.4 | Ref.3 |
|---|---|---|---|---|
| গতিশীল অনুবাদ | ০.০৩০ | ০.০৬০ | ০.০৫৬ | ০.০৩৭ |
| গতিশীল ৬dof | ০.০৭৬ | ০.০৫৬ | ০.০৭৩ | ০.০৪০ |
| পোস্টার অনুবাদ | ০.০৮৭ | ০.০৮২ | ০.২৪২ | ০.০৮৭ |
| পোস্টার ৬dof | ০.১৫৬ | ০.০৮৪ | ০.২১০ | ০.১৯৭ |
| বক্স ৬dof | ০.৩৪৭ | ০.১৫১ | ০.০৭৩ | ০.০৭৮ |
| আকৃতি ৬dof | ০.১০৮ | ০.২৪৪ | --- | ০.১৬৩ |
১. নির্ভুলতা কর্মক্ষমতা: উভয় পদ্ধতি বেশিরভাগ ক্রমে বিচ্ছিন্ন অপটিমাইজেশন পদ্ধতির সাথে তুলনীয় নির্ভুলতা প্রদর্শন করে, কিছু ক্রমে আরও ভাল কর্মক্ষমতা প্রদর্শন করে २. গণনামূলক দক্ষতা: GP-IMU কম ভেরিয়েবলের কারণে সাধারণত কম গণনার খরচ রাখে ३. দৃঢ়তা: GP-IMU আইএমইউ শব্দের প্রতি আরও সংবেদনশীল, কারণ এটি আইএমইউ-চালিত জিপি নির্মাণের উপর নির্ভর করে ভিজ্যুয়াল অবশিষ্টাংশ তৈরি করতে
| পদ্ধতি | ফ্রন্টএন্ড | অপটিমাইজেশন | প্রান্তিককরণ | আইএমইউ প্রি-ইন্টিগ্রেশন | অন্যান্য |
|---|---|---|---|---|---|
| CT-IMU(s) | ১२७३.९७ | २४७.८३४ | ३.९५१ | ०.१७७ | ०.७४३ |
| GP-IMU(s) | १२७४.५१ | १८२.०५४ | ४.९१४ | ४.७१३ | ०.६९३ |
EKLT ট্র্যাকার মোট সময়ের প্রায় ৮০% দখল করে, সবচেয়ে সময়সাপেক্ষ অংশ। GP-IMU গ্রাফ অপটিমাইজেশনে দ্রুত, কিন্তু আইএমইউ প্রি-ইন্টিগ্রেশন সামান্য ধীর।
१. ফ্রেম-ভিত্তিক বিচ্ছিন্ন সময় পদ্ধতি: ঐতিহ্যবাহী ফ্রেম ক্যামেরা অ্যালগরিদম উত্তরাধিকার, ইভেন্ট জমা ডেটা সংযোগ পরিচালনা করা २. ইভেন্ট-চালিত ক্রমাগত সময় পদ্ধতি: সরাসরি ইভেন্ট স্ট্রিম প্রক্রিয়া করা, ক্রমাগত সময় ব্যাকএন্ড গ্রহণ করা
জিপি ক্রমাগত সময় প্রতিনিধিত্ব পদ্ধতি প্রাথমিকভাবে স্ক্যান লেজার রাডার এবং অ-সিঙ্ক্রোনাস সেন্সরের গতি ট্র্যাজেক্টরি অনুমানের জন্য ব্যবহৃত হয়। সাম্প্রতিক গবেষণা একক ইভেন্ট ভিজ্যুয়াল অডোমেট্রি সিস্টেমে জিপি প্রয়োগ করে, কিন্তু উচ্চ গণনার খরচের সমস্যা রয়েছে।
१. প্রস্তাবিত দুটি জিপি পদ্ধতি উভয়ই অ্যাসিঙ্ক্রোনাস ইভেন্ট-ইনার্শিয়াল সংমিশ্রণ সমস্যা কার্যকরভাবে পরিচালনা করতে পারে २. GP-IMU বেশিরভাগ ক্রমে উচ্চতর নির্ভুলতা রয়েছে, কিন্তু আইএমইউ শব্দের প্রতি আরও সংবেদনশীল ३. স্লাইডিং উইন্ডো কৌশল কার্যকরভাবে গণনামূলক জটিলতা নিয়ন্ত্রণ করে ४. পদ্ধতি জটিল গতি দৃশ্যে প্রতিযোগিতামূলক কর্মক্ষমতা প্রদর্শন করে
१. রিয়েল-টাইম সমস্যা: সমস্ত ফ্রন্টএন্ড অ্যাসিঙ্ক্রোনাস পরিমাপ অপটিমাইজেশনের জন্য সংরক্ষণ করার কারণে, সিস্টেম বর্তমানে রিয়েল-টাইমে চলতে পারে না २. দৃঢ়তা অপর্যাপ্ত: বহিরাগত মূল্য বর্জন বা গতি ক্ষতিপূরণ প্রক্রিয়া অভাব ३. আইএমইউ গুণমান নির্ভরতা: GP-IMU পদ্ধতি আইএমইউ ডেটা গুণমানের উপর উচ্চ প্রয়োজনীয়তা রাখে ४. আক্রমণাত্মক গতি সীমাবদ্ধতা: তীব্র ত্বরণ পরিবর্তনের সময়, উভয় পদ্ধতি প্রভাবিত হতে পারে
१. তথ্য-তাত্ত্বিক গ্রাফ স্পার্সিফিকেশন কৌশল, রিয়েল-টাইম কর্মক্ষমতা অর্জন করা २. ফ্রন্টএন্ড উন্নতি, সিস্টেম দৃঢ়তা বৃদ্ধি করা ३. কম গুণমানের আইএমইউ এর জন্য অ্যালগরিদম অপটিমাইজেশন ४. আরও জটিল গতি প্যাটার্নে সম্প্রসারণ
१. তাত্ত্বিক উদ্ভাবন: ইউনিফাইড জিপি ফ্রেমওয়ার্ক চতুরতার সাথে অ্যাসিঙ্ক্রোনাস সংমিশ্রণ সমস্যা সমাধান করে, তাত্ত্বিক ভিত্তি দৃঢ় २. সিস্টেমেটিক গবেষণা: দ্বৈত সিস্টেম ডিজাইনের মাধ্যমে ব্যাপক তুলনামূলক বিশ্লেষণ প্রদান করে ३. পর্যাপ্ত পরীক্ষা: একাধিক জনসাধারণের ডেটাসেটে বিস্তৃত মূল্যায়ন পরিচালনা করে ४. প্রকৌশল বাস্তবায়ন: GTSAM ভিত্তিক বাস্তবায়ন পদ্ধতির পুনরুৎপাদনযোগ্যতা নিশ্চিত করে
१. রিয়েল-টাইম সীমাবদ্ধতা: বর্তমানে রিয়েল-টাইম অ্যাপ্লিকেশন প্রয়োজনীয়তা পূরণ করতে পারে না, ব্যবহারিক মূল্য সীমিত করে २. ফ্রন্টএন্ড নির্ভরতা: EKLT ফ্রন্টএন্ডের উপর অত্যধিক নির্ভরতা, অস্বাভাবিক পরিস্থিতিতে পরিচালনা অভাব ३. প্রযোজ্য পরিসীমা: আইএমইউ গুণমান এবং গতি ধরনে নির্দিষ্ট সীমাবদ্ধতা রয়েছে ४. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: দুটি পদ্ধতির তাত্ত্বিক পার্থক্যের গভীর বিশ্লেষণ অভাব
१. একাডেমিক মূল্য: ইভেন্ট ক্যামেরা এবং ইনার্শিয়াল সংমিশ্রণের জন্য নতুন তাত্ত্বিক ফ্রেমওয়ার্ক প্রদান করে २. ব্যবহারিক সম্ভাবনা: রিয়েল-টাইম সমস্যা সমাধানের পরে, রোবোট নেভিগেশন ইত্যাদি ক্ষেত্রে প্রয়োগের সম্ভাবনা রয়েছে ३. সম্প্রসারণযোগ্যতা: ফ্রেমওয়ার্ক ভাল সম্প্রসারণযোগ্যতা রয়েছে, অন্যান্য সেন্সর সংমিশ্রণ দৃশ্যে অভিযোজিত হতে পারে
१. উচ্চ গতিশীল পরিবেশ: ঐতিহ্যবাহী ক্যামেরা পরিচালনা করতে কঠিন উচ্চ-গতি গতি দৃশ্যের জন্য উপযুক্ত २. পর্যাপ্ত গণনা সম্পদ: নির্ভুলতা প্রয়োজনীয়তা উচ্চ, গণনা সম্পদ তুলনামূলকভাবে পর্যাপ্ত অ্যাপ্লিকেশনের জন্য উপযুক্ত ३. গবেষণা প্ল্যাটফর্ম: ইভেন্ট ক্যামেরা গবেষণার জন্য মূল্যবান বেঞ্চমার্ক পদ্ধতি প্রদান করে
এই পেপারটি ২৬টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা ইভেন্ট ক্যামেরা সমীক্ষা, আইএমইউ প্রি-ইন্টিগ্রেশন, ক্রমাগত সময় অনুমান, গাউসিয়ান প্রসেস রিগ্রেশন ইত্যাদি মূল ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, সাহিত্য উদ্ধৃতি ব্যাপক এবং কর্তৃপক্ষপূর্ণ।
সামগ্রিক মূল্যায়ন: এটি ইভেন্ট-ইনার্শিয়াল অডোমেট্রি ক্ষেত্রে উদ্ভাবনী কাজ, প্রস্তাবিত ইউনিফাইড জিপি ফ্রেমওয়ার্ক অ্যাসিঙ্ক্রোনাস সেন্সর সংমিশ্রণ পরিচালনার জন্য নতুন চিন্তাভাবনা প্রদান করে। যদিও রিয়েল-টাইম ইত্যাদি সীমাবদ্ধতা রয়েছে, তাত্ত্বিক অবদান উল্লেখযোগ্য, পরীক্ষামূলক মূল্যায়ন পর্যাপ্ত, এই ক্ষেত্রের পরবর্তী গবেষণার জন্য ভাল ভিত্তি স্থাপন করে।