2025-11-13T13:49:10.872331

Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation

Wang, Cheng, Wang et al.

Visual Teach-and-Repeat Navigation is a direct solution for mobile robot to be deployed in unknown environments. However, robust trajectory repeat navigation still remains challenged due to environmental changing and dynamic objects. In this paper, we propose a novel visual teach-and-repeat navigation system, which consists of a flexible map representation, robust map matching and a map-less local navigation module. During the teaching process, the recorded keyframes are formulated as a topo-metric graph and each node can be further extended to save new observations. Such representation also alleviates the requirement of globally consistent mapping. To enhance the place recognition performance during repeating process, instead of using frame-to-frame matching, we firstly implement keyframe clustering to aggregate similar connected keyframes into local map and perform place recognition based on visual frame-tolocal map matching strategy. To promote the local goal persistent tracking performance, a long-term goal management algorithm is constructed, which can avoid the robot getting lost due to environmental changes or obstacle occlusion. To achieve the goal without map, a local trajectory-control candidate optimization algorithm is proposed. Extensively experiments are conducted on our mobile platform. The results demonstrate that our system is superior to the baselines in terms of robustness and effectiveness.

academic

الملاحة البصرية القوية للتعليم والتكرار باستخدام تمثيل خريطة رسم بياني طوبولوجي-متري مرن

المعلومات الأساسية

معرّف الورقة: 2510.09089
العنوان: Robust Visual Teach-and-Repeat Navigation with Flexible Topo-metric Graph Map Representation
المؤلفون: Jikai Wang, Yunqi Cheng, Kezhi Wang, and Zonghai Chen (جامعة العلوم والتكنولوجيا بالصين)
التصنيف: cs.RO (الروبوتات)
تاريخ النشر: 10 أكتوبر 2025
رابط الورقة: https://arxiv.org/abs/2510.09089

الملخص

تقترح هذه الورقة نظام ملاحة بصري جديد للتعليم والتكرار، يعالج التحديات الناشئة عن التغييرات البيئية والأجسام الديناميكية من خلال تمثيل خريطة مرن وتطابق خريطة قوي ووحدة ملاحة محلية بدون خريطة. يستخدم النظام بنية رسم بياني طوبولوجي-متري لتخزين الإطارات الرئيسية، مع دعم توسيع العقد لحفظ الملاحظات الجديدة. يتم تحسين أداء التعرف على الموقع من خلال تجميع الإطارات الرئيسية واستراتيجيات مطابقة الإطار مع الخريطة المحلية، مع بناء خوارزمية إدارة الأهداف طويلة الأجل لمنع الروبوت من الضياع بسبب التغييرات البيئية أو حجب العوائق.

خلفية البحث والدافع

تعريف المشكلة

ملاحة التعليم والتكرار البصري (VTR) هي حل مباشر لنشر الروبوتات المتنقلة في بيئات غير معروفة، لكن تحقيق ملاحة مسار متكررة قوية في وجود التغييرات البيئية والأجسام الديناميكية لا يزال يشكل تحديًا.

الأهمية

القيمة العملية: تتجنب ملاحة VTR الحاجة إلى رسم خريطة كاملة للبيئة، مما يجعل نشر الروبوت أكثر كفاءة
احتياجات التطبيق: هناك طلب واسع في سيناريوهات الملاحة ذات المسار الثابت (مثل الملاحة بين محطات المصنع)
التحديات التقنية: يتطلب الحفاظ على قوة الملاحة في ظل التغييرات البيئية والأجسام الديناميكية والانحراف عن المسار

قيود الطرق الموجودة

مشاكل تمثيل الخريطة: تعتمد الطرق التقليدية على رسم خرائط متسقة عالميًا، مما يتطلب دقة تحديد موقع عالية
ضعف التعرف على الموقع: مطابقة الإطار مع الإطار ليست قوية بما يكفي في حالات تغيير وجهة النظر والحجب
اعتماد وحدة الملاحة: تعتمد الأنظمة الموجودة بشكل مفرط على التعرف الدقيق على الموقع، وتفشل بسهولة عند فشل المطابقة
ضعف التكيف البيئي: يصعب التعامل مع التغييرات البيئية والعوائق الديناميكية

المساهمات الأساسية

اقتراح طريقة تمثيل خريطة مرنة: تصميم بنية رسم بياني طوبولوجي-متري قابلة للتكيف مع التغييرات البيئية وأخطاء الانجراف الحسي
بناء نظام ملاحة VTR قوي: قادر على التكيف مع التغييرات البيئية والأجسام الديناميكية وحجب وجهة النظر، مع إمكانية دمج وحدة الملاحة في أنظمة VTR أخرى
تنفيذ نظام سهل الاستخدام: يسهل التكيف مع بيئات المهام الجديدة، مع قابلية عملية جيدة
التحقق من فعالية النظام: إجراء تجارب واسعة على منصات متنقلة، مما يثبت التفوق على طرق الأساس

شرح الطريقة

تعريف المهمة

تتضمن ملاحة VTR مرحلتين:

مرحلة التعليم: التحكم اليدوي بالروبوت للقيادة على طول مسار المهمة، مع تسجيل الإطارات البصرية في الوقت الفعلي كخريطة
مرحلة التكرار: يحاول الروبوت مطابقة الإطار البصري الحالي مع الخريطة، وتحديث الهدف التالي عند نجاح المطابقة

معمارية النظام

1. تحليل خطأ تمثيل الخريطة

يتم تمثيل خريطة SLAM التقليدية كـ:

M̂ = {[Ki, T̂WI], i = 1, ···, N}

حيث يحتوي تقدير الموضع العام على أخطاء انجراف تراكمية. يقترح هذا العمل التمثيل التالي:

M̄ = {[Ki, T̂ij], i, j = 1, ···, N}

يحتفظ كل إطار رئيسي فقط بتحويلات الموضع النسبي الموثوق به مع الإطارات الرئيسية المجاورة.

2. خريطة الإطارات الرئيسية الطوبولوجية-المترية

يتم تعريف الإطار الرئيسي كـ:

Ki = {Ti-1i, Ui, Pi, Ii}

يتضمن التحويل النسبي ونقاط الميزات ثنائية الأبعاد والموقع ثلاثي الأبعاد ومعلومات الصورة. عند اكتشاف حلقة، يتم توسيعه إلى:

Ki = {Ti-1i, Ui, Pi, Ii, TL(i)i, L(i)}

3. تقليل الزيادة في الخريطة

دمج الإطارات المتشابهة من خلال تجميع الإطارات الرئيسية:

حساب تشابه DBoW، والتوقف تحت الحد
تحويل نقاط الميزات ثلاثية الأبعاد للإطارات الرئيسية المتشابهة إلى نظام إحداثيات الإطار المحتفظ به
إزالة الإطارات الرئيسية الزائدة، مع الحفاظ على بنية القائمة المرتبطة

مرحلة التكرار البصري

1. مطابقة الإطار مع الإطار الرئيسي

استخدام استراتيجية البحث المقيدة:

Rn = {[u,v]T | ||[u,v]T - [un,vn]T||2 < γ}

البحث عن الميزات المقابلة في منطقة دائرية، وحل الموضع النسبي من خلال PnP.

2. توسيع الخريطة

عندما ينحرف الروبوت عن مسار التعليم، أضف الملاحظات الجديدة إلى الخريطة:

Ki = {Ti-1i, Ūi, P̄i, Ii, TL(i)i, L(i), TiS(i), S(i), {K}}

3. إدارة قائمة الأهداف

بناء قائمة أهداف بدلاً من هدف واحد:

Tkg0 = inv(Tik) · TiS(i)
Tkg1 = Tkg0 · TS(i)S(S(i))

يتم تحديث قائمة الأهداف Lg = {tg0, tg1, ···, tgM} عند نجاح المطابقة.

4. التخطيط الحركي المحلي

تحقيق تتبع أهداف متعددة من خلال تقييم المرشحات المسارية:

si = (1/3) Σ(m=0 to 2) (1 - (0.005 · Θ(tie - x, tgm - x))^(1/2))

النظر في أول ثلاثة أهداف للتقييم، واختيار المسار الأمثل.

إعداد التجربة

تكوين المنصة المتنقلة

الأجهزة: منصة محرك تفاضلي، مزودة بكاميرا مدمجة IMU (MYNTEYE-SC) وليدار (Livox Mid-360)
نظام التحديد: استخدام OpenVINS لقياس الحركة البصرية، وتسجيل iG-LIO للمسار للتقييم

مؤشرات التقييم

مسافة نقطة النهاية: المسافة بين نقطة النهاية الفعلية والنقطة النهائية لمسار التعليم المحدد مسبقًا
معدل النجاح: ما إذا كان الروبوت قادرًا على الملاحة من نقطة البداية إلى نقطة النهاية (لا يتطلب اتباعًا صارمًا للمسار)

مجموعة البيانات

البيئة: مشاهد المكاتب والممرات
أنواع المسارات: مسارات مستقيمة ومنحنية
شروط الاختبار: الحالة الطبيعية وحجب العوائق والتغييرات البيئية

طرق المقارنة

BVTR: طريقة VTR الكلاسيكية المستوحاة من البيولوجيا
تجارب الاستئصال: متغيرات بدون تجميع الإطارات الرئيسية وتتبع هدف واحد وغيرها

نتائج التجربة

النتائج الرئيسية

1. الملاحة في الظروف العادية

مشهد المكتب: مسافة نقطة النهاية للطريقة المقترحة 0.08 متر، BVTR 0.10 متر
تمكنت كلا الطريقتين من إكمال الملاحة بنجاح، مع انحراف طفيف في نقاط الانعطاف

2. اختبار حجب العوائق

الطريقة المقترحة: مسافة نقطة النهاية 0.08 متر، تجنب العوائق بنجاح والعودة إلى مسار التعليم
BVTR: مسافة نقطة النهاية 5.58 متر، توقف أمام العائق وعدم القدرة على المتابعة
نسخة الهدف الواحد: مسافة نقطة النهاية 5.20 متر، مما يتحقق من أهمية استراتيجية الأهداف المتعددة

3. ملاحة المسار المنحني (مشهد الممر)

الطريقة المقترحة: مسافة نقطة النهاية 0.37 متر، اتباع المسار بالكامل بنجاح
BVTR: مسافة نقطة النهاية 11.44 متر، توقف بعد الملاحة إلى موقع غير معروف
بدون تجميع الإطارات الرئيسية: مسافة نقطة النهاية 10.49 متر، مما يوضح الدور الحاسم لاستراتيجية التجميع

4. التحقق من تجميع الإطارات الرئيسية

يزيد تجميع الإطارات الرئيسية بشكل كبير من كثافة كشف الحلقة، خاصة في نقاط الانعطاف، مما يوفر ردود فعل أكثر فورية لوحدة التخطيط الحركي.

5. التحقق من توسيع الخريطة

يمكن للنظام إضافة معلومات بيئية جديدة أثناء مرحلة التكرار، مع الحفاظ على الإطارات الرئيسية الموسعة على ارتباط بالخريطة الأصلية دون كسر البنية الطوبولوجية.

نتائج التجربة

إدارة الأهداف طويلة الأجل: تحسن استراتيجية الأهداف المتعددة بشكل كبير من قوة النظام تجاه فشل كشف الحلقة
تجميع الإطارات الرئيسية: حاسم للمطابقة القوية في البيئات التي تفتقر إلى الملمس
توسيع الخريطة: يعالج التغييرات البيئية بفعالية، مما يدعم مهام الملاحة طويلة الأجل

الأعمال ذات الصلة

اتجاهات البحث الرئيسية

الطرق المستوحاة من البيولوجيا: مقارنة الصور المباشرة والتعرف على الأنماط
طرق الهندسة البصرية: مطابقة الصور القائمة على الميزات وحل PnP
طرق التعلم العميق: التعلم من النهاية إلى النهاية ومطابقة الشبكات العصبية
دمج الطوبولوجيا والمترية: الملاحة التي تجمع بين المعلومات الطوبولوجية والمترية

مزايا هذا العمل

مقارنة بالطرق المستوحاة من البيولوجيا: مطابقة ميزات أكثر قوة
مقارنة بطرق التعلم العميق: كفاءة حسابية عالية وقابلية تفسير قوية
مقارنة بالطرق الهندسية التقليدية: لا تتطلب اتساقًا عالميًا، وتكيف قوي

الخلاصة والمناقشة

الاستنتاجات الرئيسية

تمثيل خريطة مرن: يخفف الرسم البياني الطوبولوجي-المتري بشكل فعال من متطلبات رسم الخرائط العالمية
نظام ملاحة قوي: تحسن إدارة الأهداف المتعددة وتجميع الإطارات الرئيسية بشكل كبير من قوة النظام
التحقق من الجدوى: تم التحقق من فعالية النظام في سيناريوهات تحديات متعددة

القيود

الاعتماد على الموضع النسبي: تعتمد أداء النظام على دقة الموضع النسبي بين الإطارات الرئيسية
الانجراف طويل الأجل: إذا فشل النظام في مطابقة الخريطة لفترة طويلة، قد يؤدي انجراف قياس الحركة إلى التباعد
افتراضات البيئة: يفترض أن تقدير الموضع النسبي دقيق بما يكفي، وقد لا ينطبق في بعض البيئات

الاتجاهات المستقبلية

بناء نموذج ملاحة بصري من النهاية إلى النهاية قائم على التعلم العميق، للتخلص بشكل أكبر من الحاجة إلى تتبع الموضع العام الدقيق ورسم خرائط البيئة.

التقييم المتعمق

المزايا

الابتكار التقني: اقتراح تمثيل خريطة طوبولوجي-متري جديد، يعالج بشكل فعال قيود الطرق التقليدية
اكتمال النظام: حل شامل من بناء الخريطة إلى تنفيذ الملاحة
التحقق التجريبي الكافي: التحقق الشامل في سيناريوهات وظروف متعددة
القيمة العملية: يأخذ تصميم النظام في الاعتبار احتياجات النشر الفعلي، وسهل الاستخدام

أوجه القصور

نقص التحليل النظري: افتقار إلى ضمانات نظرية لتقارب واستقرار النظام
التعقيد الحسابي: لم يتم تحليل تعقيد الحساب لتجميع الإطارات الرئيسية وإدارة الأهداف المتعددة بالتفصيل
قيود البيئة: تم الاختبار بشكل أساسي في بيئات داخلية منظمة، والتكيف مع البيئات الخارجية المعقدة غير معروف
خطوط الأساس المحدودة: المقارنة الأساسية مع طريقة BVTR الكلاسيكية، مع نقص المقارنة مع أحدث طرق التعلم العميق

التأثير

المساهمة الأكاديمية: توفير مسار تقني جديد لملاحة VTR، بقيمة نظرية معينة
القيمة العملية: يمكن تطبيق الطريقة مباشرة على ملاحة الروبوتات الصناعية والمنزلية
قابلية التكرار: وصف تفاصيل تقنية شامل نسبيًا، مما يسهل التكرار والتحسين

السيناريوهات المناسبة

ملاحة المسار الثابت: ملاحة بين محطات المصنع، تتبع مسار روبوتات المستودعات
سيناريوهات التغيير البيئي: مهام الملاحة طويلة الأجل التي تتطلب التكيف مع التغييرات البيئية الطفيفة
الموارد الحسابية المحدودة: متطلبات أجهزة أقل مقارنة بطرق التعلم العميق

المراجع

تتضمن الورقة 31 مرجعًا، تغطي الأعمال المهمة في مجالات SLAM البصري وملاحة الروبوتات والتعرف على الموقع وغيرها، مما يوفر أساسًا نظريًا قويًا للبحث.

التقييم الشامل: تقترح هذه الورقة حلاً عمليًا لملاحة VTR، مع بعض الابتكار التقني والتحقق التجريبي الكافي. على الرغم من وجود مجال للتحسن في التحليل النظري والتكيف البيئي، فإنها توفر مساهمة تقنية قيمة لمجال ملاحة الروبوتات المتنقلة.