2025-11-21T23:34:16.264289

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Bosello, Pinzarrone, Kiade et al.
Drone technology is proliferating in many industries, including agriculture, logistics, defense, infrastructure, and environmental monitoring. Vision-based autonomy is one of its key enablers, particularly for real-world applications. This is essential for operating in novel, unstructured environments where traditional navigation methods may be unavailable. Autonomous drone racing has become the de facto benchmark for such systems. State-of-the-art research has shown that autonomous systems can surpass human-level performance in racing arenas. However, direct applicability to commercial and field operations is still limited as current systems are often trained and evaluated in highly controlled environments. In our contribution, the system's capabilities are analyzed within a controlled environment -- where external tracking is available for ground-truth comparison -- but also demonstrated in a challenging, uninstrumented environment -- where ground-truth measurements were never available. We show that our approach can match the performance of professional human pilots in both scenarios. We also publicly release the data from the flights carried out by our approach and a world-class human pilot.
academic

في عالمك الخاص: سباق الطائرات بدون طيار المستقلة على مستوى احترافي في الساحات غير المجهزة

المعلومات الأساسية

  • معرّف الورقة: 2510.13644
  • العنوان: On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas
  • المؤلفون: Michael Bosello, Flavio Pinzarrone, Sara Kiade, Davide Aguiari, Yvo Keuter, Aaesha AlShehhi, Gyordan Caminati, Kei Long Wong, Ka Seng Chou, Junaid Halepota, Fares Alneyadi, Jacopo Panerati, Giovanni Pau
  • التصنيف: cs.RO (الروبوتات)
  • تاريخ النشر: 15 أكتوبر 2025
  • رابط الورقة: https://arxiv.org/abs/2510.13644

الملخص

تتطور تكنولوجيا الطائرات بدون طيار بسرعة في عدة صناعات منها الزراعة واللوجستيات والدفاع والبنية التحتية والمراقبة البيئية. تعتبر الاستقلالية المستندة إلى الرؤية البصرية عاملاً دافعاً رئيسياً، خاصة بالنسبة للتطبيقات الواقعية. يعتبر هذا حاسماً للعمل في بيئات جديدة وغير منظمة حيث قد لا تكون طرق الملاحة التقليدية متاحة. أصبح سباق الطائرات بدون طيار المستقلة معياراً فعلياً لتقييم مثل هذه الأنظمة. تشير الأبحاث الحديثة إلى أن الأنظمة المستقلة يمكنها تجاوز الأداء على مستوى الإنسان في ساحات السباق. ومع ذلك، يبقى التطبيق المباشر على العمليات التجارية والميدانية محدوداً، لأن الأنظمة الحالية عادة ما يتم تدريبها وتقييمها في بيئات عالية التحكم. تحلل هذه الورقة وتعرض قدرات النظام في بيئات محكومة (حيث تتوفر المراقبة الخارجية للمقارنة مع القيم الحقيقية) وفي بيئات غير مجهزة بالأجهزة وتحديات (حيث لم تتوفر قياسات القيم الحقيقية). تُظهر الدراسة أن الطريقة يمكنها مطابقة أداء الطيارين البشريين المحترفين في كلا السيناريوهين.

الخلفية البحثية والدافع

  1. المشكلة المراد حلها: على الرغم من أن أنظمة سباق الطائرات بدون طيار المستقلة الحالية قادرة على تجاوز الأداء البشري في البيئات المحكومة، إلا أنها تواجه تحديات في التطبيقات العملية، خاصة في البيئات غير المجهزة التي تفتقر إلى أنظمة المراقبة الخارجية.
  2. أهمية المشكلة:
    • يتطلب التطبيق الواسع لتكنولوجيا الطائرات بدون طيار في عدة صناعات استقلالية موثوقة في البيئات غير المنظمة
    • عادة ما تفتقر عمليات النشر في العالم الحقيقي إلى أنظمة تحديد الموقع الخارجية الدقيقة
    • هناك حاجة للتحقق من قوة الأنظمة المستقلة في الظروف الفعلية
  3. قيود الطرق الموجودة:
    • الاعتماد على بيئات عالية التحكم وأنظمة المراقبة الخارجية
    • الحاجة إلى بيانات القيم الحقيقية لضبط النظام
    • عدم الاستقرار في ظروف الإضاءة المتغيرة والبيئات المجهولة
  4. الدافع البحثي: تطوير نظام طائرة بدون طيار مستقل قادر على تحقيق أداء احترافية في البيئات غير المجهزة، مما يدفع التكنولوجيا نحو التطبيقات التجارية الفعلية.

المساهمات الأساسية

  1. تحقيق سباق طائرات بدون طيار مستقل على مستوى احترافي: تم الوصول إلى مستوى احترافي في البيئات المحكومة (مع المراقبة الخارجية) والبيئات غير المجهزة (بدون قياسات القيم الحقيقية)
  2. تقديم مكدس إدراك وتحكم قوي: لا يتطلب استخدام بيانات القيم الحقيقية لضبط تقدير البواقي، وأثبت التكيف مع ظروف إضاءة متعددة
  3. إطلاق مجموعة بيانات طيران احترافية: تحتوي على 6 رحلات طيران لطيار عالمي الحد، بإجمالي وقت طيران 240.77 ثانية، ومسافة طيران 2342.98 متر، وأقصى سرعة 21.29 م/ث
  4. التحقق من الأداء في المنافسة بين الإنسان والآلة: المنافسة المباشرة مع طيارين عالميين في سيناريوهات متعددة، مما يعرض الجدوى العملية للنظام

شرح الطريقة

تعريف المهمة

المدخلات: تدفق صور الكاميرا المجسمة، بيانات وحدة قياس القصور الذاتي (IMU)، معلومات موقع بوابات المسار المخرجات: أوامر التحكم بالطائرة (الدفع الجماعي ومعدل السرعة الزاوية للهيكل) القيود: متطلبات الوقت الفعلي، حدود الديناميكيات، متطلبات تجنب العوائق

معمارية النموذج

1. مكدس الرؤية (Vision Stack)

  • كشف البوابات: استخدام نموذج YOLOv8n (3.2 مليون معامل) لكشف بوابات المسار
  • كشف الزوايا: استخدام نموذج MobileNetV3-Small المحسّن (1.1 مليون معامل) لكشف الزوايا الداخلية الأربع للبوابة
  • استراتيجيات التحسين:
    • التحويل إلى رسم بياني ONNX ومحرك TensorRT
    • استخدام دقة FP16 للتسريع
    • تأخير كل إطار 24-30 ميلي ثانية

2. مكدس تقدير الحالة (State Estimation Stack)

  • أساس VIO: توفير كاميرا Intel T265 المجسمة قياس المسافة البصري بالقصور الذاتي
  • تصحيح الانجراف:
    متجه الحالة: x = p_d^T ∈ R³ (متجه انجراف الموضع)
    انتشار الحالة: x_{k+1} = Fx_k, P_{k+1} = FP_kF^T + Q
    تحديث كالمان: K_k = P_k^-H^T(HP_k^-H^T + R)^{-1}
    
  • دمج IMU: استخدام مرشح كالمان الممتد لدمج بيانات IMU بتردد 500 هرتز

3. مكدس التحكم (Control Stack)

  • توليد المسار الأمثل زمنياً: مع الأخذ في الاعتبار ديناميكيات الجسم الصلب وقيود المشغلات
  • التحكم بالتنبؤ النموذجي: بناءً على إطار عمل PAMPC، مع تعطيل أهداف الإدراك الحسي
  • تعويض التأخير: دمج منبئ الحالة لتعويض تأخير الحساب والتنفيذ

نقاط الابتكار التقني

  1. عدم الحاجة إلى ضبط القيم الحقيقية: بخلاف الطرق الموجودة، لا يعتمد النظام على بيانات المراقبة الخارجية لضبط تقدير الحالة
  2. دمج IMU عالي التردد: تحقيق قراءة بيانات IMU بتردد 500 هرتز من خلال بروتوكول MSP المحسّن، مع تحسن كبير مقارنة بـ 10 هرتز من بروتوكول SBUS
  3. معالجة رؤية قوية:
    • إعدادات التعريض الثابتة لتقليل ضبابية الحركة
    • طريقة تقطير النموذج لتقليل متطلبات التعليق (يتطلب فقط 80 إطار معلم يدويًا)
  4. تحسين الأداء في الوقت الفعلي:
    • تكوين نواة Linux في الوقت الفعلي
    • تسريع الاستدلال بـ GPU
    • معمارية تدفق البيانات المحسّنة

إعداد التجارب

مجموعة البيانات

  1. المسار المجهز بالأجهزة:
    • إعادة بناء بناءً على مجموعة بيانات RATM
    • نظام Qualisys MoCap بـ 32 كاميرا يوفر القيم الحقيقية
    • يتضمن منعطفات حادة وأقسام حلزونية ومناورات Split-S
  2. المسار غير المجهز بالأجهزة:
    • إعادة بناء مسار Track Split-S
    • استخدام محطة كاملة لتحديد الموقع (دقة سنتيمترية)
    • ظروف تغير الإضاءة الطبيعية

مقاييس التقييم

  • وقت الدورة: الوقت المستغرق لإكمال دورة واحدة
  • أقصى سرعة: أقصى سرعة تم الوصول إليها أثناء الطيران
  • طول المسار: طول المسار الفعلي للطيران
  • الاتساق: الانحراف المعياري للرحلات المتعددة
  • الموثوقية: معدل الإكمال الناجح وعدد الاصطدامات

الطرق المقارنة

  • الطيارون المحترفون: 3 طيارين محترفين، بما فيهم بطل العالم MCK
  • المراقبة الخارجية: الطيران المستقل باستخدام نظام MoCap
  • الطيران على متن الطائرة فقط: الطيران المستقل باستخدام أجهزة استشعار على متن الطائرة فقط

تفاصيل التنفيذ

  • منصة الأجهزة: NVIDIA Orin NX + Intel RealSense T265
  • نسبة الدفع إلى الوزن: ~7:1 (بسعة البطارية الكاملة)
  • الوزن: 665.5 جرام (بدون البطارية)
  • الاتصال: اتصال MSP متسلسل بمعدل 1 ميجابود

نتائج التجارب

النتائج الرئيسية

الأداء على المسار المجهز بالأجهزة

النظاممتوسط وقت الدورة (ثانية)أفضل وقت دورة (ثانية)أقصى سرعة (م/ث)عدد الاصطدامات
MCK (بطل العالم)4.71±1.253.8424.965
النظام المستقل (MoCap)4.44±0.114.3922.280
النظام المستقل (VIO)4.65±0.224.4022.20

الأداء على المسار غير المجهز بالأجهزة

النظاممتوسط وقت الدورة (ثانية)أفضل وقت دورة (ثانية)عدد الاصطدامات
MCK5.80±0.405.052
النظام المستقل6.02±0.065.924

تجارب الاستئصال

  1. VIO مقابل MoCap: استخدام VIO على متن الطائرة فقط مقارنة بالمراقبة الخارجية، يكون متوسط وقت الدورة أبطأ بنسبة 4.7% فقط
  2. تأثير تصحيح الانجراف: يحسّن مرشح كالمان بشكل كبير دقة تقدير الموضع للرحلات الطويلة
  3. مساهمة دمج IMU: يوفر دمج بيانات IMU بتردد 500 هرتز تقدير حالة أكثر سلاسة

تحليل الحالات

  • مناورة Split-S: يُظهر النظام المستقل أداءً ممتازاً في المساحة المقيدة، مع اتساق المسار أفضل من طيارين بشريين
  • القسم الحلزوني: يُحدد الطيارون البشريون كمنطقة أداء حرجة، يحقق النظام المستقل أداءً تنافسياً من خلال تحسين المسار
  • المنعطف الحاد: يصبح عاملاً محدداً رئيسياً للنظام المستقل، يتطلب إعدادات نسبة دفع إلى وزن محافظة

النتائج التجريبية

  1. ميزة الاتساق: يُظهر النظام المستقل اتساقاً أفضل بشكل ملحوظ (انحراف معياري أصغر)
  2. التكيف البيئي: نجح النظام في التكيف مع ظروف إضاءة مختلفة وتخطيطات ساحات مختلفة
  3. تحديات التفاعل بين الإنسان والآلة: في المنافسة على ساحة مشتركة، يكون النظام المستقل أكثر عرضة للاصطدام

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

  1. تحدي AlphaPilot (2019): سباق طائرات بدون طيار ذكية رائد
  2. طرق التعلم المعزز العميق: أظهر Kaufmann وآخرون في عام 2023 أداءً تتجاوز الإنسان
  3. بناء مجموعات البيانات: توفر مجموعة بيانات RATM معياراً لتطوير الخوارزميات

مزايا هذه الورقة

  • التحقق من البيئة الحقيقية: أول تحقق من الأداء على مستوى احترافي في البيئات غير المجهزة
  • التوجه نحو الجدوى العملية: عدم الاعتماد على أنظمة المراقبة الخارجية، أقرب إلى سيناريوهات التطبيق الفعلي
  • اكتمال النظام: توفير حل شامل من الإدراك إلى التحكم

الخلاصة والنقاش

الاستنتاجات الرئيسية

  1. يمكن لنظام طائرة بدون طيار مستقل أن يصل إلى مستوى الطيارين البشريين المحترفين في البيئات غير المجهزة
  2. التحسينات الهندسية المناسبة والتكامل النظامي أكثر أهمية من الخوارزميات المعقدة
  3. الاتساق هو الميزة الرئيسية للأنظمة المستقلة مقابل البشر

القيود

  1. تحديات المساحة المشتركة: عدم كفاية التكيف في المنافسة المختلطة بين الإنسان والآلة
  2. تعميم البيئة: لا تزال بحاجة إلى كمية صغيرة من البيانات للتكيف مع البيئة
  3. الأداء الحدية: لا تزال أقل قليلاً من أفضل وقت دورة واحدة لأفضل الطيارين

الاتجاهات المستقبلية

  1. الانتقال من الكاميرا المجسمة إلى الكاميرا أحادية العدسة، أقرب إلى نظام الرؤية البشرية
  2. تحسين التفاعل بين عدة وكلاء وتجنب الاصطدام
  3. تحسين قدرة نقل المحاكاة إلى الواقع

التقييم المتعمق

المزايا

  1. قيمة عملية عالية: حل الفجوة الحرجة من المختبر إلى التطبيق الحقيقي
  2. اكتمال الهندسة: توفير تفاصيل تنفيذ الأجهزة والبرامج المفصلة
  3. تقييم شامل: يتضمن تقييماً متعدد الأبعاد كمي ونوعي
  4. فتح البيانات: إطلاق مجموعة بيانات طيران عالية الجودة

أوجه القصور

  1. ابتكار خوارزمي محدود: في الأساس تكامل هندسي للتقنيات الموجودة
  2. تحليل نظري غير كافٍ: نقص التحليل النظري لحدود أداء النظام
  3. قيود السيناريو: التحقق فقط في مسارات داخلية منظمة

التأثير

  1. دفع الصناعة: توفير مرجع مهم لتجاريز تكنولوجيا الطائرات بدون طيار المستقلة
  2. معنى المعيار: إنشاء معيار أداء في البيئات غير المجهزة
  3. المساهمة مفتوحة المصدر: سيعزز فتح مجموعة البيانات والأكواد تطور المجال

السيناريوهات القابلة للتطبيق

  • تطبيقات المستودعات والخدمات اللوجستية الداخلية
  • فحص البنية التحتية
  • مهام البحث والإنقاذ
  • الترفيه والمنافسات الرياضية

المراجع

1 Hanover, D., et al. "Autonomous drone racing: A survey." IEEE Transactions on Robotics, 2024. 2 Kaufmann, E., et al. "Champion-level drone racing using deep reinforcement learning." Nature, 2023. 3 Bosello, M., et al. "Race against the machine: A fully-annotated, open-design dataset." IEEE RAL, 2024.


التقييم الشامل: هذه ورقة بحثية موجهة نحو الهندسة ذات قيمة عملية مهمة، وقد نجحت في تحويل التكنولوجيا من المختبر إلى نظام قابل للنشر فعلياً. على الرغم من أن الابتكار في الخوارزميات محدود نسبياً، إلا أن مساهماتها في التحقق من البيئة الحقيقية وهندسة النظام لها أهمية كبيرة في دفع تجاريز تكنولوجيا الطائرات بدون طيار المستقلة.