2025-11-21T23:34:16.264289

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Bosello, Pinzarrone, Kiade et al.
Drone technology is proliferating in many industries, including agriculture, logistics, defense, infrastructure, and environmental monitoring. Vision-based autonomy is one of its key enablers, particularly for real-world applications. This is essential for operating in novel, unstructured environments where traditional navigation methods may be unavailable. Autonomous drone racing has become the de facto benchmark for such systems. State-of-the-art research has shown that autonomous systems can surpass human-level performance in racing arenas. However, direct applicability to commercial and field operations is still limited as current systems are often trained and evaluated in highly controlled environments. In our contribution, the system's capabilities are analyzed within a controlled environment -- where external tracking is available for ground-truth comparison -- but also demonstrated in a challenging, uninstrumented environment -- where ground-truth measurements were never available. We show that our approach can match the performance of professional human pilots in both scenarios. We also publicly release the data from the flights carried out by our approach and a world-class human pilot.
academic

आपका अपना: निर्देशहीन क्षेत्रों में व्यावसायिक स्तर की स्वायत्त ड्रोन रेसिंग

मूल जानकारी

  • पेपर ID: 2510.13644
  • शीर्षक: On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas
  • लेखक: Michael Bosello, Flavio Pinzarrone, Sara Kiade, Davide Aguiari, Yvo Keuter, Aaesha AlShehhi, Gyordan Caminati, Kei Long Wong, Ka Seng Chou, Junaid Halepota, Fares Alneyadi, Jacopo Panerati, Giovanni Pau
  • वर्गीकरण: cs.RO (रोबोटिक्स)
  • प्रकाशन तिथि: 15 अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.13644

सारांश

ड्रोन तकनीक कृषि, लॉजिस्टिक्स, रक्षा, बुनियादी ढांचे और पर्यावरणीय निगरानी सहित कई उद्योगों में तेजी से विकसित हो रही है। दृष्टि-आधारित स्वायत्तता इसका मुख्य चालक है, विशेषकर वास्तविक दुनिया के अनुप्रयोगों के लिए। यह पारंपरिक नेविगेशन विधियों के अनुपलब्ध होने वाले नए, असंरचित वातावरण में संचालन के लिए महत्वपूर्ण है। स्वायत्त ड्रोन रेसिंग ऐसी प्रणालियों के लिए वास्तविक मानक बेंचमार्क बन गई है। नवीनतम अनुसंधान से पता चलता है कि स्वायत्त प्रणालियां रेसिंग ट्रैक में मानव-स्तरीय प्रदर्शन को पार कर सकती हैं। हालांकि, वाणिज्यिक और क्षेत्र संचालन में सीधा अनुप्रयोग सीमित है क्योंकि वर्तमान प्रणालियां आमतौर पर अत्यधिक नियंत्रित वातावरण में प्रशिक्षित और मूल्यांकन की जाती हैं। यह पेपर नियंत्रित वातावरण (बाहरी ट्रैकिंग सत्य तुलना के लिए उपलब्ध) और चुनौतीपूर्ण निर्देशहीन वातावरण (जहां कभी भी सत्य माप उपलब्ध नहीं है) में प्रणाली क्षमताओं का विश्लेषण और प्रदर्शन करता है। अनुसंधान से पता चलता है कि विधि दोनों परिदृश्यों में व्यावसायिक मानव पायलटों के प्रदर्शन से मेल खा सकती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

  1. समाधान की जाने वाली समस्या: मौजूदा स्वायत्त ड्रोन रेसिंग प्रणालियां नियंत्रित वातावरण में मानव प्रदर्शन को पार कर सकती हैं, लेकिन व्यावहारिक अनुप्रयोगों में चुनौतियों का सामना करती हैं, विशेषकर बाहरी ट्रैकिंग प्रणालियों के बिना निर्देशहीन वातावरण में।
  2. समस्या की महत्ता:
    • कई उद्योगों में ड्रोन तकनीक के व्यापक अनुप्रयोग के लिए असंरचित वातावरण में विश्वसनीय स्वायत्तता की आवश्यकता है
    • वास्तविक दुनिया की तैनाती में आमतौर पर सटीक बाहरी स्थिति प्रणालियों की कमी होती है
    • वास्तविक स्थितियों में स्वायत्त प्रणालियों की मजबूती को सत्यापित करने की आवश्यकता है
  3. मौजूदा विधियों की सीमाएं:
    • अत्यधिक नियंत्रित वातावरण और बाहरी ट्रैकिंग प्रणालियों पर निर्भरता
    • प्रणाली ट्यूनिंग के लिए सत्य डेटा की आवश्यकता
    • प्रकाश परिवर्तन और अज्ञात वातावरण में अस्थिर प्रदर्शन
  4. अनुसंधान प्रेरणा: निर्देशहीन वातावरण में व्यावसायिक-स्तरीय प्रदर्शन प्राप्त करने में सक्षम स्वायत्त ड्रोन प्रणाली विकसित करना, तकनीक को वास्तविक वाणिज्यिक अनुप्रयोगों की ओर ले जाना।

मुख्य योगदान

  1. व्यावसायिक-स्तरीय स्वायत्त ड्रोन रेसिंग का कार्यान्वयन: नियंत्रित वातावरण (बाहरी ट्रैकिंग के साथ) और निर्देशहीन वातावरण (सत्य माप के बिना) दोनों में व्यावसायिक स्तर प्राप्त किया
  2. मजबूत धारणा और नियंत्रण स्टैक का प्रस्ताव: अवशिष्ट अनुमान ट्यूनिंग के लिए सत्य डेटा का उपयोग करने की आवश्यकता नहीं है, और कई प्रकाश स्थितियों के अनुकूलन को प्रदर्शित करता है
  3. व्यावसायिक-स्तरीय उड़ान डेटासेट जारी किया: विश्व चैंपियन पायलट के 6 उड़ानों का डेटा, कुल उड़ान समय 240.77 सेकंड, उड़ान दूरी 2342.98 मीटर, अधिकतम गति 21.29 मीटर/सेकंड
  4. मानव-मशीन प्रतिद्वंद्विता प्रदर्शन का सत्यापन: कई परिदृश्यों में विश्व-स्तरीय पायलटों के साथ सीधी प्रतिस्पर्धा, प्रणाली की व्यावहारिकता का प्रदर्शन

विधि विवरण

कार्य परिभाषा

इनपुट: स्टीरियो कैमरा इमेज स्ट्रीम, IMU डेटा, ट्रैक गेट स्थिति जानकारी आउटपुट: ड्रोन नियंत्रण आदेश (सामूहिक थ्रस्ट और बॉडी कोणीय दर) बाधाएं: वास्तविक समय की आवश्यकता, गतिशीलता सीमाएं, बाधा परिहार आवश्यकता

मॉडल आर्किटेक्चर

1. दृष्टि स्टैक (Vision Stack)

  • गेट डिटेक्शन: YOLOv8n मॉडल (3.2 मिलियन पैरामीटर) का उपयोग करके ट्रैक गेट का पता लगाना
  • कोने का पता लगाना: सुधारे गए MobileNetV3-Small मॉडल (1.1 मिलियन पैरामीटर) का उपयोग करके गेट के चार आंतरिक कोनों का पता लगाना
  • अनुकूलन रणनीति:
    • ONNX ग्राफ और TensorRT इंजन में रूपांतरण
    • FP16 सटीकता का उपयोग करके त्वरण
    • प्रति फ्रेम विलंब 24-30 मिलीसेकंड

2. स्थिति अनुमान स्टैक (State Estimation Stack)

  • VIO आधार: Intel T265 स्टीरियो कैमरा दृश्य-जड़त्वीय ओडोमेट्री प्रदान करता है
  • ड्रिफ्ट सुधार:
    स्थिति वेक्टर: x = p_d^T ∈ R³ (स्थिति ड्रिफ्ट वेक्टर)
    स्थिति प्रसार: x_{k+1} = Fx_k, P_{k+1} = FP_kF^T + Q
    कलमन अपडेट: K_k = P_k^-H^T(HP_k^-H^T + R)^{-1}
    
  • IMU संलयन: 500Hz IMU डेटा को संलयित करने के लिए विस्तारित कलमन फिल्टर का उपयोग

3. नियंत्रण स्टैक (Control Stack)

  • समय-इष्टतम प्रक्षेपवक्र पीढ़ी: कठोर शरीर गतिशीलता और एक्चुएटर बाधाओं पर विचार करना
  • मॉडल भविष्यसूचक नियंत्रण: PAMPC ढांचे पर आधारित, धारणा-आधारित लक्ष्य को अक्षम करना
  • विलंब मुआवजा: गणना और निष्पादन विलंब की भरपाई के लिए एकीकृत स्थिति भविष्यसूचक

तकनीकी नवाचार बिंदु

  1. सत्य डेटा ट्यूनिंग की आवश्यकता नहीं: मौजूदा विधियों के विपरीत, प्रणाली स्थिति अनुमान ट्यूनिंग के लिए बाहरी ट्रैकिंग डेटा पर निर्भर नहीं है
  2. उच्च-आवृत्ति IMU एकीकरण: अनुकूलित MSP प्रोटोकॉल के माध्यम से 500Hz IMU डेटा पढ़ना, SBUS प्रोटोकॉल के 10Hz की तुलना में महत्वपूर्ण सुधार
  3. मजबूत दृष्टि प्रसंस्करण:
    • गति धुंधलेपन को कम करने के लिए निश्चित एक्सपोजर सेटिंग
    • मॉडल आसवन विधि लेबलिंग आवश्यकता को कम करती है (केवल 80 फ्रेम मैनुअल लेबलिंग की आवश्यकता)
  4. वास्तविक समय प्रदर्शन अनुकूलन:
    • वास्तविक समय Linux कर्नेल कॉन्फ़िगरेशन
    • GPU त्वरित अनुमान
    • अनुकूलित डेटा प्रवाह आर्किटेक्चर

प्रायोगिक सेटअप

डेटासेट

  1. उपकरणित ट्रैक:
    • RATM डेटासेट के आधार पर पुनर्निर्माण
    • 32-कैमरा Qualisys MoCap प्रणाली सत्य प्रदान करती है
    • तीव्र मोड़, सर्पिल खंड और Split-S युद्धाभ्यास शामिल
  2. निर्देशहीन ट्रैक:
    • Track Split-S ट्रैक का पुनर्निर्माण
    • पूर्ण स्टेशन का उपयोग करके स्थिति (सेंटीमीटर-स्तरीय सटीकता)
    • प्राकृतिक प्रकाश परिवर्तन स्थितियां

मूल्यांकन मेट्रिक्स

  • लैप समय: एकल लैप पूरा करने का समय
  • अधिकतम गति: उड़ान के दौरान प्राप्त शिखर गति
  • पथ लंबाई: वास्तविक उड़ान प्रक्षेपवक्र की लंबाई
  • स्थिरता: कई उड़ानों का मानक विचलन
  • विश्वसनीयता: सफल समापन दर और टकराव संख्या

तुलना विधियां

  • व्यावसायिक पायलट: 3 पेशेवर पायलट, विश्व चैंपियन MCK सहित
  • बाहरी ट्रैकिंग: MoCap प्रणाली का उपयोग करके स्वायत्त उड़ान
  • शुद्ध ऑनबोर्ड: केवल ऑनबोर्ड सेंसर का उपयोग करके स्वायत्त उड़ान

कार्यान्वयन विवरण

  • हार्डवेयर प्लेटफॉर्म: NVIDIA Orin NX + Intel RealSense T265
  • थ्रस्ट-टू-वेट अनुपात: ~7:1 (पूर्ण बैटरी क्षमता)
  • वजन: 665.5 ग्राम (बैटरी के बिना)
  • संचार: 1MBaud MSP सीरियल कनेक्शन

प्रायोगिक परिणाम

मुख्य परिणाम

उपकरणित ट्रैक प्रदर्शन

प्रणालीऔसत लैप समय (सेकंड)सर्वश्रेष्ठ लैप समय (सेकंड)अधिकतम गति (मीटर/सेकंड)टकराव संख्या
MCK (विश्व चैंपियन)4.71±1.253.8424.965
स्वायत्त प्रणाली (MoCap)4.44±0.114.3922.280
स्वायत्त प्रणाली (VIO)4.65±0.224.4022.20

निर्देशहीन ट्रैक प्रदर्शन

प्रणालीऔसत लैप समय (सेकंड)सर्वश्रेष्ठ लैप समय (सेकंड)टकराव संख्या
MCK5.80±0.405.052
स्वायत्त प्रणाली6.02±0.065.924

विलोपन प्रयोग

  1. VIO बनाम MoCap: केवल ऑनबोर्ड VIO का उपयोग करके बाहरी ट्रैकिंग की तुलना में, औसत लैप समय केवल 4.7% धीमा है
  2. ड्रिफ्ट सुधार प्रभाव: कलमन फिल्टर ने लंबी अवधि की उड़ान के लिए स्थिति अनुमान सटीकता में महत्वपूर्ण सुधार किया
  3. IMU संलयन योगदान: 500Hz IMU डेटा संलयन ने अधिक सुचारु स्थिति अनुमान प्रदान किया

केस विश्लेषण

  • Split-S युद्धाभ्यास: स्वायत्त प्रणाली सीमित स्थान में उत्कृष्ट प्रदर्शन करती है, प्रक्षेपवक्र स्थिरता मानव पायलटों से बेहतर है
  • सर्पिल खंड: मानव पायलटों द्वारा महत्वपूर्ण प्रदर्शन क्षेत्र के रूप में पहचाना गया, स्वायत्त प्रणाली अनुकूलित प्रक्षेपवक्र के माध्यम से प्रतिस्पर्धी प्रदर्शन प्राप्त करती है
  • हेयरपिन मोड़: स्वायत्त प्रणाली के लिए मुख्य सीमा बन गया, रूढ़िवादी थ्रस्ट-टू-वेट अनुपात सेटिंग की आवश्यकता है

प्रायोगिक निष्कर्ष

  1. स्थिरता लाभ: स्वायत्त प्रणाली काफी बेहतर स्थिरता प्रदर्शित करती है (छोटा मानक विचलन)
  2. पर्यावरणीय अनुकूलन: प्रणाली विभिन्न प्रकाश स्थितियों और ट्रैक लेआउट के अनुकूल होने में सफल रही
  3. मानव-मशीन इंटरैक्शन चुनौति: साझा ट्रैक प्रतिस्पर्धा में, स्वायत्त प्रणाली टकराव के लिए अधिक कमजोर है

संबंधित कार्य

मुख्य अनुसंधान दिशाएं

  1. AlphaPilot चुनौती (2019): अग्रणी AI ड्रोन रेसिंग प्रतियोगिता
  2. गहन सुदृढ़ सीखने की विधियां: Kaufmann आदि ने 2023 में मानव-स्तरीय प्रदर्शन से परे प्रदर्शन किया
  3. डेटासेट निर्माण: RATM डेटासेट एल्गोरिदम विकास के लिए बेंचमार्क प्रदान करता है

इस पेपर के लाभ

  • वास्तविक वातावरण सत्यापन: निर्देशहीन वातावरण में व्यावसायिक-स्तरीय प्रदर्शन प्राप्त करने वाला पहला
  • व्यावहारिकता-उन्मुख: बाहरी ट्रैकिंग प्रणालियों पर निर्भर नहीं, वास्तविक अनुप्रयोग परिदृश्यों के करीब
  • प्रणाली पूर्णता: धारणा से नियंत्रण तक पूर्ण समाधान प्रदान करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. स्वायत्त ड्रोन प्रणालियां निर्देशहीन वातावरण में व्यावसायिक पायलट स्तर तक पहुंच सकती हैं
  2. जटिल एल्गोरिदम की तुलना में उपयुक्त इंजीनियरिंग अनुकूलन और प्रणाली एकीकरण अधिक महत्वपूर्ण है
  3. स्थिरता मानव के सापेक्ष स्वायत्त प्रणाली का मुख्य लाभ है

सीमाएं

  1. साझा स्थान चुनौति: मानव-मशीन मिश्रित प्रतिस्पर्धा में अनुकूलन अपर्याप्त है
  2. पर्यावरणीय सामान्यीकरण: अभी भी पर्यावरणीय अनुकूलन के लिए कुछ डेटा की आवश्यकता है
  3. चरम प्रदर्शन: सर्वश्रेष्ठ एकल लैप समय में अभी भी शीर्ष पायलटों से थोड़ा पीछे है

भविष्य की दिशा

  1. स्टीरियो कैमरे से मोनोकुलर कैमरे में संक्रमण, मानव दृष्टि प्रणाली के करीब
  2. बहु-एजेंट इंटरैक्शन और टकराव परिहार में सुधार
  3. सिम-टू-रीयल स्थानांतरण क्षमता में वृद्धि

गहन मूल्यांकन

शक्तियां

  1. उच्च व्यावहारिक मूल्य: प्रयोगशाला से वास्तविक अनुप्रयोग तक महत्वपूर्ण अंतर को हल करता है
  2. इंजीनियरिंग पूर्णता: विस्तृत हार्डवेयर और सॉफ्टवेयर कार्यान्वयन विवरण प्रदान करता है
  3. व्यापक मूल्यांकन: मात्रात्मक और गुणात्मक बहु-आयामी मूल्यांकन शामिल है
  4. डेटा खुलापन: उच्च-गुणवत्ता वाली उड़ान डेटासेट का सार्वजनिक रिलीज

कमियां

  1. सीमित एल्गोरिदम नवाचार: मुख्य रूप से मौजूदा तकनीक का इंजीनियरिंग एकीकरण है
  2. अपर्याप्त सैद्धांतिक विश्लेषण: प्रणाली प्रदर्शन सीमाओं का सैद्धांतिक विश्लेषण की कमी
  3. परिदृश्य सीमा: केवल इनडोर संरचित ट्रैक में सत्यापित

प्रभाव

  1. औद्योगिकीकरण को बढ़ावा देना: ड्रोन स्वायत्त तकनीक के व्यावसायीकरण के लिए महत्वपूर्ण संदर्भ प्रदान करता है
  2. बेंचमार्क महत्व: निर्देशहीन वातावरण में प्रदर्शन बेंचमार्क स्थापित करता है
  3. ओपन-सोर्स योगदान: डेटासेट और कोड का खुलापन क्षेत्र विकास को बढ़ावा देगा

लागू परिदृश्य

  • इनडोर गोदाम और लॉजिस्टिक्स अनुप्रयोग
  • बुनियादी ढांचा निरीक्षण
  • खोज और बचाव कार्य
  • मनोरंजन और खेल प्रतियोगिता

संदर्भ

1 Hanover, D., et al. "Autonomous drone racing: A survey." IEEE Transactions on Robotics, 2024. 2 Kaufmann, E., et al. "Champion-level drone racing using deep reinforcement learning." Nature, 2023. 3 Bosello, M., et al. "Race against the machine: A fully-annotated, open-design dataset." IEEE RAL, 2024.


समग्र मूल्यांकन: यह एक महत्वपूर्ण व्यावहारिक मूल्य वाला इंजीनियरिंग-उन्मुख पेपर है जो प्रयोगशाला तकनीक को वास्तविक तैनाती योग्य प्रणाली में सफलतापूर्वक परिवर्तित करता है। हालांकि एल्गोरिदम नवाचार के मामले में अपेक्षाकृत सीमित है, लेकिन वास्तविक वातावरण सत्यापन और प्रणाली इंजीनियरिंग में इसका योगदान ड्रोन स्वायत्त तकनीक के औद्योगिकीकरण को आगे बढ़ाने के लिए महत्वपूर्ण है।