2025-11-21T23:34:16.264289

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Bosello, Pinzarrone, Kiade et al.
Drone technology is proliferating in many industries, including agriculture, logistics, defense, infrastructure, and environmental monitoring. Vision-based autonomy is one of its key enablers, particularly for real-world applications. This is essential for operating in novel, unstructured environments where traditional navigation methods may be unavailable. Autonomous drone racing has become the de facto benchmark for such systems. State-of-the-art research has shown that autonomous systems can surpass human-level performance in racing arenas. However, direct applicability to commercial and field operations is still limited as current systems are often trained and evaluated in highly controlled environments. In our contribution, the system's capabilities are analyzed within a controlled environment -- where external tracking is available for ground-truth comparison -- but also demonstrated in a challenging, uninstrumented environment -- where ground-truth measurements were never available. We show that our approach can match the performance of professional human pilots in both scenarios. We also publicly release the data from the flights carried out by our approach and a world-class human pilot.
academic

Su di Te: Gara Autonoma di Droni a Livello Professionale in Arene Non Strumentate

Informazioni Fondamentali

  • ID Articolo: 2510.13644
  • Titolo: On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas
  • Autori: Michael Bosello, Flavio Pinzarrone, Sara Kiade, Davide Aguiari, Yvo Keuter, Aaesha AlShehhi, Gyordan Caminati, Kei Long Wong, Ka Seng Chou, Junaid Halepota, Fares Alneyadi, Jacopo Panerati, Giovanni Pau
  • Classificazione: cs.RO (Robotica)
  • Data di Pubblicazione: 15 ottobre 2025
  • Link Articolo: https://arxiv.org/abs/2510.13644

Riassunto

La tecnologia dei droni sta evolvendo rapidamente in numerosi settori, tra cui agricoltura, logistica, difesa, infrastrutture e monitoraggio ambientale. L'autonomia basata sulla visione è un fattore chiave di questo sviluppo, in particolare per le applicazioni nel mondo reale. Ciò è essenziale per operare in ambienti nuovi e non strutturati dove i metodi di navigazione tradizionali potrebbero non essere disponibili. La gara autonoma di droni è diventata lo standard di fatto per il benchmarking di tali sistemi. Ricerche recenti dimostrano che i sistemi autonomi possono superare le prestazioni umane nei circuiti di gara. Tuttavia, l'applicazione diretta a operazioni commerciali e sul campo rimane limitata, poiché i sistemi attuali sono generalmente addestrati e valutati in ambienti altamente controllati. Questo articolo analizza e dimostra le capacità del sistema sia in ambienti controllati (con tracciamento esterno disponibile per il confronto con la verità di base) che in ambienti non strumentati impegnativi (dove non è mai disponibile alcuna misurazione di verità di base). La ricerca dimostra che il metodo può eguagliare le prestazioni di piloti umani professionisti in entrambi gli scenari.

Contesto di Ricerca e Motivazione

  1. Problema da Risolvere: Sebbene i sistemi autonomi di gara di droni esistenti possano superare le prestazioni umane in ambienti controllati, affrontano sfide nelle applicazioni pratiche, in particolare in ambienti non strumentati privi di sistemi di tracciamento esterno.
  2. Importanza del Problema:
    • L'applicazione diffusa della tecnologia dei droni in molteplici settori richiede autonomia affidabile in ambienti non strutturati
    • Le distribuzioni nel mondo reale generalmente mancano di sistemi di posizionamento esterno precisi
    • È necessario verificare la robustezza dei sistemi autonomi in condizioni reali
  3. Limitazioni degli Approcci Esistenti:
    • Dipendenza da ambienti altamente controllati e sistemi di tracciamento esterno
    • Necessità di dati di verità di base per l'ottimizzazione fine del sistema
    • Prestazioni instabili in condizioni di illuminazione variabile e ambienti sconosciuti
  4. Motivazione della Ricerca: Sviluppare sistemi di droni autonomi in grado di raggiungere prestazioni di livello professionale in ambienti non strumentati, promuovendo la transizione della tecnologia verso applicazioni commerciali pratiche.

Contributi Principali

  1. Realizzazione di Gara Autonoma di Droni a Livello Professionale: Raggiungimento di prestazioni professionali sia in ambienti controllati (con tracciamento esterno) che in ambienti non strumentati (senza misurazioni di verità di base)
  2. Proposta di uno Stack di Percezione e Controllo Robusto: Non richiede l'utilizzo di dati di verità di base per l'ottimizzazione fine della stima residua e dimostra adattabilità a molteplici condizioni di illuminazione
  3. Rilascio di un Dataset di Volo a Livello Professionale: Contiene 6 voli di piloti campioni mondiali, con tempo di volo totale di 240,77 secondi, distanza di volo di 2342,98 metri e velocità massima di 21,29 m/s
  4. Verifica delle Prestazioni Uomo-Macchina: Competizione diretta con piloti di livello mondiale in molteplici scenari, dimostrando l'applicabilità pratica del sistema

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Flusso di immagini da telecamera stereo, dati IMU, informazioni sulla posizione dei gate della pista Output: Comandi di controllo del drone (spinta collettiva e velocità angolare del corpo) Vincoli: Requisiti di tempo reale, limitazioni dinamiche, requisiti di evitamento degli ostacoli

Architettura del Modello

1. Stack Visivo (Vision Stack)

  • Rilevamento dei Gate: Utilizzo del modello YOLOv8n (3,2 milioni di parametri) per il rilevamento dei gate della pista
  • Rilevamento degli Angoli: Utilizzo del modello MobileNetV3-Small migliorato (1,1 milioni di parametri) per il rilevamento dei quattro angoli interni dei gate
  • Strategie di Ottimizzazione:
    • Conversione in grafico ONNX e motore TensorRT
    • Accelerazione con precisione FP16
    • Latenza per frame di 24-30 ms

2. Stack di Stima dello Stato (State Estimation Stack)

  • Base VIO: Telecamera stereo Intel T265 fornisce odometria visivo-inerziale
  • Correzione della Deriva:
    Vettore di stato: x = p_d^T ∈ R³ (vettore di deriva della posizione)
    Propagazione dello stato: x_{k+1} = Fx_k, P_{k+1} = FP_kF^T + Q
    Aggiornamento di Kalman: K_k = P_k^-H^T(HP_k^-H^T + R)^{-1}
    
  • Fusione IMU: Utilizzo di filtro di Kalman esteso per la fusione di dati IMU a 500 Hz

3. Stack di Controllo (Control Stack)

  • Generazione di Traiettorie Ottimali nel Tempo: Considerazione della dinamica del corpo rigido e dei vincoli degli attuatori
  • Controllo Predittivo del Modello: Basato sul framework PAMPC, con obiettivi di percezione disabilitati
  • Compensazione del Ritardo: Integrazione di predittore dello stato per compensare il ritardo di calcolo e esecuzione

Punti di Innovazione Tecnica

  1. Nessuna Ottimizzazione Fine Basata sulla Verità di Base: A differenza dei metodi esistenti, il sistema non dipende da dati di tracciamento esterno per l'ottimizzazione fine della stima dello stato
  2. Integrazione IMU ad Alta Frequenza: Realizzazione della lettura dei dati IMU a 500 Hz attraverso il protocollo MSP ottimizzato, con miglioramento significativo rispetto al protocollo SBUS a 10 Hz
  3. Elaborazione Visiva Robusta:
    • Impostazioni di esposizione fissa per ridurre la sfocatura da movimento
    • Metodo di distillazione del modello per ridurre i requisiti di annotazione (solo 80 frame annotati manualmente)
  4. Ottimizzazione delle Prestazioni in Tempo Reale:
    • Configurazione del kernel Linux in tempo reale
    • Inferenza accelerata su GPU
    • Architettura del flusso di dati ottimizzata

Configurazione Sperimentale

Dataset

  1. Pista Strumentata:
    • Ricostruzione basata sul dataset RATM
    • Sistema MoCap Qualisys a 32 telecamere fornisce la verità di base
    • Include curve strette, segmenti a spirale e manovre Split-S
  2. Pista Non Strumentata:
    • Ricostruzione della pista Track Split-S
    • Posizionamento con stazione totale (precisione centimetrica)
    • Condizioni di illuminazione naturale variabile

Metriche di Valutazione

  • Tempo di Giro: Tempo per completare un singolo giro
  • Velocità Massima: Velocità di picco raggiunta durante il volo
  • Lunghezza del Percorso: Lunghezza effettiva della traiettoria di volo
  • Coerenza: Deviazione standard di più voli
  • Affidabilità: Tasso di completamento con successo e numero di collisioni

Metodi di Confronto

  • Piloti Professionisti: 3 piloti professionisti, incluso il campione mondiale MCK
  • Tracciamento Esterno: Volo autonomo utilizzando il sistema MoCap
  • Solo Sensori Onboard: Volo autonomo utilizzando solo sensori a bordo

Dettagli di Implementazione

  • Piattaforma Hardware: NVIDIA Orin NX + Intel RealSense T265
  • Rapporto Spinta-Peso: ~7:1 (capacità batteria completa)
  • Peso: 665,5 g (senza batteria)
  • Comunicazione: Connessione seriale MSP a 1 MBaud

Risultati Sperimentali

Risultati Principali

Prestazioni su Pista Strumentata

SistemaTempo Medio Giro (s)Miglior Giro (s)Velocità Massima (m/s)Collisioni
MCK (Campione Mondiale)4,71±1,253,8424,965
Sistema Autonomo (MoCap)4,44±0,114,3922,280
Sistema Autonomo (VIO)4,65±0,224,4022,20

Prestazioni su Pista Non Strumentata

SistemaTempo Medio Giro (s)Miglior Giro (s)Collisioni
MCK5,80±0,405,052
Sistema Autonomo6,02±0,065,924

Esperimenti di Ablazione

  1. VIO vs MoCap: Utilizzo solo di VIO a bordo rispetto al tracciamento esterno, il tempo medio di giro è solo del 4,7% più lento
  2. Effetto della Correzione della Deriva: Il filtro di Kalman migliora significativamente la precisione della stima della posizione durante i voli di lunga durata
  3. Contributo della Fusione IMU: La fusione dei dati IMU a 500 Hz fornisce una stima dello stato più fluida

Analisi di Casi Studio

  • Manovra Split-S: Il sistema autonomo mostra eccellenti prestazioni in spazi vincolati, con coerenza della traiettoria superiore ai piloti umani
  • Segmento a Spirale: Identificato dai piloti umani come area critica di prestazione, il sistema autonomo raggiunge prestazioni competitive attraverso l'ottimizzazione della traiettoria
  • Curva a Forcina: Diventa il principale fattore limitante per il sistema autonomo, richiedendo impostazioni conservative del rapporto spinta-peso

Scoperte Sperimentali

  1. Vantaggio di Coerenza: Il sistema autonomo mostra una coerenza significativamente migliore (deviazione standard inferiore)
  2. Adattabilità Ambientale: Il sistema si adatta con successo a diverse condizioni di illuminazione e layout della pista
  3. Sfide nell'Interazione Uomo-Macchina: In competizioni su piste condivise, il sistema autonomo è più vulnerabile alle collisioni

Lavori Correlati

Principali Direzioni di Ricerca

  1. Sfida AlphaPilot (2019): Gara pioneristico di gara di droni AI
  2. Metodi di Apprendimento per Rinforzo Profondo: Kaufmann et al. nel 2023 hanno dimostrato prestazioni superiori agli umani
  3. Costruzione di Dataset: Il dataset RATM fornisce benchmark per lo sviluppo di algoritmi

Vantaggi di Questo Articolo

  • Verifica in Ambienti Reali: Primo raggiungimento di prestazioni di livello professionale in ambienti non strumentati
  • Orientamento Pratico: Non dipende da sistemi di tracciamento esterno, più vicino a scenari di applicazione reale
  • Completezza del Sistema: Fornisce una soluzione completa dalla percezione al controllo

Conclusioni e Discussione

Conclusioni Principali

  1. I sistemi di droni autonomi possono raggiungere il livello di piloti professionisti in ambienti non strumentati
  2. L'ottimizzazione ingegneristica appropriata e l'integrazione del sistema sono più importanti degli algoritmi complessi
  3. La coerenza è il principale vantaggio dei sistemi autonomi rispetto agli umani

Limitazioni

  1. Sfide nello Spazio Condiviso: Adattabilità insufficiente in competizioni miste uomo-macchina
  2. Generalizzazione Ambientale: Richiede ancora una piccola quantità di dati per l'adattamento ambientale
  3. Prestazioni Estreme: Ancora leggermente inferiore ai migliori piloti nel tempo di giro singolo

Direzioni Future

  1. Transizione da telecamera stereo a telecamera monoculare, più vicina al sistema visivo umano
  2. Miglioramento dell'interazione multi-agente e dell'evitamento delle collisioni
  3. Miglioramento della capacità di trasferimento sim-to-real

Valutazione Approfondita

Punti di Forza

  1. Alto Valore Pratico: Risolve il gap critico dal laboratorio alle applicazioni reali
  2. Completezza Ingegneristica: Fornisce dettagli di implementazione hardware e software
  3. Valutazione Completa: Include valutazione multidimensionale quantitativa e qualitativa
  4. Apertura dei Dati: Rilascio pubblico di dataset di volo di alta qualità

Punti Deboli

  1. Innovazione Algoritmica Limitata: Principalmente integrazione ingegneristica di tecnologie esistenti
  2. Analisi Teorica Insufficiente: Mancanza di analisi teorica dei limiti di prestazione del sistema
  3. Limitazioni dello Scenario: Verifica solo in piste strutturate indoor

Impatto

  1. Promozione dell'Industrializzazione: Fornisce riferimento importante per la commercializzazione della tecnologia autonoma dei droni
  2. Significato di Benchmark: Stabilisce benchmark di prestazione in ambienti non strumentati
  3. Contributo Open Source: L'apertura di dataset e codice promuoverà lo sviluppo del settore

Scenari Applicabili

  • Applicazioni di stoccaggio e logistica indoor
  • Ispezione delle infrastrutture
  • Operazioni di ricerca e soccorso
  • Competizioni di intrattenimento e sport

Riferimenti Bibliografici

1 Hanover, D., et al. "Autonomous drone racing: A survey." IEEE Transactions on Robotics, 2024. 2 Kaufmann, E., et al. "Champion-level drone racing using deep reinforcement learning." Nature, 2023. 3 Bosello, M., et al. "Race against the machine: A fully-annotated, open-design dataset." IEEE RAL, 2024.


Valutazione Complessiva: Questo è un articolo orientato all'ingegneria con importante valore pratico che ha trasformato con successo la tecnologia di laboratorio in un sistema effettivamente distribuibile. Sebbene relativamente limitato in termini di innovazione algoritmica, il suo contributo nella verifica in ambienti reali e nell'ingegneria dei sistemi è di significativa importanza per promuovere l'industrializzazione della tecnologia autonoma dei droni.