2025-11-21T23:34:16.264289

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Bosello, Pinzarrone, Kiade et al.
Drone technology is proliferating in many industries, including agriculture, logistics, defense, infrastructure, and environmental monitoring. Vision-based autonomy is one of its key enablers, particularly for real-world applications. This is essential for operating in novel, unstructured environments where traditional navigation methods may be unavailable. Autonomous drone racing has become the de facto benchmark for such systems. State-of-the-art research has shown that autonomous systems can surpass human-level performance in racing arenas. However, direct applicability to commercial and field operations is still limited as current systems are often trained and evaluated in highly controlled environments. In our contribution, the system's capabilities are analyzed within a controlled environment -- where external tracking is available for ground-truth comparison -- but also demonstrated in a challenging, uninstrumented environment -- where ground-truth measurements were never available. We show that our approach can match the performance of professional human pilots in both scenarios. We also publicly release the data from the flights carried out by our approach and a world-class human pilot.
academic

자신의 힘으로: 비계측 경기장에서의 프로급 자율 드론 레이싱

기본 정보

  • 논문 ID: 2510.13644
  • 제목: On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas
  • 저자: Michael Bosello, Flavio Pinzarrone, Sara Kiade, Davide Aguiari, Yvo Keuter, Aaesha AlShehhi, Gyordan Caminati, Kei Long Wong, Ka Seng Chou, Junaid Halepota, Fares Alneyadi, Jacopo Panerati, Giovanni Pau
  • 분류: cs.RO (로봇공학)
  • 발표 시간: 2025년 10월 15일
  • 논문 링크: https://arxiv.org/abs/2510.13644

초록

드론 기술은 농업, 물류, 국방, 기반시설 및 환경 모니터링 등 다양한 산업에서 빠르게 발전하고 있습니다. 시각 기반 자율성은 특히 실제 응용 분야에서 핵심 추진 요소입니다. 이는 기존 항법 방법을 사용할 수 없는 새로운 비구조화 환경에서의 운영에 필수적입니다. 자율 드론 레이싱은 이러한 시스템의 사실상 표준 벤치마크가 되었습니다. 최근 연구에 따르면 자율 시스템은 레이싱 트랙에서 인간 수준의 성능을 초과할 수 있습니다. 그러나 상용 및 현장 운영에 직접 적용하는 것은 여전히 제한적입니다. 현재 시스템은 일반적으로 고도로 제어된 환경에서 훈련 및 평가되기 때문입니다. 본 논문은 제어된 환경(외부 추적이 실측값 비교에 사용 가능)과 도전적인 비계측 환경(실측값 측정이 전혀 없음)에서 시스템 능력을 분석하고 시연합니다. 연구 결과는 이 방법이 두 시나리오 모두에서 프로급 인간 조종사의 성능과 일치할 수 있음을 보여줍니다.

연구 배경 및 동기

  1. 해결해야 할 문제: 기존 자율 드론 레이싱 시스템은 제어된 환경에서 인간 성능을 초과할 수 있지만, 특히 외부 추적 시스템이 없는 비계측 환경에서 실제 응용에 직면한 과제가 있습니다.
  2. 문제의 중요성:
    • 다양한 산업에서의 광범위한 드론 기술 응용은 비구조화 환경에서의 신뢰할 수 있는 자율성을 필요로 함
    • 실제 배포는 일반적으로 정밀한 외부 위치 결정 시스템이 부족함
    • 실제 조건에서 자율 시스템의 견고성을 검증할 필요가 있음
  3. 기존 방법의 한계:
    • 고도로 제어된 환경 및 외부 추적 시스템에 의존
    • 시스템 미세 조정을 위해 실측값 데이터 필요
    • 조명 변화 및 미지의 환경에서 불안정한 성능
  4. 연구 동기: 비계측 환경에서 프로급 성능을 달성할 수 있는 자율 드론 시스템을 개발하여 기술을 실제 상용 응용으로 전환하도록 추진

핵심 기여

  1. 프로급 자율 드론 레이싱 구현: 제어된 환경(외부 추적 포함)과 비계측 환경(실측값 측정 없음) 모두에서 프로급 수준 달성
  2. 견고한 인식 및 제어 스택 제안: 실측값 데이터를 사용한 잔차 추정 미세 조정이 필요 없으며, 다양한 조명 조건에 대한 적응성 입증
  3. 프로급 비행 데이터셋 공개: 세계 챔피언 조종사의 6회 비행 데이터 포함, 총 비행 시간 240.77초, 비행 거리 2342.98미터, 최고 속도 21.29m/s
  4. 인간-기계 대항 성능 검증: 다양한 시나리오에서 세계급 조종사와의 직접 경쟁을 통해 시스템의 실용성 입증

방법론 상세 설명

작업 정의

입력: 스테레오 카메라 이미지 스트림, IMU 데이터, 레이싱 게이트 위치 정보 출력: 드론 제어 명령(집단 추력 및 기체 각속도) 제약: 실시간 요구사항, 동역학 제한, 장애물 회피 요구사항

모델 아키텍처

1. 시각 스택 (Vision Stack)

  • 게이트 감지: YOLOv8n 모델(320만 매개변수) 사용하여 레이싱 게이트 감지
  • 모서리점 감지: 개선된 MobileNetV3-Small 모델(110만 매개변수)을 사용하여 게이트의 4개 내부 모서리 감지
  • 최적화 전략:
    • ONNX 그래프 및 TensorRT 엔진으로 변환
    • FP16 정밀도를 사용한 가속화
    • 프레임당 지연 24-30ms

2. 상태 추정 스택 (State Estimation Stack)

  • VIO 기반: Intel T265 스테레오 카메라가 시각 관성 주행 거리 측정 제공
  • 드리프트 보정:
    상태 벡터: x = p_d^T ∈ R³ (위치 드리프트 벡터)
    상태 전파: x_{k+1} = Fx_k, P_{k+1} = FP_kF^T + Q
    칼만 업데이트: K_k = P_k^-H^T(HP_k^-H^T + R)^{-1}
    
  • IMU 융합: 확장 칼만 필터를 사용하여 500Hz IMU 데이터 융합

3. 제어 스택 (Control Stack)

  • 시간 최적 궤적 생성: 강체 동역학 및 액추에이터 제약 고려
  • 모델 예측 제어: PAMPC 프레임워크 기반, 인식 감지 목표 비활성화
  • 지연 보상: 상태 예측기를 통합하여 계산 및 실행 지연 보상

기술 혁신 포인트

  1. 실측값 미세 조정 불필요: 기존 방법과 달리 시스템은 상태 추정 미세 조정을 위해 외부 추적 데이터에 의존하지 않음
  2. 고주파 IMU 통합: 최적화된 MSP 프로토콜을 통해 500Hz IMU 데이터 읽기 구현, SBUS 프로토콜의 10Hz와 비교하여 현저한 개선
  3. 견고한 시각 처리:
    • 고정 노출 설정으로 모션 블러 감소
    • 모델 증류 방법으로 주석 요구사항 감소(80프레임만 수동 주석 필요)
  4. 실시간 성능 최적화:
    • 실시간 Linux 커널 구성
    • GPU 가속 추론
    • 최적화된 데이터 흐름 아키텍처

실험 설정

데이터셋

  1. 계측 레이싱 트랙:
    • RATM 데이터셋 기반 재구성
    • 32개 카메라 Qualisys MoCap 시스템이 실측값 제공
    • 급회전, 나선형 구간 및 Split-S 기동 포함
  2. 비계측 레이싱 트랙:
    • Track Split-S 레이싱 트랙 재구성
    • 전자 경위의를 사용한 위치 결정(센티미터급 정확도)
    • 자연 조명 변화 조건

평가 지표

  • 랩 타임: 한 바퀴를 완료하는 데 걸리는 시간
  • 최고 속도: 비행 중 달성한 최고 속도
  • 경로 길이: 실제 비행 궤적 길이
  • 일관성: 여러 비행의 표준편차
  • 신뢰성: 성공 완료율 및 충돌 횟수

비교 방법

  • 프로급 조종사: 3명의 직업 조종사, 세계 챔피언 MCK 포함
  • 외부 추적: MoCap 시스템을 사용한 자율 비행
  • 순수 온보드: 온보드 센서만 사용한 자율 비행

구현 세부사항

  • 하드웨어 플랫폼: NVIDIA Orin NX + Intel RealSense T265
  • 추력 대 무게 비: ~7:1(배터리 용량 만충)
  • 무게: 665.5g(배터리 제외)
  • 통신: 1MBaud MSP 직렬 연결

실험 결과

주요 결과

계측 레이싱 트랙 성능

시스템평균 랩 타임(초)최고 랩 타임(초)최고 속도(m/s)충돌 횟수
MCK (세계 챔피언)4.71±1.253.8424.965
자율 시스템(MoCap)4.44±0.114.3922.280
자율 시스템(VIO)4.65±0.224.4022.20

비계측 레이싱 트랙 성능

시스템평균 랩 타임(초)최고 랩 타임(초)충돌 횟수
MCK5.80±0.405.052
자율 시스템6.02±0.065.924

절제 실험

  1. VIO vs MoCap: 온보드 VIO만 사용 시 외부 추적 대비 평균 랩 타임이 4.7% 느림
  2. 드리프트 보정 효과: 칼만 필터는 장시간 비행의 위치 추정 정확도를 크게 개선
  3. IMU 융합 기여: 500Hz IMU 데이터 융합은 더 부드러운 상태 추정 제공

사례 분석

  • Split-S 기동: 자율 시스템은 제약된 공간에서 우수한 성능 발휘, 궤적 일관성이 인간 조종사보다 우수
  • 나선형 구간: 인간 조종사가 핵심 성능 구간으로 식별, 자율 시스템은 최적화된 궤적을 통해 경쟁력 있는 성능 달성
  • 헤어핀 커브: 자율 시스템의 주요 제한 요인이 되며, 보수적인 추력 대 무게 비 설정 필요

실험 발견

  1. 일관성 우위: 자율 시스템은 현저히 더 나은 일관성 표시(표준편차 더 작음)
  2. 환경 적응성: 시스템은 다양한 조명 조건 및 필드 레이아웃에 성공적으로 적응
  3. 인간-기계 상호작용 과제: 공유 레이싱 트랙 경쟁에서 자율 시스템은 충돌에 더 취약

관련 연구

주요 연구 방향

  1. AlphaPilot 챌린지(2019): 획기적인 AI 드론 레이싱 경쟁
  2. 심층 강화 학습 방법: Kaufmann 등이 2023년 인간 수준을 초과하는 성능 시연
  3. 데이터셋 구축: RATM 데이터셋이 알고리즘 개발을 위한 벤치마크 제공

본 논문의 장점

  • 실제 환경 검증: 비계측 환경에서 프로급 성능을 달성한 첫 사례
  • 실용성 지향: 외부 추적 시스템에 의존하지 않으며 실제 응용 시나리오에 더 가까움
  • 시스템 완전성: 인식에서 제어까지의 완전한 솔루션 제공

결론 및 논의

주요 결론

  1. 자율 드론 시스템은 비계측 환경에서 프로급 조종사 수준에 도달할 수 있음
  2. 복잡한 알고리즘보다 적절한 엔지니어링 최적화 및 시스템 통합이 더 중요함
  3. 일관성은 인간에 대한 자율 시스템의 주요 장점

한계

  1. 공유 공간 과제: 인간-기계 혼합 경쟁에서 적응성 부족
  2. 환경 일반화: 환경 적응을 위해 여전히 소량의 데이터 필요
  3. 극한 성능: 최고 단일 랩 타임에서 여전히 최고 수준의 조종사보다 약간 뒤짐

향후 방향

  1. 스테레오 카메라에서 단안 카메라로 전환, 인간 시각 시스템에 더 가까워짐
  2. 다중 에이전트 상호작용 및 충돌 회피 개선
  3. 시뮬레이션-실제 전이 능력 향상

심층 평가

장점

  1. 높은 실용 가치: 실험실에서 실제 응용으로의 핵심 격차 해결
  2. 엔지니어링 완전성: 상세한 하드웨어 및 소프트웨어 구현 세부사항 제공
  3. 포괄적인 평가: 정량적 및 정성적 다차원 평가 포함
  4. 데이터 개방: 고품질 비행 데이터셋 공개

부족한 점

  1. 알고리즘 혁신 제한: 주로 기존 기술의 엔지니어링 통합
  2. 이론적 분석 부족: 시스템 성능 경계에 대한 이론적 분석 부재
  3. 시나리오 제한: 실내 구조화된 레이싱 트랙에서만 검증

영향력

  1. 산업화 추진: 드론 자율 기술의 상용화에 중요한 참고 자료 제공
  2. 벤치마크 의의: 비계측 환경에서의 성능 벤치마크 수립
  3. 오픈소스 기여: 데이터셋 및 코드 공개로 분야 발전 촉진

적용 시나리오

  • 실내 창고 및 물류 응용
  • 기반시설 검사
  • 수색 및 구조 작업
  • 엔터테인먼트 및 스포츠 경기

참고문헌

1 Hanover, D., et al. "Autonomous drone racing: A survey." IEEE Transactions on Robotics, 2024. 2 Kaufmann, E., et al. "Champion-level drone racing using deep reinforcement learning." Nature, 2023. 3 Bosello, M., et al. "Race against the machine: A fully-annotated, open-design dataset." IEEE RAL, 2024.


종합 평가: 이는 실험실 기술을 실제 배포 가능한 시스템으로 성공적으로 전환한 중요한 실용 가치를 지닌 엔지니어링 지향 논문입니다. 알고리즘 혁신 측면에서는 상대적으로 제한적이지만, 실제 환경 검증 및 시스템 엔지니어링 측면의 기여는 드론 자율 기술의 산업화 추진에 중요한 의의를 가집니다.