2025-11-21T23:34:16.264289

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Bosello, Pinzarrone, Kiade et al.

Drone technology is proliferating in many industries, including agriculture, logistics, defense, infrastructure, and environmental monitoring. Vision-based autonomy is one of its key enablers, particularly for real-world applications. This is essential for operating in novel, unstructured environments where traditional navigation methods may be unavailable. Autonomous drone racing has become the de facto benchmark for such systems. State-of-the-art research has shown that autonomous systems can surpass human-level performance in racing arenas. However, direct applicability to commercial and field operations is still limited as current systems are often trained and evaluated in highly controlled environments. In our contribution, the system's capabilities are analyzed within a controlled environment -- where external tracking is available for ground-truth comparison -- but also demonstrated in a challenging, uninstrumented environment -- where ground-truth measurements were never available. We show that our approach can match the performance of professional human pilots in both scenarios. We also publicly release the data from the flights carried out by our approach and a world-class human pilot.

academic

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

基本信息

论文ID: 2510.13644
标题: On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas
作者: Michael Bosello, Flavio Pinzarrone, Sara Kiade, Davide Aguiari, Yvo Keuter, Aaesha AlShehhi, Gyordan Caminati, Kei Long Wong, Ka Seng Chou, Junaid Halepota, Fares Alneyadi, Jacopo Panerati, Giovanni Pau
分类: cs.RO (机器人学)
发表时间: 2025年10月15日
论文链接: https://arxiv.org/abs/2510.13644

摘要

无人机技术正在农业、物流、国防、基础设施和环境监测等多个行业快速发展。基于视觉的自主性是其关键推动因素，特别是对于现实世界应用。这对于在传统导航方法可能不可用的新颖、非结构化环境中操作至关重要。自主无人机竞速已成为此类系统的事实标准基准。最新研究表明，自主系统可以在竞速场地中超越人类水平的表现。然而，直接应用于商业和现场操作仍然有限，因为当前系统通常在高度受控的环境中训练和评估。本文在受控环境（有外部跟踪可用于真值比较）和挑战性的非仪器化环境（从未有真值测量可用）中分析和展示了系统能力。研究表明该方法可以在两种场景中匹配专业人类飞行员的表现。

研究背景与动机

要解决的问题: 现有自主无人机竞速系统虽然在受控环境中能够超越人类表现，但在实际应用中面临挑战，特别是在没有外部跟踪系统的非仪器化环境中。
问题的重要性:
- 无人机技术在多个行业的广泛应用需要在非结构化环境中的可靠自主性
- 现实世界部署通常缺乏精确的外部定位系统
- 需要验证自主系统在真实条件下的鲁棒性
现有方法的局限性:
- 依赖高度受控的环境和外部跟踪系统
- 需要真值数据进行系统微调
- 在光照变化和未知环境中表现不稳定
研究动机: 开发能够在非仪器化环境中实现专业级表现的自主无人机系统，推动技术向实际商业应用转化。

核心贡献

实现了专业级自主无人机竞速: 在受控环境（有外部跟踪）和非仪器化环境（无真值测量）中都达到了专业水平
提出了鲁棒的感知和控制栈: 不需要使用真值数据进行残差估计微调，并证明了对多种光照条件的适应性
发布了专业级飞行数据集: 包含世界冠军飞行员的6次飞行数据，总飞行时间240.77秒，飞行距离2342.98米，最高速度21.29m/s
验证了人机对抗表现: 在多种场景下与世界级飞行员进行直接竞争，展示了系统的实用性

方法详解

任务定义

输入: 立体相机图像流、IMU数据、赛道门位置信息输出: 无人机控制指令（集体推力和机体角速率）约束: 实时性要求、动力学限制、避障要求

模型架构

1. 视觉栈 (Vision Stack)

门检测: 使用YOLOv8n模型（320万参数）检测赛道门
角点检测: 使用改进的MobileNetV3-Small模型（110万参数）检测门的四个内角
优化策略:
- 转换为ONNX图形和TensorRT引擎
- 使用FP16精度加速
- 每帧延迟24-30ms

2. 状态估计栈 (State Estimation Stack)

VIO基础: Intel T265立体相机提供视觉惯性里程计

漂移校正:

状态向量: x = p_d^T ∈ R³ (位置漂移向量)
状态传播: x_{k+1} = Fx_k, P_{k+1} = FP_kF^T + Q
卡尔曼更新: K_k = P_k^-H^T(HP_k^-H^T + R)^{-1}

IMU融合: 使用扩展卡尔曼滤波器融合500Hz IMU数据

3. 控制栈 (Control Stack)

时间最优轨迹生成: 考虑刚体动力学和执行器约束
模型预测控制: 基于PAMPC框架，禁用感知感知目标
延迟补偿: 集成状态预测器补偿计算和执行延迟

技术创新点

无需真值微调: 与现有方法不同，系统不依赖外部跟踪数据进行状态估计微调
高频IMU集成: 通过优化的MSP协议实现500Hz IMU数据读取，相比SBUS协议的10Hz有显著提升
鲁棒视觉处理:
- 固定曝光设置减少运动模糊
- 模型蒸馏方法减少标注需求（仅需80帧人工标注）
实时性能优化:
- 实时Linux内核配置
- GPU加速推理
- 优化的数据流架构

实验设置

数据集

仪器化赛道:
- 基于RATM数据集重建
- 32相机Qualisys MoCap系统提供真值
- 包含急转弯、螺旋段和Split-S机动
非仪器化赛道:
- 重建Track Split-S赛道
- 使用全站仪定位（厘米级精度）
- 自然光照变化条件

评价指标

圈速时间: 完成单圈的时间
最高速度: 飞行过程中达到的峰值速度
路径长度: 实际飞行轨迹长度
一致性: 多次飞行的标准差
可靠性: 成功完成率和碰撞次数

对比方法

专业飞行员: 3名职业飞行员，包括世界冠军MCK
外部跟踪: 使用MoCap系统的自主飞行
纯车载: 仅使用车载传感器的自主飞行

实现细节

硬件平台: NVIDIA Orin NX + Intel RealSense T265
推重比: ~7:1（满电池容量）
重量: 665.5g（不含电池）
通信: 1MBaud MSP串行连接

实验结果

主要结果

仪器化赛道表现

系统	平均圈速(s)	最佳圈速(s)	最高速度(m/s)	碰撞次数
MCK (世界冠军)	4.71±1.25	3.84	24.96	5
自主系统(MoCap)	4.44±0.11	4.39	22.28	0
自主系统(VIO)	4.65±0.22	4.40	22.2	0

非仪器化赛道表现

系统	平均圈速(s)	最佳圈速(s)	碰撞次数
MCK	5.80±0.40	5.05	2
自主系统	6.02±0.06	5.92	4

消融实验

VIO vs MoCap: 仅使用车载VIO相比外部跟踪，平均圈速仅慢4.7%
漂移校正效果: 卡尔曼滤波显著改善了长时间飞行的位置估计精度
IMU融合贡献: 500Hz IMU数据融合提供了更平滑的状态估计

案例分析

Split-S机动: 自主系统在约束空间中表现出色，轨迹一致性优于人类飞行员
螺旋段: 人类飞行员识别为关键性能区段，自主系统通过优化轨迹实现竞争性表现
发夹弯: 成为自主系统的主要限制因素，需要保守的推重比设置

实验发现

一致性优势: 自主系统表现出显著更好的一致性（标准差更小）
环境适应性: 系统成功适应了不同光照条件和场地布局
人机交互挑战: 在共享赛道竞争中，自主系统对碰撞更加脆弱

结论与讨论

主要结论

自主无人机系统可以在非仪器化环境中达到专业飞行员水平
适当的工程优化和系统集成比复杂算法更重要
一致性是自主系统相对人类的主要优势

局限性

共享空间挑战: 在人机混合竞赛中适应性不足
环境泛化: 仍需要少量数据进行环境适应
极限性能: 在最佳单圈时间上仍略逊于顶级飞行员

未来方向

从立体相机转向单目相机，更接近人类视觉系统
改善多智能体交互和碰撞避免
提升sim-to-real转移能力

深度评价

优点

实用价值高: 解决了从实验室到真实应用的关键gap
工程完整性: 提供了详细的硬件和软件实现细节
评估全面: 包含了定量和定性的多维度评估
数据开放: 公开发布高质量的飞行数据集

不足

算法创新有限: 主要是现有技术的工程集成
理论分析不足: 缺乏对系统性能边界的理论分析
场景局限: 仅在室内结构化赛道中验证

影响力

推动产业化: 为无人机自主技术的商业化提供重要参考
基准意义: 建立了非仪器化环境下的性能基准
开源贡献: 数据集和代码的开放将促进领域发展

适用场景

室内仓储和物流应用
基础设施检查
搜救任务
娱乐和体育竞技

参考文献

1 Hanover, D., et al. "Autonomous drone racing: A survey." IEEE Transactions on Robotics, 2024. 2 Kaufmann, E., et al. "Champion-level drone racing using deep reinforcement learning." Nature, 2023. 3 Bosello, M., et al. "Race against the machine: A fully-annotated, open-design dataset." IEEE RAL, 2024.

总体评价: 这是一篇具有重要实用价值的工程导向论文，成功地将实验室技术转化为实际可部署的系统。虽然在算法创新方面相对有限，但其在真实环境验证和系统工程方面的贡献对推动无人机自主技术的产业化具有重要意义。

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

基本信息

摘要

研究背景与动机

核心贡献

方法详解

任务定义

模型架构

1. 视觉栈 (Vision Stack)

2. 状态估计栈 (State Estimation Stack)

3. 控制栈 (Control Stack)

技术创新点

实验设置

数据集

评价指标

对比方法

实现细节

实验结果

主要结果

仪器化赛道表现

非仪器化赛道表现

消融实验

案例分析

实验发现

相关工作

主要研究方向

本文优势

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献