OrbitZoo: Multi-Agent Reinforcement Learning Environment for Orbital Dynamics
Oliveira, Dyreby, Caldas et al.
The increasing number of satellites and orbital debris has made space congestion a critical issue, threatening satellite safety and sustainability. Challenges such as collision avoidance, station-keeping, and orbital maneuvering require advanced techniques to handle dynamic uncertainties and multi-agent interactions. Reinforcement learning (RL) has shown promise in this domain, enabling adaptive, autonomous policies for space operations; however, many existing RL frameworks rely on custom-built environments developed from scratch, which often use simplified models and require significant time to implement and validate the orbital dynamics, limiting their ability to fully capture real-world complexities. To address this, we introduce OrbitZoo, a versatile multi-agent RL environment built on a high-fidelity industry standard library, that enables realistic data generation, supports scenarios like collision avoidance and cooperative maneuvers, and ensures robust and accurate orbital dynamics. The environment is validated against a real satellite constellation, Starlink, achieving a Mean Absolute Percentage Error (MAPE) of 0.16% compared to real-world data. This validation ensures reliability for generating high-fidelity simulations and enabling autonomous and independent satellite operations.
academic
OrbitZoo: Entorno de Aprendizaje por Refuerzo Multi-Agente para Dinámicas Orbitales
Con el aumento continuo del número de satélites y escombros orbitales, la congestión espacial se ha convertido en un problema crítico que amenaza la seguridad y sostenibilidad de los satélites. Desafíos como la evitación de colisiones, el mantenimiento de posición y las maniobras orbitales requieren tecnologías avanzadas para manejar la incertidumbre dinámica y las interacciones multi-agente. El aprendizaje por refuerzo (RL) ha demostrado potencial en este campo, proporcionando estrategias adaptativas y autónomas para operaciones espaciales; sin embargo, muchos marcos RL existentes dependen de entornos personalizados construidos desde cero, frecuentemente utilizando modelos simplificados que requieren considerable tiempo para implementar y validar dinámicas orbitales, limitando su capacidad para capturar plenamente la complejidad del mundo real. Para abordar este problema, presentamos OrbitZoo, un entorno versátil multi-agente RL construido sobre bibliotecas estándar industriales de alta fidelidad, capaz de generar datos realistas, soportar escenarios de evitación de colisiones y maniobras colaborativas, y garantizar dinámicas orbitales robustas y precisas. El entorno ha sido validado con la constelación de satélites real Starlink, logrando un error porcentual absoluto medio (MAPE) de 0.16% en comparación con datos del mundo real.
Problema de Congestión Espacial: Desde 1957, la humanidad ha lanzado aproximadamente 20,000 satélites, y actualmente existen aproximadamente 140 millones de fragmentos de escombros en el entorno orbital, de los cuales aproximadamente 1 millón tienen un tamaño superior a 1 centímetro, suficiente para causar daños catastróficos en caso de impacto.
Amenaza del Síndrome de Kessler: Las colisiones de escombros generan más escombros, formando una reacción en cadena que podría hacer que las órbitas terrestres sean inutilizables.
Limitaciones de Métodos Tradicionales: Las soluciones actuales de maniobra de satélites dependen fuertemente de procesos manuales, volviéndose insostenibles a medida que aumenta continuamente el número de satélites y escombros orbitales.
Necesidad de Automatización: Desarrollar sistemas de toma de decisiones inteligentes autónomos más rápidos y capaces.
Potencial de Aplicación de RL: RL demuestra excelente desempeño en adaptación en tiempo real a sistemas espaciales complejos, dinámicos y no lineales.
Falta de Estandarización: Los marcos RL existentes carecen de estandarización, la mayoría basados en modelos simplificados que dificultan capturar la complejidad del mundo real.
Generación de Datos de Alta Fidelidad: Construido sobre bibliotecas de dinámicas espaciales de Python y robustas, integra fuerzas reales y perturbaciones, proporcionando conjuntos de datos precisos que soportan computación paralela para propagación rápida.
Soporte para Aprendizaje por Refuerzo Multi-Agente: Plataforma de investigación RL estandarizada que aprovecha la biblioteca PettingZoo para soportar procesos de decisión de Markov parcialmente observables (POMDP) multi-agente, permitiendo escalabilidad de sistemas con miles de cuerpos celestes.
Marco Personalizable y Visualización: El diseño modular permite a los usuarios definir escenarios con un número arbitrario de cuerpos celestes, integrar modelos personalizados, con clara separación de capas de abstracción, proporcionando componentes de visualización 3D interactiva.
Validación en el Mundo Real: Mediante validación comparativa con la constelación de satélites Starlink, logrando un MAPE de 0.16%, garantizando la confiabilidad de la simulación de alta fidelidad.
Los experimentos comparativos muestran que agregar penalización en dirección tangencial (α2=0.5) en la función de recompensa mejora significativamente el aprendizaje:
Convergencia más rápida a órbita objetivo
Reducción de maniobras innecesarias fuera del plano orbital
Orekit: Biblioteca de mecánica celeste de código abierto
PettingZoo: Estándar de entorno RL multi-agente
Datos de efemérides Starlink: Datos de validación de órbita satelital
Investigación RL orbital relacionada: Kolosa (2019), Herrera (2020), Casas (2022), etc.
Resumen: OrbitZoo es un entorno de aprendizaje por refuerzo multi-agente de código abierto con importante valor académico y práctico, que proporciona una herramienta poderosa para la investigación y desarrollo de sistemas autónomos espaciales mediante modelado de dinámicas orbitales de alta fidelidad y validación con datos reales. Este trabajo no solo avanza la aplicación de RL en el campo aeroespacial, sino que también realiza contribuciones importantes al desarrollo estandarizado de esta disciplina interdisciplinaria.