OrbitZoo: Multi-Agent Reinforcement Learning Environment for Orbital Dynamics
Oliveira, Dyreby, Caldas et al.
The increasing number of satellites and orbital debris has made space congestion a critical issue, threatening satellite safety and sustainability. Challenges such as collision avoidance, station-keeping, and orbital maneuvering require advanced techniques to handle dynamic uncertainties and multi-agent interactions. Reinforcement learning (RL) has shown promise in this domain, enabling adaptive, autonomous policies for space operations; however, many existing RL frameworks rely on custom-built environments developed from scratch, which often use simplified models and require significant time to implement and validate the orbital dynamics, limiting their ability to fully capture real-world complexities. To address this, we introduce OrbitZoo, a versatile multi-agent RL environment built on a high-fidelity industry standard library, that enables realistic data generation, supports scenarios like collision avoidance and cooperative maneuvers, and ensures robust and accurate orbital dynamics. The environment is validated against a real satellite constellation, Starlink, achieving a Mean Absolute Percentage Error (MAPE) of 0.16% compared to real-world data. This validation ensures reliability for generating high-fidelity simulations and enabling autonomous and independent satellite operations.
위성 및 궤도 잔해의 수량 증가에 따라 우주 혼잡이 위성 안전성과 지속 가능성을 위협하는 핵심 문제가 되었습니다. 충돌 회피, 위치 유지 및 궤도 기동 등의 과제는 동적 불확실성과 다중 에이전트 상호작용을 처리하기 위한 고급 기술이 필요합니다. 강화학습(RL)은 우주 작업을 위한 적응형 자율 정책을 제공할 수 있는 잠재력을 보여주고 있습니다. 그러나 많은 기존 RL 프레임워크는 처음부터 구축한 맞춤형 환경에 의존하며, 일반적으로 단순화된 모델을 사용하고 궤도 동역학 구현 및 검증에 상당한 시간이 필요하여 실제 세계의 복잡성을 충분히 포착할 수 있는 능력을 제한합니다. 이 문제를 해결하기 위해 본 논문은 고충실도 산업 표준 라이브러리를 기반으로 구축된 다목적 다중 에이전트 RL 환경인 OrbitZoo를 소개합니다. 이는 실제 데이터 생성을 가능하게 하고, 충돌 회피 및 협력 기동 등의 시나리오를 지원하며, 견고하고 정확한 궤도 동역학을 보장합니다. 이 환경은 실제 위성 별자리 Starlink와의 검증을 통해 실제 데이터 대비 평균 절대 백분율 오차(MAPE) 0.16%를 달성했습니다.
관련 궤도 RL 연구: Kolosa (2019), Herrera (2020), Casas (2022) 등
요약: OrbitZoo는 중요한 학술 및 실용 가치를 지닌 오픈소스 다중 에이전트 강화학습 환경으로, 고충실도 궤도 동역학 모델링과 실제 데이터 검증을 통해 우주 자율 시스템의 연구 및 개발을 위한 강력한 도구를 제공합니다. 이 연구는 RL의 항공우주 분야 응용을 추진할 뿐만 아니라 해당 학제 간 분야의 표준화 발전에도 중요한 기여를 합니다.