ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy
Mousist
This paper presents ASTREA, the first agentic system executed on flight-heritage hardware (TRL 9) for autonomous spacecraft operations, with on-orbit operation aboard the International Space Station (ISS). Using thermal control as a representative use case, we integrate a resource-constrained Large Language Model (LLM) agent with a reinforcement learning controller in an asynchronous architecture tailored for space-qualified platforms. Ground experiments show that LLM-guided supervision improves thermal stability and reduces violations, confirming the feasibility of combining semantic reasoning with adaptive control under hardware constraints. On-orbit validation aboard the ISS initially faced challenges due to inference latency misaligned with the rapid thermal cycles of Low Earth Orbit (LEO) satellites. Synchronization with the orbit length successfully surpassed the baseline with reduced violations, extended episode durations, and improved CPU utilization. These findings demonstrate the potential for scalable agentic supervision architectures in future autonomous spacecraft.
academic
ASTREA: Введение интеллектуальной агентной системы для автономного управления тепловым режимом космических аппаратов
В данной работе предлагается ASTREA — первая агентная система, работающая на летном оборудовании уровня готовности технологии (TRL 9) для автономных операций космических аппаратов с верификацией на орбите на Международной космической станции (МКС). На примере теплового контроля система интегрирует ограниченный по ресурсам агент на основе большой языковой модели (LLM) с контроллером на основе обучения с подкреплением (RL) в асинхронной архитектуре, адаптированной для космических платформ. Наземные эксперименты показали, что контроль, управляемый LLM, улучшает тепловую стабильность и снижает нарушения, подтверждая осуществимость сочетания семантического рассуждения с адаптивным управлением при аппаратных ограничениях. Орбитальная верификация на МКС первоначально столкнулась с проблемой несоответствия задержки вывода и быстрых тепловых циклов спутников на низкой земной орбите (НЗО). После синхронизации с орбитальным периодом система успешно превзошла базовый уровень, снизив нарушения на 66,2%, увеличив время работы на 245,8% и улучшив использование процессора на 20,1%.
Потребность в автономных операциях в космосе: С развитием лунных и орбитальных миссий возникает необходимость в космических системах, способных работать с минимальным вмешательством человека, особенно в условиях, когда задержки связи препятствуют прямому наземному контролю.
Сложность теплового контроля: Тепловой контроль является критической подсистемой, которая должна поддерживать целостность всех электронных компонентов при одновременном управлении ограниченными вычислительными ресурсами в реальном времени. Традиционные подходы полагаются на предварительно запрограммированные правила и наземный контроль, что снижает гибкость при работе с динамическими тепловыми нагрузками.
Ограничения аппаратных ресурсов: Большие языковые модели требуют значительных аппаратных ресурсов, что конфликтует с требованиями встроенных систем, которые должны быть радиационно-устойчивыми и работать в условиях строгих ограничений по энергопотреблению, размеру и температуре.
Первая летная агентная система: Реализация и верификация на МКС первой агентной системы контроля на основе LLM на оборудовании TRL 9
Гибридная асинхронная архитектура: Предложение гибридного дизайна, сочетающего эффективность обучения с подкреплением с интерпретируемостью языковых моделей
Стратегия орбитальной синхронизации: Обнаружение и верификация того, что окна вывода, синхронизированные с орбитальным периодом, преодолевают ограничения задержки
Практическое повышение производительности: Достижение 67,2% увеличения времени работы и 58,5% снижения тепловых нарушений в наземных экспериментах
Принципы проектирования космического ИИ: Предоставление практических рекомендаций по проектированию для будущих автономных систем НЗО
Входные данные: Данные датчиков температуры на борту, состояние использования процессора, информация о тепловых градиентах
Выходные данные: Динамически корректируемые рекомендации коэффициента энтропии (α) для оптимизации баланса исследования-эксплуатации агента RL
Ограничения:
Пороги температуры (60°C на земле, 57°C на орбите)
Вычислительные ресурсы одного ядра (ядро 0 выделено для системы ASTREA)
Базовая система: Чистый агент SAC с адаптивным расписанием α по умолчанию из Stable Baselines3, без внешнего вмешательства или обратной связи по производительности.
Важность временной синхронизации: Значительное снижение производительности при несоответствии периода вывода и динамики окружения
Стратегия выравнивания с орбитой: 90-минутное окно, синхронизированное с орбитой МКС, обеспечивает оптимальную производительность
Влияние задержки вывода: Время отклика LLM от 40 секунд до 8 минут подтверждает непригодность для контуров управления в реальном времени
Эффект раннего преимущества: Контроль, управляемый LLM, обеспечивает значительные улучшения на начальном этапе с сохранением стабильного преимущества в долгосрочной перспективе
Согласно классификации Schoepp и др., три роли LLM в RL:
Агент: LLM напрямую действует как политика для принятия решений
Планировщик: LLM разбивает сложные задачи на подзадачи
Модель вознаграждения: LLM генерирует или оценивает сигналы вознаграждения
ASTREA использует четвертый режим: Контролер, где LLM предоставляет рекомендации по корректировке параметров, при этом агент RL сохраняет операционную независимость.
Callejo, E., et al. (2023). Imagin-e: The first step towards extending the cloud into space.
Booz Allen Hamilton and Meta (2025). Booz allen and meta launch space llama.
Maranto, D. (2024). Llmsat: A large language model-based goal-oriented agent for autonomous space exploration.
Touma, T., et al. (2025). Ai space cortex: An experimental system for future era space exploration.
Yang, A., et al. (2024). Qwen2 technical report.
Общая оценка: Данная работа имеет важное новаторское значение в области приложений космического ИИ. Благодаря строгому экспериментальному дизайну и полной верификации она закладывает прочную основу для развития будущих интеллектуальных космических аппаратов. Несмотря на некоторые технические ограничения, ее инженерная ценность и научный вклад значительны и заслуживают дальнейшего углубленного исследования и развития.