ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy
Mousist
This paper presents ASTREA, the first agentic system executed on flight-heritage hardware (TRL 9) for autonomous spacecraft operations, with on-orbit operation aboard the International Space Station (ISS). Using thermal control as a representative use case, we integrate a resource-constrained Large Language Model (LLM) agent with a reinforcement learning controller in an asynchronous architecture tailored for space-qualified platforms. Ground experiments show that LLM-guided supervision improves thermal stability and reduces violations, confirming the feasibility of combining semantic reasoning with adaptive control under hardware constraints. On-orbit validation aboard the ISS initially faced challenges due to inference latency misaligned with the rapid thermal cycles of Low Earth Orbit (LEO) satellites. Synchronization with the orbit length successfully surpassed the baseline with reduced violations, extended episode durations, and improved CPU utilization. These findings demonstrate the potential for scalable agentic supervision architectures in future autonomous spacecraft.
academic
ASTREA: कक्षीय तापीय स्वायत्तता के लिए एजेंटिक बुद्धिमत्ता का परिचय
यह पेपर ASTREA प्रस्तुत करता है, जो उड़ान-स्तरीय हार्डवेयर (TRL 9) पर निष्पादित होने वाली पहली एजेंट प्रणाली है, जिसका उपयोग अंतरिक्ष यान की स्वायत्त संचालन के लिए किया जाता है, और अंतर्राष्ट्रीय अंतरिक्ष स्टेशन (ISS) पर कक्षीय सत्यापन किया गया है। तापीय नियंत्रण को प्रतिनिधि उपयोग मामले के रूप में लेते हुए, यह प्रणाली संसाधन-सीमित बड़े भाषा मॉडल (LLM) एजेंट को सुदृढ़ीकरण सीखने वाले नियंत्रक के साथ अंतरिक्ष-स्तरीय प्लेटफॉर्म के लिए अनुकूलित एक अतुल्यकालिक आर्किटेक्चर में एकीकृत करता है। जमीन पर प्रयोगों से पता चलता है कि LLM-निर्देशित निरीक्षण ने तापीय स्थिरता में सुधार किया और उल्लंघनों को कम किया, जो हार्डवेयर बाधाओं के तहत शब्दार्थ तर्क और अनुकूली नियंत्रण को जोड़ने की व्यवहार्यता की पुष्टि करता है। ISS पर कक्षीय सत्यापन शुरुआत में तर्क विलंब और निम्न पृथ्वी कक्षा (LEO) उपग्रहों के तीव्र तापीय चक्र के बीच असमानता की चुनौतियों का सामना करता है। कक्षीय लंबाई के साथ सिंक्रोनाइज़ेशन के बाद, यह आधारभूत को सफलतापूर्वक पार करता है, उल्लंघनों को कम करता है, संचालन समय को बढ़ाता है, और CPU उपयोग में सुधार करता है।
अंतरिक्ष स्वायत्त संचालन की आवश्यकता: चंद्र मिशन और पृथ्वी कक्षा मिशन के विकास के साथ, ऐसी अंतरिक्ष प्रणालियों की आवश्यकता है जो न्यूनतम मानवीय हस्तक्षेप के साथ संचालित हो सकें, विशेष रूप से उन वातावरणों में जहां संचार विलंब सीधी जमीन निगरानी में बाधा डालता है।
तापीय नियंत्रण की जटिलता: तापीय नियंत्रण एक महत्वपूर्ण उप-प्रणाली है जिसे सभी इलेक्ट्रॉनिक घटकों की परिचालन अखंडता को बनाए रखते हुए सीमित कम्प्यूटेशनल संसाधनों को वास्तविक समय में प्रबंधित करना चाहिए। पारंपरिक विधियां पूर्व-प्रोग्राम किए गए नियमों और जमीन निगरानी पर निर्भर करती हैं, जो गतिशील तापीय भार का सामना करने के लिए लचीलापन की कमी करती हैं।
हार्डवेयर संसाधन बाधाएं: बड़े भाषा मॉडलों को बड़ी मात्रा में हार्डवेयर संसाधनों की आवश्यकता होती है, जो विकिरण-सहिष्णु होने और शक्ति, आकार और तापमान की कठोर बाधाओं के तहत संचालित होने वाले एम्बेडेड वातावरण के साथ संघर्ष करता है।
इनपुट: ऑनबोर्ड तापमान सेंसर डेटा, CPU उपयोग स्थिति, तापीय ढाल जानकारी
आउटपुट: गतिशील रूप से समायोजित एंट्रॉपी गुणांक (α) सिफारिशें, सुदृढ़ीकरण सीखने वाले एजेंट के अन्वेषण-शोषण संतुलन को अनुकूलित करने के लिए
बाधा शर्तें:
तापमान थ्रेसहोल्ड सीमाएं (जमीन 60°C, कक्षीय 57°C)
एकल-कोर कम्प्यूटेशनल संसाधन (कोर 0 एजेंट प्रणाली के लिए समर्पित)
Callejo, E., et al. (2023). Imagin-e: The first step towards extending the cloud into space.
Booz Allen Hamilton and Meta (2025). Booz allen and meta launch space llama.
Maranto, D. (2024). Llmsat: A large language model-based goal-oriented agent for autonomous space exploration.
Touma, T., et al. (2025). Ai space cortex: An experimental system for future era space exploration.
Yang, A., et al. (2024). Qwen2 technical report.
समग्र मूल्यांकन: यह पेपर अंतरिक्ष AI अनुप्रयोग क्षेत्र में महत्वपूर्ण अग्रणी महत्व रखता है। कठोर प्रयोगात्मक डिज़ाइन और पर्याप्त सत्यापन के माध्यम से, यह भविष्य की बुद्धिमान अंतरिक्ष यान के विकास के लिए एक ठोस आधार स्थापित करता है। यद्यपि कुछ तकनीकी सीमाएं हैं, लेकिन इसका इंजीनियरिंग मूल्य और शैक्षणिक योगदान महत्वपूर्ण है, गहन अनुसंधान और आगे के विकास के योग्य है।