2025-11-24T22:58:17.201528

ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy

Mousist
This paper presents ASTREA, the first agentic system executed on flight-heritage hardware (TRL 9) for autonomous spacecraft operations, with on-orbit operation aboard the International Space Station (ISS). Using thermal control as a representative use case, we integrate a resource-constrained Large Language Model (LLM) agent with a reinforcement learning controller in an asynchronous architecture tailored for space-qualified platforms. Ground experiments show that LLM-guided supervision improves thermal stability and reduces violations, confirming the feasibility of combining semantic reasoning with adaptive control under hardware constraints. On-orbit validation aboard the ISS initially faced challenges due to inference latency misaligned with the rapid thermal cycles of Low Earth Orbit (LEO) satellites. Synchronization with the orbit length successfully surpassed the baseline with reduced violations, extended episode durations, and improved CPU utilization. These findings demonstrate the potential for scalable agentic supervision architectures in future autonomous spacecraft.
academic

ASTREA: ๊ถค๋„ ์—ด ์ž์œจ์„ฑ์„ ์œ„ํ•œ ์—์ด์ „ํŠธ ์ง€๋Šฅ ๋„์ž…

๊ธฐ๋ณธ ์ •๋ณด

  • ๋…ผ๋ฌธ ID: 2509.13380
  • ์ œ๋ชฉ: ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy
  • ์ €์ž: Alejandro D. Mousist (Thales Alenia Space, Tres Cantos, Spain)
  • ๋ถ„๋ฅ˜: cs.RO cs.AI cs.LG cs.MA cs.SY eess.SY
  • ๋ฐœํ‘œ ์‹œ๊ฐ„: 2025๋…„ 10์›” 11์ผ (arXiv v2)
  • ๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2509.13380

์ดˆ๋ก

๋ณธ ๋…ผ๋ฌธ์€ ๋น„ํ–‰๊ธ‰ ํ•˜๋“œ์›จ์–ด(TRL 9)์—์„œ ์‹คํ–‰๋˜๋ฉฐ ๊ตญ์ œ์šฐ์ฃผ์ •๊ฑฐ์žฅ(ISS)์—์„œ ๊ถค๋„์ƒ ์šด์˜ ๊ฒ€์ฆ์„ ๊ฑฐ์นœ ์šฐ์ฃผ์„  ์ž์œจ ์šด์˜์„ ์œ„ํ•œ ์ฒซ ๋ฒˆ์งธ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์ธ ASTREA๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์—ด ์ œ์–ด๋ฅผ ๋Œ€ํ‘œ์ ์ธ ์‚ฌ์šฉ ์‚ฌ๋ก€๋กœ ํ•˜์—ฌ, ๋ณธ ์‹œ์Šคํ…œ์€ ์ž์› ์ œ์•ฝ์ด ์žˆ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM) ์—์ด์ „ํŠธ์™€ ๊ฐ•ํ™”ํ•™์Šต ์ œ์–ด๊ธฐ๋ฅผ ์šฐ์ฃผ๊ธ‰ ํ”Œ๋žซํผ์— ๋งž์ถคํ™”๋œ ๋น„๋™๊ธฐ ์•„ํ‚คํ…์ฒ˜์— ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ง€์ƒ ์‹คํ—˜์—์„œ๋Š” LLM ๊ธฐ๋ฐ˜ ๊ฐ๋…์ด ์—ด ์•ˆ์ •์„ฑ์„ ๊ฐœ์„ ํ•˜๊ณ  ์œ„๋ฐ˜ ์‚ฌํ•ญ์„ ๊ฐ์†Œ์‹œ์ผฐ์œผ๋ฉฐ, ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ํ•˜์—์„œ ์˜๋ฏธ๋ก ์  ์ถ”๋ก ๊ณผ ์ ์‘ํ˜• ์ œ์–ด๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์˜ ํƒ€๋‹น์„ฑ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค. ISS์˜ ๊ถค๋„์ƒ ๊ฒ€์ฆ์€ ์ดˆ๊ธฐ์— ์ถ”๋ก  ์ง€์—ฐ๊ณผ ์ €์ง€๊ตฌ๊ถค๋„(LEO) ์œ„์„ฑ์˜ ๋น ๋ฅธ ์—ด ์ˆœํ™˜ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ์— ์ง๋ฉดํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ถค๋„ ๊ธธ์ด์™€ ๋™๊ธฐํ™”ํ•œ ํ›„ ๊ธฐ์ค€์„ ์„ ์ดˆ๊ณผํ•˜์—ฌ ์œ„๋ฐ˜ ํšŸ์ˆ˜๋ฅผ ๊ฐ์†Œ์‹œํ‚ค๊ณ , ์šด์˜ ์‹œ๊ฐ„์„ ์—ฐ์žฅํ•˜๋ฉฐ, CPU ํ™œ์šฉ๋ฅ ์„ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋™๊ธฐ

๋ฌธ์ œ ์ •์˜

  1. ์šฐ์ฃผ ์ž์œจ ์šด์˜์˜ ํ•„์š”์„ฑ: ๋‹ฌ ์ž„๋ฌด ๋ฐ ์ง€๊ตฌ ๊ถค๋„ ์ž„๋ฌด์˜ ๋ฐœ์ „์— ๋”ฐ๋ผ ์ตœ์†Œํ•œ์˜ ์ธ์  ๊ฐœ์ž…์œผ๋กœ ์šด์˜ํ•  ์ˆ˜ ์žˆ๋Š” ์šฐ์ฃผ ์‹œ์Šคํ…œ์ด ํ•„์š”ํ•˜๋ฉฐ, ํŠนํžˆ ํ†ต์‹  ์ง€์—ฐ์ด ์ง์ ‘์ ์ธ ์ง€์ƒ ๊ฐ์‹œ๋ฅผ ๋ฐฉํ•ดํ•˜๋Š” ํ™˜๊ฒฝ์—์„œ ๊ทธ๋Ÿฌํ•ฉ๋‹ˆ๋‹ค.
  2. ์—ด ์ œ์–ด์˜ ๋ณต์žก์„ฑ: ์—ด ์ œ์–ด๋Š” ์ œํ•œ๋œ ๊ณ„์‚ฐ ์ž์›์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ด€๋ฆฌํ•˜๋ฉด์„œ ๋ชจ๋“  ์ „์ž ๋ถ€ํ’ˆ์˜ ์šด์˜ ๋ฌด๊ฒฐ์„ฑ์„ ์œ ์ง€ํ•ด์•ผ ํ•˜๋Š” ์ค‘์š”ํ•œ ๋ถ€๋ถ„ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ ์‚ฌ์ „ ํ”„๋กœ๊ทธ๋ž˜๋ฐ๋œ ๊ทœ์น™๊ณผ ์ง€์ƒ ๊ฐ์‹œ์— ์˜์กดํ•˜๋ฉฐ, ๋™์  ์—ด ๋ถ€ํ•˜์— ๋Œ€์‘ํ•  ์œ ์—ฐ์„ฑ์ด ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค.
  3. ํ•˜๋“œ์›จ์–ด ์ž์› ์ œ์•ฝ: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์€ ์ƒ๋‹นํ•œ ํ•˜๋“œ์›จ์–ด ์ž์›์„ ํ•„์š”๋กœ ํ•˜๋Š”๋ฐ, ์ด๋Š” ๋ฐฉ์‚ฌ์„  ๋‚ด์„ฑ์„ ์œ ์ง€ํ•˜๊ณ  ์ „๋ ฅ, ํฌ๊ธฐ ๋ฐ ์˜จ๋„์˜ ์—„๊ฒฉํ•œ ์ œ์•ฝ ํ•˜์—์„œ ์šด์˜ํ•ด์•ผ ํ•˜๋Š” ์ž„๋ฒ ๋””๋“œ ํ™˜๊ฒฝ๊ณผ ์ถฉ๋Œํ•ฉ๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์˜ ์˜์˜

  • ๊ธฐ์ˆ ์  ๋ŒํŒŒ: ์‹ค์ œ ๋น„ํ–‰ ํ™˜๊ฒฝ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ฐ๋… ์‹œ์Šคํ…œ์„ ์ฒ˜์Œ์œผ๋กœ ๋ฐฐํฌ
  • ์‹ค์šฉ์  ๊ฐ€์น˜: ํ–ฅํ›„ ์ž์œจ ์šฐ์ฃผ์„ ์„ ์œ„ํ•œ ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ์—์ด์ „ํŠธ ๊ฐ๋… ์•„ํ‚คํ…์ฒ˜ ๊ตฌ์ถ•
  • ์ด๋ก ์  ๊ธฐ์—ฌ: ์šฐ์ฃผ ์ œ์•ฝ ํ™˜๊ฒฝ์—์„œ ์˜๋ฏธ๋ก ์  ์ถ”๋ก ๊ณผ ์ ์‘ํ˜• ์ œ์–ด์˜ ๊ฒฐํ•ฉ ํƒ์ƒ‰

๊ธฐ์กด ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„

  1. Space Llama: ์—์ด์ „ํŠธ ํ–‰๋™์ด ๋ถ€์กฑํ•˜๋ฉฐ ์šฐ์ฃผ๋น„ํ–‰์‚ฌ์˜ ์ˆ˜๋™ ์‚ฌ์šฉ์—๋งŒ ์‚ฌ์šฉ๋จ
  2. LLMSat ๋ฐ AI Space Cortex: ์ฃผ๋กœ ์ง€์ƒ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๊ฒ€์ฆ๋˜์—ˆ์œผ๋ฉฐ ์‹ค์ œ ๋น„ํ–‰ ๊ฒ€์ฆ์ด ์—†์Œ
  3. ๊ธฐ์กด ์—ด ์ œ์–ด: ์‚ฌ์ „ ์„ค์ •๋œ ๊ทœ์น™์— ์˜์กดํ•˜๋ฉฐ ์ƒํ™ฉ๋ณ„ ์„ค๋ช…๊ณผ ์ ์‘์„ฑ์ด ๋ถ€์กฑํ•จ

ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ์ฒซ ๋ฒˆ์งธ ๋น„ํ–‰๊ธ‰ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ: TRL 9 ํ•˜๋“œ์›จ์–ด์—์„œ ๊ตฌํ˜„๋˜๊ณ  ISS์—์„œ ๊ฒ€์ฆ๋œ ์ฒซ ๋ฒˆ์งธ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๊ฐ๋… ์‹œ์Šคํ…œ
  2. ํ˜ผํ•ฉ ๋น„๋™๊ธฐ ์•„ํ‚คํ…์ฒ˜: ๊ฐ•ํ™”ํ•™์Šต์˜ ํšจ์œจ์„ฑ๊ณผ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ๊ฒฐํ•ฉํ•œ ํ˜ผํ•ฉ ์„ค๊ณ„ ์ œ์‹œ
  3. ๊ถค๋„ ๋™๊ธฐํ™” ์ „๋žต: ๊ถค๋„ ์ฃผ๊ธฐ์™€ ๋™๊ธฐํ™”๋œ ์ถ”๋ก  ์œˆ๋„์šฐ๊ฐ€ ์ง€์—ฐ ์ œ์•ฝ์„ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ฐœ๊ฒฌ ๋ฐ ๊ฒ€์ฆ
  4. ์‹ค์ œ ์„ฑ๋Šฅ ํ–ฅ์ƒ: ์ง€์ƒ ์‹คํ—˜์—์„œ ์šด์˜ ์‹œ๊ฐ„ 67.2% ์ฆ๊ฐ€ ๋ฐ ์—ด ์œ„๋ฐ˜ 58.5% ๊ฐ์†Œ ๋‹ฌ์„ฑ
  5. ์šฐ์ฃผ AI ์„ค๊ณ„ ์ง€์นจ: ํ–ฅํ›„ LEO ์ž์œจ ์‹œ์Šคํ…œ์„ ์œ„ํ•œ ์‹ค์šฉ์ ์ธ ์„ค๊ณ„ ์ง€์นจ ์›์น™ ์ œ๊ณต

๋ฐฉ๋ฒ• ์ƒ์„ธ ์„ค๋ช…

์ž‘์—… ์ •์˜

์ž…๋ ฅ: ์˜จ๋ณด๋“œ ์˜จ๋„ ์„ผ์„œ ๋ฐ์ดํ„ฐ, CPU ํ™œ์šฉ๋ฅ  ์ƒํƒœ, ์—ด ๊ตฌ๋ฐฐ ์ •๋ณด ์ถœ๋ ฅ: ๊ฐ•ํ™”ํ•™์Šต ์—์ด์ „ํŠธ์˜ ํƒ์ƒ‰-ํ™œ์šฉ ๊ท ํ˜•์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ๋™์  ์กฐ์ • ์—”ํŠธ๋กœํ”ผ ๊ณ„์ˆ˜(ฮฑ) ์ œ์•ˆ ์ œ์•ฝ ์กฐ๊ฑด:

  • ์˜จ๋„ ์ž„๊ณ„๊ฐ’ ์ œํ•œ (์ง€์ƒ 60ยฐC, ๊ถค๋„์ƒ 57ยฐC)
  • ๋‹จ์ผ ์ฝ”์–ด ๊ณ„์‚ฐ ์ž์› (์ฝ”์–ด 0 ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ ์ „์šฉ)
  • ์ถ”๋ก  ์ง€์—ฐ (40์ดˆ์—์„œ 8๋ถ„ ๋ฒ”์œ„)

๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜

์ „์ฒด ์‹œ์Šคํ…œ ์„ค๊ณ„

ASTREA๋Š” ์ด์ค‘ ์—์ด์ „ํŠธ ๋น„๋™๊ธฐ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค:

  1. RL ์—์ด์ „ํŠธ (์‹ค์‹œ๊ฐ„ ๊ณ„์ธต):
    • Soft Actor-Critic (SAC) ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ธฐ๋ฐ˜
    • ์˜จ๋ณด๋“œ ์˜จ๋„ ์ง€์†์  ๋ชจ๋‹ˆํ„ฐ๋ง
    • 15๊ฐœ CPU ์ฝ”์–ด์˜ ์ž์› ๊ฐ€์šฉ์„ฑ ์‹ค์‹œ๊ฐ„ ์กฐ์ •
    • ์ฝ”์–ด ์ฃผํŒŒ์ˆ˜ ๋ฐ ์ „์› ์ƒํƒœ ๊ด€๋ฆฌ
  2. LLM ์—์ด์ „ํŠธ (๊ฐ๋… ๊ณ„์ธต):
    • ์–‘์žํ™”๋œ Qwen2.5 ๋ชจ๋ธ ์‚ฌ์šฉ (15.4์–ต ๋งค๊ฐœ๋ณ€์ˆ˜, 4๋น„ํŠธ ์–‘์žํ™”)
    • Llama.cpp๋ฅผ ํ†ตํ•œ ์˜จ๋””๋ฐ”์ด์Šค ์ถ”๋ก 
    • ์˜๋ฏธ๋ก ์  ์ถ”๋ก  ๋ฐ ์ƒํ™ฉ๋ณ„ ์ธ์‹ ๋งค๊ฐœ๋ณ€์ˆ˜ ์กฐ์ • ์ œ์•ˆ ์ œ๊ณต

ํ†ต์‹  ๋ฉ”์ปค๋‹ˆ์ฆ˜

RL ์—์ด์ „ํŠธ โ†’ ๋น„๋™๊ธฐ ํ โ†’ LLM ์—์ด์ „ํŠธ
         โ†“
    ์šด์˜ ์š”์•ฝ (๋ฐ˜๋ณต ํšŸ์ˆ˜, ์œ„ํ—˜ ์˜์—ญ ๋‹จ๊ณ„, ํ‰๊ท  ์—ด ๊ตฌ๋ฐฐ)
         โ†“
LLM ์—์ด์ „ํŠธ โ†’ ๋น„๋™๊ธฐ ํ โ†’ RL ์—์ด์ „ํŠธ  
         โ†“
    ฮฑ ๊ณ„์ˆ˜ ์ œ์•ˆ (๋„๊ตฌ ํ˜ธ์ถœ์„ ํ†ตํ•ด ์ƒ์„ฑ)

์ฃผ์š” ๊ธฐ์ˆ  ๊ตฌ์„ฑ ์š”์†Œ

1. ๊ฐ•ํ™”ํ•™์Šต ์—์ด์ „ํŠธ

  • ์ƒํƒœ ๊ณต๊ฐ„: ์˜จ๋„ ์„ผ์„œ ํŒ๋…๊ฐ’, CPU ์ฃผํŒŒ์ˆ˜, ์œ„ํ—˜ ๋น„์œจ
  • ํ–‰๋™ ๊ณต๊ฐ„: 15๊ฐœ ์ฝ”์–ด์˜ ์ฃผํŒŒ์ˆ˜ ๋ฐ ์ „์› ์ƒํƒœ ์กฐ์ •
  • ๋ณด์ƒ ํ•จ์ˆ˜: ๊ธฐ๋ณธ ์ƒ์กด ๋ณด์ƒ + ์—ด ์•ˆ์ „ ๋ณด์ƒ
  • ์ƒˆ๋กœ์šด ๊ด€์ธก ํŠน์„ฑ: ์œ„ํ—˜ ๋น„์œจ (10% ์ž„๊ณ„๊ฐ’ ๋‚ด ์„ผ์„œ ๋น„์œจ)

2. LLM ์—์ด์ „ํŠธ ๋„๊ตฌ ์„ธํŠธ

  • increase_exploration: ฮฑ โˆˆ 0.4, 0.8
  • moderate_exploration: ฮฑ โˆˆ 0.2, 0.4
  • decrease_exploration: ฮฑ โˆˆ 0.05, 0.2
  • keep_alpha: ํ˜„์žฌ ๊ฐ’ ์œ ์ง€
  • reset_alpha: ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ ์žฌ์„ค์ • (0.2)

๊ธฐ์ˆ  ํ˜์‹  ํฌ์ธํŠธ

  1. ๋น„๋™๊ธฐ ๋ถ„๋ฆฌ ์„ค๊ณ„: LLM ์ถ”๋ก  ์ง€์—ฐ์ด ์‹ค์‹œ๊ฐ„ ์ œ์–ด์— ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋„๋ก ํ•˜์—ฌ ์‹œ์Šคํ…œ ์•ˆ์ „์„ฑ ๋ณด์žฅ
  2. ์˜๋ฏธ๋ก ์  ๋งค๊ฐœ๋ณ€์ˆ˜ ์กฐ์ •: LLM์˜ ์ƒํ™ฉ๋ณ„ ์ดํ•ด ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ RL ์—์ด์ „ํŠธ์˜ ํƒ์ƒ‰ ์ „๋žต ์ตœ์ ํ™”
  3. ๊ถค๋„ ์ฃผ๊ธฐ ์ •๋ ฌ: LEO ํ™˜๊ฒฝ์˜ ์ฃผ๊ธฐ์  ํŠน์„ฑ์„ ๋ฐœ๊ฒฌํ•˜๊ณ  ํ™œ์šฉํ•˜์—ฌ ์—์ด์ „ํŠธ ๋™๊ธฐํ™”
  4. ์—ฃ์ง€ ์ปดํ“จํŒ… ์ ์‘: ์šฐ์ฃผ๊ธ‰ ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์— ๋งž์ถ˜ ๋ชจ๋ธ ์–‘์žํ™” ๋ฐ ์ถ”๋ก  ์ „๋žต ์ตœ์ ํ™”

์‹คํ—˜ ์„ค์ •

์‹คํ—˜ ํ™˜๊ฒฝ

1. ์ง€์ƒ ์‹คํ—˜์‹ค

  • ๋Šฅ๋™ํ˜• ํŒฌ ๋ƒ‰๊ฐ์ด ์žฅ์ฐฉ๋œ ์†Œํ˜• ๋ž™ ๊ตฌ์„ฑ
  • ๋‚ฎ 10์‹œ๊ฐ„ ์˜จ๋„ ์ œ์–ด, ๋ฐค ์ž์—ฐ ์˜จ๋„ ๋ณ€๋™
  • 60๋ถ„ ์‹œ๊ฐ„ ์œˆ๋„์šฐ์—์„œ ์šด์˜ ์š”์•ฝ ์ˆ˜์ง‘

2. ISS ๊ถค๋„์ƒ ๋ฐฐํฌ

  • ์ฝœ๋Ÿผ๋ฒ„์Šค ๋ชจ๋“ˆ ์™ธ๋ถ€ ํƒ‘์žฌ ํ”Œ๋žซํผ
  • 90๋ถ„ ๊ถค๋„ ์ฃผ๊ธฐ (45๋ถ„ ์ผ๊ด‘ + 45๋ถ„ ๊ทธ๋ฆผ์ž)
  • ์ˆ˜๋™ํ˜• ์—ด ํŒŒ์ดํ”„ ๋ฐฉ์—ด, ๋Šฅ๋™ํ˜• ๋ƒ‰๊ฐ ์—†์Œ
  • ๋‘ ๊ฐ€์ง€ ๊ตฌ์„ฑ: 15๋ถ„ ๋‹จ๊ธฐ ์ฃผ๊ธฐ vs 90๋ถ„ ๊ถค๋„ ์ฃผ๊ธฐ

ํ•˜๋“œ์›จ์–ด ํ”Œ๋žซํผ

  • ํ”„๋กœ์„ธ์„œ: 64๋น„ํŠธ ARM ์•„ํ‚คํ…์ฒ˜, 16์ฝ”์–ด Cortex-A72
  • ๋ฉ”๋ชจ๋ฆฌ: 16GB LPDDR4
  • ์ฃผํŒŒ์ˆ˜ ๋ฒ”์œ„: 1.0-2.0 GHz ๋™์  ์กฐ์ ˆ
  • ์ œ์•ฝ: ์ „์šฉ ํ•˜๋“œ์›จ์–ด ๊ฐ€์†๊ธฐ ์—†์Œ, ์ฝ”์–ด 0 ASTREA ์ „์šฉ

ํ‰๊ฐ€ ์ง€ํ‘œ

  1. ์—ด ์œ„๋ฐ˜ ํšŸ์ˆ˜: ์˜จ๋„ ์ž„๊ณ„๊ฐ’์„ ์ดˆ๊ณผํ•œ ์ธ์Šคํ„ด์Šค ์ˆ˜
  2. ํ‰๊ท  ์šด์˜ ์‹œ๊ฐ„: ์—ด ์ œ์–ด ์šด์˜์˜ ํ‰๊ท  ์ง€์† ์‹œ๊ฐ„ (์‹œ๊ฐ„ ๋‹จ๊ณ„)
  3. CPU ํ™œ์šฉ๋ฅ  ํšจ์œจ: ์ฃผํŒŒ์ˆ˜ ์Šค์ผ€์ผ๋ง์„ ๊ณ ๋ คํ•œ ๋‚จ์€ ๊ณ„์‚ฐ ๋Šฅ๋ ฅ์˜ ์—ญ์ˆ˜

๋น„๊ต ๋ฐฉ๋ฒ•

๊ธฐ์ค€์„  ์‹œ์Šคํ…œ: Stable Baselines3 ๊ธฐ๋ณธ ์ ์‘ํ˜• ฮฑ ์Šค์ผ€์ค„์„ ์‚ฌ์šฉํ•˜๋Š” ์ˆœ์ˆ˜ SAC ์—์ด์ „ํŠธ๋กœ, ์™ธ๋ถ€ ๊ฐœ์ž…์ด๋‚˜ ์„ฑ๋Šฅ ํ”ผ๋“œ๋ฐฑ์ด ์—†์Šต๋‹ˆ๋‹ค.

์‹คํ—˜ ๊ฒฐ๊ณผ

์ง€์ƒ ์‹คํ—˜ ์ฃผ์š” ๊ฒฐ๊ณผ

์ง€ํ‘œ์‹œ๊ฐ„๋Œ€๊ธฐ์ค€์„  ์‹œ์Šคํ…œASTREA ์‹œ์Šคํ…œ
ํ‰๊ท  ์šด์˜ ์‹œ๊ฐ„์ฒ˜์Œ 4์‹œ๊ฐ„47.17ยฑ18.1578.83ยฑ11.33 (+67.2%)
24์‹œ๊ฐ„135.24ยฑ32.94142.29ยฑ8.06 (+5.2%)
์—ด ์œ„๋ฐ˜ ํšŸ์ˆ˜์ฒ˜์Œ 4์‹œ๊ฐ„39.33ยฑ9.2916.33ยฑ2.08 (-58.5%)
24์‹œ๊ฐ„88.67ยฑ20.5051.33ยฑ4.04 (-42.1%)
ํ‰๊ท  CPU ์‚ฌ์šฉ๋ฅ ์ฒ˜์Œ 4์‹œ๊ฐ„25.81ยฑ5.00%26.30ยฑ2.56% (+1.9%)
24์‹œ๊ฐ„16.49ยฑ5.57%16.24ยฑ4.46% (-1.5%)

๊ถค๋„์ƒ ์‹คํ—˜ ๊ฒฐ๊ณผ

๋‹จ๊ธฐ ์ฃผ๊ธฐ ์‹คํ—˜ (15๋ถ„ ์œˆ๋„์šฐ)

์ง€ํ‘œ๊ธฐ์ค€์„  ์‹œ์Šคํ…œASTREA ์‹œ์Šคํ…œ
ํ‰๊ท  ์šด์˜ ์‹œ๊ฐ„449.77ยฑ295.69363.76ยฑ190.23 (-19.1%)
์—ด ์œ„๋ฐ˜ ํšŸ์ˆ˜66ยฑ24.2582ยฑ32.74 (+24.2%)
ํ‰๊ท  CPU ์‚ฌ์šฉ๋ฅ 40.17ยฑ17.70%22.86ยฑ3.05% (-43.1%)

๊ถค๋„ ์ฃผ๊ธฐ ์‹คํ—˜ (90๋ถ„ ์œˆ๋„์šฐ)

์ง€ํ‘œ๊ธฐ์ค€์„  ์‹œ์Šคํ…œASTREA ์‹œ์Šคํ…œ
ํ‰๊ท  ์šด์˜ ์‹œ๊ฐ„449.77ยฑ295.691555.09ยฑ823.57 (+245.8%)
์—ด ์œ„๋ฐ˜ ํšŸ์ˆ˜66ยฑ24.2522.33ยฑ9.07 (-66.2%)
ํ‰๊ท  CPU ์‚ฌ์šฉ๋ฅ 40.17ยฑ17.70%48.27ยฑ11.49% (+20.1%)

์ฃผ์š” ๋ฐœ๊ฒฌ ์‚ฌํ•ญ

  1. ์‹œ๊ฐ„ ๋™๊ธฐํ™”์˜ ์ค‘์š”์„ฑ: ์ถ”๋ก  ์ฃผ๊ธฐ๊ฐ€ ํ™˜๊ฒฝ ๋™์—ญํ•™๊ณผ ๋งž์ง€ ์•Š์„ ๋•Œ ์„ฑ๋Šฅ์ด ํ˜„์ €ํžˆ ์ €ํ•˜๋จ
  2. ๊ถค๋„ ์ •๋ ฌ ์ „๋žต: 90๋ถ„ ์œˆ๋„์šฐ์™€ ISS ๊ถค๋„ ๋™๊ธฐํ™”๊ฐ€ ์ตœ์  ์„ฑ๋Šฅ ๋‹ฌ์„ฑ
  3. ์ถ”๋ก  ์ง€์—ฐ ์˜ํ–ฅ: LLM ์‘๋‹ต ์‹œ๊ฐ„ 40์ดˆ์—์„œ 8๋ถ„์œผ๋กœ, ์‹ค์‹œ๊ฐ„ ์ œ์–ด ๋ฃจํ”„์— ๋ถ€์ ํ•ฉํ•จ์„ ํ™•์ธ
  4. ์ดˆ๊ธฐ ์šฐ์œ„ ํšจ๊ณผ: LLM ๊ธฐ๋ฐ˜ ์ง€์นจ์ด ์ดˆ๊ธฐ์— ํ˜„์ €ํ•œ ๊ฐœ์„ ์„ ์ œ๊ณตํ•˜๊ณ  ์žฅ๊ธฐ์ ์œผ๋กœ ์•ˆ์ •์  ์šฐ์œ„ ์œ ์ง€

๊ด€๋ จ ์—ฐ๊ตฌ

์šฐ์ฃผ LLM ์‘์šฉ

  • Space Llama: ISS์— ๋ฐฐํฌ๋œ ์ฒซ ๋ฒˆ์งธ ์˜คํ”ˆ์†Œ์Šค LLM์ด์ง€๋งŒ ์ž์œจ ์ œ์–ด ๋Šฅ๋ ฅ ๋ถ€์กฑ
  • LLMSat: LLM์„ ์šฐ์ฃผ์„  ๊ณ ๊ธ‰ ์ œ์–ด ์‹œ์Šคํ…œ์œผ๋กœ ์ œ์‹œํ•˜๋‚˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ๋งŒ ๊ฒ€์ฆ
  • AI Space Cortex: ๊ทนํ•œ ํ™˜๊ฒฝ์„ ์œ„ํ•œ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์ž์œจ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ง€์ƒ ํ…Œ์ŠคํŠธ ํ”Œ๋žซํผ์—์„œ ๊ฒ€์ฆ

LLM-RL ํ˜ผํ•ฉ ์‹œ์Šคํ…œ

Schoepp ๋“ฑ์˜ ๋ถ„๋ฅ˜์— ๋”ฐ๋ฅด๋ฉด RL์—์„œ LLM์˜ ์„ธ ๊ฐ€์ง€ ์—ญํ• :

  1. ์—์ด์ „ํŠธ: LLM์ด ์ •์ฑ…์œผ๋กœ ์ง์ ‘ ์˜์‚ฌ๊ฒฐ์ •
  2. ๊ณ„ํš์ž: LLM์ด ๋ณต์žกํ•œ ์ž‘์—…์„ ๋ถ€์ž‘์—…์œผ๋กœ ๋ถ„ํ•ด
  3. ๋ณด์ƒ ๋ชจ๋ธ: LLM์ด ๋ณด์ƒ ์‹ ํ˜ธ ์ƒ์„ฑ ๋˜๋Š” ํ‰๊ฐ€

ASTREA๋Š” ๋„ค ๋ฒˆ์งธ ๋ชจ๋“œ๋ฅผ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค: ๊ฐ๋…์ž๋กœ, LLM์ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์กฐ์ • ์ œ์•ˆ์„ ์ œ๊ณตํ•˜๋ฉด์„œ RL ์—์ด์ „ํŠธ๋Š” ์šด์˜ ๋…๋ฆฝ์„ฑ ์œ ์ง€.

๊ธฐ์ˆ ์  ์ฐจ๋ณ„ํ™”

  • ์•ˆ์ „์„ฑ ๊ณ ๋ ค: LLM ํ™˜๊ฐ์ด ์ค‘์š”ํ•œ ์˜์‚ฌ๊ฒฐ์ •์— ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋„๋ก ๋ฐฉ์ง€
  • ํ•˜๋“œ์›จ์–ด ์ ์‘: ์šฐ์ฃผ๊ธ‰ ์ œ์•ฝ์— ๋งž์ถ˜ ์–‘์žํ™” ๋ชจ๋ธ ์ตœ์ ํ™”
  • ์‹ค์‹œ๊ฐ„์„ฑ ๋ณด์žฅ: ๋น„๋™๊ธฐ ์•„ํ‚คํ…์ฒ˜๊ฐ€ ์ œ์–ด ์‹œ์Šคํ…œ ์‘๋‹ต์„ฑ ํ™•๋ณด

๊ฒฐ๋ก  ๋ฐ ๋…ผ์˜

์ฃผ์š” ๊ฒฐ๋ก 

  1. ๊ธฐ์ˆ ์  ํƒ€๋‹น์„ฑ: ๋น„ํ–‰๊ธ‰ ํ•˜๋“œ์›จ์–ด์—์„œ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ ๋ฐฐํฌ์˜ ํƒ€๋‹น์„ฑ ์ž…์ฆ
  2. ์„ฑ๋Šฅ ํ–ฅ์ƒ: ์ ์ ˆํ•œ ๊ตฌ์„ฑ ํ•˜์—์„œ ์—ด ์ œ์–ด ์„ฑ๋Šฅ์˜ ํ˜„์ €ํ•œ ๊ฐœ์„  ๋‹ฌ์„ฑ ๊ฐ€๋Šฅ
  3. ์‹œ๊ฐ„ ์ผ์น˜ ์›์น™: LLM ์ถ”๋ก  ์ฃผ๊ธฐ๋Š” ํ™˜๊ฒฝ ๋™์—ญํ•™ ์‹œ๊ฐ„ ๊ทœ๋ชจ์™€ ์ผ์น˜ํ•ด์•ผ ํ•จ
  4. ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„ ์ง€์นจ: ๋น„๋™๊ธฐ ๋ถ„๋ฆฌ๊ฐ€ ์šฐ์ฃผ ์‘์šฉ์—์„œ LLM-RL ํ†ตํ•ฉ์˜ ํ•ต์‹ฌ

ํ•œ๊ณ„

  1. ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ: ํ˜„์žฌ ๋น„ํ–‰๊ธ‰ ํ•˜๋“œ์›จ์–ด๋Š” ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์–ธ์–ด ๋ชจ๋ธ์„ ์ง€์›ํ•  ์ˆ˜ ์—†์Œ
  2. ์ถ”๋ก  ์ง€์—ฐ: ๋‹จ์ผ ์ฝ”์–ด ๊ณ„์‚ฐ ์ œํ•œ์œผ๋กœ ์ธํ•œ ํ˜„์ €ํ•œ ์‘๋‹ต ์ง€์—ฐ
  3. ์ƒํ™ฉ๋ณ„ ์ œํ•œ: ์งง์€ ์ƒํ™ฉ๋ณ„ ๊ธธ์ด์™€ ๊ตฌ์กฐํ™”๋œ ํ”„๋กฌํ”„ํŠธ ์œ ์ง€ ํ•„์š”
  4. ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ™•์žฅ: ๋‹จ์ผ LLM ์—์ด์ „ํŠธ์˜ ์ง€์—ฐ์ด ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ตฌ์„ฑ์—์„œ ๋ณ‘๋ชฉ์ด ๋  ์ˆ˜ ์žˆ์Œ

ํ–ฅํ›„ ๋ฐฉํ–ฅ

  1. ํ•˜๋“œ์›จ์–ด ๊ฐ€์†: ์šฐ์ฃผ๊ธ‰ ๊ฐ€์†๊ธฐ๊ฐ€ ์„ฑ๋Šฅ์„ ๊ทผ๋ณธ์ ์œผ๋กœ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ์Œ
  2. ์˜์—ญ ํŠนํ™” ๋ชจ๋ธ: ์—ด ๊ด€๋ฆฌ ์ „๋ฌธ ๋ชจ๋ธ์ด ์ƒํ™ฉ๋ณ„ ์ดํ•ด ํ–ฅ์ƒ ๊ฐ€๋Šฅ
  3. ๋งค๊ฐœ๋ณ€์ˆ˜ ํ™•์žฅ: ฮฑ ๊ณ„์ˆ˜ ์™ธ ๋‹ค๋ฅธ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ๋˜๋Š” ์ ์‘ํ˜• ๋ณด์ƒ ํ˜•์„ฑ
  4. ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ˜‘๋ ฅ: ๋‹ค์ค‘ LLM ์—์ด์ „ํŠธ์˜ ํ˜‘๋ ฅ ๊ฐ๋… ์•„ํ‚คํ…์ฒ˜ ํƒ์ƒ‰

์‹ฌ์ธต ํ‰๊ฐ€

์žฅ์ 

  1. ๊ฐœ์ฒ™์  ์˜์˜: ์‹ค์ œ ๋น„ํ–‰ ํ™˜๊ฒฝ์—์„œ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ฒ˜์Œ ๊ฒ€์ฆํ•˜์—ฌ ์ด์ •ํ‘œ์  ๊ฐ€์น˜ ๋ณด์œ 
  2. ๊ณตํ•™์  ์‹ค์šฉ์„ฑ: ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์„ ์ถฉ๋ถ„ํžˆ ๊ณ ๋ คํ•˜์—ฌ ๋ฐฐํฌ ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜ ์ œ๊ณต
  3. ์‹คํ—˜์˜ ์ถฉ๋ถ„์„ฑ: ์ง€์ƒ ๋ฐ ๊ถค๋„์ƒ ์ด์ค‘ ๊ฒ€์ฆ์œผ๋กœ ๋‹ค์–‘ํ•œ ๊ตฌ์„ฑ ๋น„๊ต ๋ถ„์„
  4. ์ด๋ก ์  ๊ธฐ์—ฌ: LLM ์ถ”๋ก  ์ฃผ๊ธฐ์™€ ํ™˜๊ฒฝ ๋™์—ญํ•™ ์ผ์น˜์˜ ์„ค๊ณ„ ์›์น™ ์ˆ˜๋ฆฝ
  5. ๊ธฐ์ˆ  ํ˜์‹ : ๋น„๋™๊ธฐ ์•„ํ‚คํ…์ฒ˜๊ฐ€ ์ง€์—ฐ๊ณผ ์•ˆ์ „์„ฑ์˜ ๋ชจ์ˆœ์„ ๊ต๋ฌ˜ํžˆ ํ•ด๊ฒฐ

๋ถ€์กฑํ•œ ์ 

  1. ํ‘œ๋ณธ ๊ทœ๋ชจ: ์‹คํ—˜ ์ฃผ๊ธฐ๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ์งง์•„ ์žฅ๊ธฐ ์•ˆ์ •์„ฑ ๊ฒ€์ฆ ํ•„์š”
  2. ํ™˜๊ฒฝ ๋‹จ์ผ์„ฑ: ์—ด ์ œ์–ด ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ๋งŒ ๊ฒ€์ฆ๋˜์–ด ๋‹ค๋ฅธ ๋ถ€๋ถ„ ์‹œ์Šคํ…œ ์ ์šฉ์„ฑ ๋ฏธ์ง€์ˆ˜
  3. ๋ชจ๋ธ ํ•œ๊ณ„: ์–‘์žํ™” ๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์™„์ „ํ•œ ๋ชจ๋ธ์— ๋น„ํ•ด ์ œํ•œ์ 
  4. ๋น„์šฉ ํšจ์œจ: ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ ๊ณ„์‚ฐ ์˜ค๋ฒ„ํ—ค๋“œ ๋ฐ ๋ณต์žก์„ฑ ์ฆ๊ฐ€

์˜ํ–ฅ๋ ฅ

  1. ํ•™์ˆ ์  ๊ฐ€์น˜: ์šฐ์ฃผ AI ์‘์šฉ์— ์ค‘์š”ํ•œ ์‹ค์ฆ์  ๊ธฐ์ดˆ ์ œ๊ณต
  2. ์‚ฐ์—…์  ์˜์˜: ํ•ญ๊ณต์šฐ์ฃผ ์‚ฐ์—…์˜ ์ž์œจํ™” ๋ฐœ์ „์— ๊ธฐ์ˆ  ๊ฒฝ๋กœ ์ œ์‹œ
  3. ์žฌํ˜„์„ฑ: ์ƒ์„ธํ•œ ๊ตฌํ˜„ ์„ธ๋ถ€ ์‚ฌํ•ญ๊ณผ ์˜คํ”ˆ์†Œ์Šค ๋„๊ตฌ๋กœ ์žฌํ˜„ ์ง€์›
  4. ํ™•์žฅ ์ž ์žฌ๋ ฅ: ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„๊ฐ€ ์šฐ์ˆ˜ํ•œ ํ™•์žฅ์„ฑ๊ณผ ์ ์‘์„ฑ ๋ณด์œ 

์ ์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค

  1. ์‹ฌ์šฐ์ฃผ ํƒ์‚ฌ: ํ†ต์‹  ์ง€์—ฐ ํ™˜๊ฒฝ์—์„œ์˜ ์ž์œจ ์˜์‚ฌ๊ฒฐ์ • ์ง€์›
  2. ์†Œํ˜• ์œ„์„ฑ ๋ณ„์ž๋ฆฌ: ์ž์› ์ œ์•ฝ ํ™˜๊ฒฝ์—์„œ์˜ ์ง€๋Šฅํ˜• ๊ฐ๋…
  3. ์œ ์ธ ์šฐ์ฃผ ๋น„ํ–‰: ์šฐ์ฃผ๋น„ํ–‰์‚ฌ๋ฅผ ์œ„ํ•œ ์ง€๋Šฅํ˜• ๋ณด์กฐ ์‹œ์Šคํ…œ ์ œ๊ณต
  4. ์ง€์ƒ ์—ฃ์ง€ ์ปดํ“จํŒ…: ์ž์› ์ œ์•ฝ ํ™˜๊ฒฝ์—์„œ์˜ ํ˜ผํ•ฉ ์ง€๋Šฅ ์‹œ์Šคํ…œ

์ฐธ๊ณ  ๋ฌธํ—Œ

  1. Callejo, E., et al. (2023). Imagin-e: The first step towards extending the cloud into space.
  2. Booz Allen Hamilton and Meta (2025). Booz allen and meta launch space llama.
  3. Maranto, D. (2024). Llmsat: A large language model-based goal-oriented agent for autonomous space exploration.
  4. Touma, T., et al. (2025). Ai space cortex: An experimental system for future era space exploration.
  5. Yang, A., et al. (2024). Qwen2 technical report.

์ข…ํ•ฉ ํ‰๊ฐ€: ๋ณธ ๋…ผ๋ฌธ์€ ์šฐ์ฃผ AI ์‘์šฉ ๋ถ„์•ผ์—์„œ ๊ฐœ์ฒ™์  ์˜์˜๋ฅผ ๊ฐ€์ง€๋ฉฐ, ์—„๋ฐ€ํ•œ ์‹คํ—˜ ์„ค๊ณ„์™€ ์ถฉ๋ถ„ํ•œ ๊ฒ€์ฆ์„ ํ†ตํ•ด ํ–ฅํ›„ ์ง€๋Šฅํ˜• ์šฐ์ฃผ์„  ๋ฐœ์ „์˜ ๊ฒฌ๊ณ ํ•œ ๊ธฐ์ดˆ๋ฅผ ๋งˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ถ€ ๊ธฐ์ˆ ์  ํ•œ๊ณ„๊ฐ€ ์žˆ์ง€๋งŒ ๊ณตํ•™์  ๊ฐ€์น˜์™€ ํ•™์ˆ ์  ๊ธฐ์—ฌ๊ฐ€ ํ˜„์ €ํ•˜์—ฌ ์‹ฌ์ธต์  ์—ฐ๊ตฌ์™€ ์ถ”๊ฐ€ ๋ฐœ์ „์˜ ๊ฐ€์น˜๊ฐ€ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค.