Large Language Models (LLMs) suffer from reliability issues on complex tasks, as existing decomposition methods are heuristic and rely on agent or manual decomposition. This work introduces a novel, systematic decomposition framework that we call Analysis of CONstraint-Induced Complexity (ACONIC), which models the task as a constraint problem and leveraging formal complexity measures to guide decomposition. On combinatorial (SATBench) and LLM database querying tasks (Spider), we find that by decomposing the tasks following the measure of complexity, agent can perform considerably better (10-40 percentage point).
- ๋
ผ๋ฌธ ID: 2510.07772
- ์ ๋ชฉ: An Approach for Systematic Decomposition of Complex LLM Tasks
- ์ ์: Tianle Zhou, Jiakai Xu, Guanhong Liu, Jiaxiang Liu, Haonan Wang, Eugene Wu (Columbia University)
- ๋ถ๋ฅ: cs.AI
- ๋ฐํ ์๊ฐ: 2025๋
10์ 13์ผ (arXiv v2)
- ๋
ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2510.07772v2
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLMs)์ ๋ณต์กํ ์์
์์ ์ ๋ขฐ์ฑ ๋ฌธ์ ๋ฅผ ๋ณด์ด๊ณ ์์ผ๋ฉฐ, ๊ธฐ์กด์ ๋ถํด ๋ฐฉ๋ฒ์ ํด๋ฆฌ์คํฑ์ ์์กดํ๊ฑฐ๋ ์์ด์ ํธ ๋๋ ์๋ ๋ถํด์ ์์กดํฉ๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์ ์ฝ ์กฐ๊ฑด ์ ๋ ๋ณต์ก๋ ๋ถ์(ACONIC)์ด๋ผ๋ ์๋ก์ด ์ฒด๊ณ์ ๋ถํด ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. ์ด ํ๋ ์์ํฌ๋ ์์
์ ์ ์ฝ ์กฐ๊ฑด ๋ฌธ์ ๋ก ๋ชจ๋ธ๋งํ๊ณ ํ์ํ๋ ๋ณต์ก๋ ์ธก์ ์ ํ์ฉํ์ฌ ๋ถํด๋ฅผ ์ง๋ํฉ๋๋ค. ์กฐํฉ ๋ฌธ์ (SAT-Bench)์ LLM ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฟผ๋ฆฌ ์์
(Spider)์์ ๋ณต์ก๋ ์ธก์ ์ ๋ฐ๋ผ ์์
์ ๋ถํดํจ์ผ๋ก์จ ์์ด์ ํธ์ ์ฑ๋ฅ์ด ํ์ ํ ํฅ์๋์์ต๋๋ค(10-40 ๋ฐฑ๋ถํฌ์ธํธ).
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊น์ด ์๋ ๋ค๋จ๊ณ ์ถ๋ก ์ด๋ ์กฐํฉ ํ์์ด ํ์ํ ๋ณต์กํ ์์
์ ์ฒ๋ฆฌํ ๋ ๋จ์ผ ์์ ํ์์ ์ฌ๋ฐ๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์์ฑํ์ง ๋ชปํ๋ ์ ๋ขฐ์ฑ ๋ฌธ์ ๋ฅผ ๋ณด์
๋๋ค.
LLMs์ด ๋ค์ํ ์ถ๋ก , ํ๋ก๊ทธ๋๋ฐ ๋ฐ ๋ฌธ์ ํด๊ฒฐ ์์
์์ ๊ด๋ฒ์ํ๊ฒ ์ ์ฉ๋๋ฉด์, ๋ณต์กํ ์์
์ ์ฒด๊ณ์ ์ผ๋ก ๋ถํดํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ด ํต์ฌ ๊ณผ์ ๊ฐ ๋์์ต๋๋ค. ๊ธฐ์กด ๋ฐฉ๋ฒ์ ์์น์ ์ธ ๋ณต์ก๋ ์ธก์ ๋ฐ ๋ถํด ์ ๋ต์ด ๋ถ์กฑํฉ๋๋ค.
- ํด๋ฆฌ์คํฑ ๋ถํด: Chain-of-Thought์ ๊ฐ์ ๊ธฐ์กด ๋ฐฉ๋ฒ์ ์ฃผ๋ก LLM ์์ฒด์ ๋ถํด์ ์์กดํ๋ฉฐ ์ด๋ก ์ ๊ธฐ์ด๊ฐ ๋ถ์กฑํฉ๋๋ค.
- ์๋ ๋ถํด: ์์ญ ์ ๋ฌธ๊ฐ๊ฐ ์๋์ผ๋ก ์ํฌํ๋ก์ฐ๋ฅผ ์ค๊ณํด์ผ ํ๋ฏ๋ก ์ฒด๊ณ์ฑ์ด ๋ถ์กฑํฉ๋๋ค.
- ๋ณต์ก๋ ์ธก์ ๋ถ์ฌ: ์์
๋ณต์ก๋๋ฅผ ์ ๋ํํ ์ ์์ด ๋ถํด ํ์์ฑ๊ณผ ๋ฐฉ๋ฒ์ ๊ฒฐ์ ํ๊ธฐ ์ด๋ ต์ต๋๋ค.
ํ์ํ๋ ์์
๋ณต์ก๋ ํ๋ ์์ํฌ๋ฅผ ์๋ฆฝํ์ฌ ์ฒด๊ณ์ ์ธ ๋ถํด ์ ๋ต์ ์ ๊ณตํ๊ณ , ๋น๊ต ๊ฐ๋ฅํ ๋์ด๋์ ์์
์ฐ๊ตฌ ๋ฅ๋ ฅ์ ์ ๊ณตํ๋ฉฐ, ๋๊ตฌ ๋ณด์กฐ๊ฐ ํ์ํ ์์ ์ ์ง๋ํ๋ ๊ฒ์
๋๋ค.
- ACONIC ํ๋ ์์ํฌ ์ ์: LLM ์์
์ ์ฒด๊ณ์ ์ผ๋ก ์ ์ฝ ์กฐ๊ฑด ๋ง์กฑ ๋ฌธ์ ๋ก ์ถ์ฝํ๋ ์ฒซ ๋ฒ์งธ ํ์ํ๋ ๋ณต์ก๋ ํ๋ ์์ํฌ
- ๋ณต์ก๋ ์ธก์ ์๋ฆฝ: ์ ์ฝ ์กฐ๊ฑด ๊ทธ๋ํ์ ๊ทธ๋ํ ํฌ๊ธฐ ๋ฐ ํธ๋ฆฌ ๋๋น๋ฅผ ์์
๋ณต์ก๋์ ์ธก์ ๊ธฐ์ค์ผ๋ก ์ฌ์ฉ
- ์ฒด๊ณ์ ๋ถํด ๋ฐฉ๋ฒ: ํธ๋ฆฌ ๋ถํด ๊ธฐ๋ฐ ๋ถํด ์ ๋ต์ผ๋ก ๋ถ๋ถ ์์
๋ณต์ก๋๋ฅผ ์ต์ํํ๋ฉด์ ์ ์ญ ๋ง์กฑ์ฑ ์ ์ง
- ์ค์ฆ ๊ฒ์ฆ: SAT-Bench ๋ฐ Spider ๋ฒค์น๋งํฌ์์ ๋ณต์ก๋ ์ธก์ ์ด ์ ์ํ ๋์ด๋ ๊ฒฝ๊ณ ๋ฐ ๋ถํด ํจ๊ณผ ๊ฒ์ฆ
- ์ฑ๋ฅ ํฅ์: Chain-of-Thought ๋ฐฉ๋ฒ ๋๋น SAT-Bench์์ 9-15% ํฅ์, Spider์์ 30-40% ํฅ์
ACONIC์ LLM ์์
์ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํฉ๋๋ค: ์ ์ฝ ์กฐ๊ฑด ์งํฉ์ ์ค๋ช
ํ๋ ์ปจํ
์คํธ์ ์ ์ฝ ์กฐ๊ฑด์ ๋ํด ์ถ๋ก ํด์ผ ํ๋ ์ฟผ๋ฆฌ๊ฐ ์ฃผ์ด์ก์ ๋, ์ด๋ฅผ ํ์ํ๋ ์ ์ฝ ์กฐ๊ฑด ๋ง์กฑ ๋ฌธ์ ๋ก ์ถ์ฝํ ํ ๋ถํดํ๊ณ ๋ถ๋ถ ์์
์ํฌํ๋ก์ฐ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
์ํ ๊ธฐ๋ฐ ์์ด์ ํธ ์์
ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์์
์ ๊ณํ์ผ๋ก์์ ๋ง์กฑ์ฑ(PaS) ๋ฌธ์ ๋ก ํ์ํํฉ๋๋ค:
์ฌ๊ธฐ์:
- F: ์ธ๊ณ ์ฌ์ค์ ์ค๋ช
ํ๋ ๋ช
์ ์ ์ฐฝ์ฑ์ ์ ํ ์งํฉ
- A: ๋์์ ์ ํ ์งํฉ
- I, G: ์ด๊ธฐ ๋ฐ ๋ชฉํ ์ ์ฐฝ์ฑ
- ๋์ a์ ๋ํด: P(a)๋ ์ ์ ์กฐ๊ฑด์ ๊ฒฐ์ ํ๊ณ , A(a)๋ ์ฐธ์ด ๋๋ ์ ์ฐฝ์ฑ์ ๊ฒฐ์ ํ๋ฉฐ, D(a)๋ ๊ฑฐ์ง์ด ๋๋ ์ ์ฐฝ์ฑ์ ๊ฒฐ์ ํฉ๋๋ค.
PaS ๋ฌธ์ ๋ฅผ CSP ์ธ์คํด์ค๋ก ์ถ์ฝํ๋ฉฐ, ๋ค์์ ์ธ์ฝ๋ฉํฉ๋๋ค:
- ์ ์ ์กฐ๊ฑด fp โ P(a)
- ์ถ๊ฐ ํจ๊ณผ fa โ A(a)
- ์ญ์ ํจ๊ณผ fd โ D(a)
์ ์ฐฝ์ฑ๊ณผ ๋์ ๊ฐ์ ๋ถ์ธ ์์กด์ฑ ์ ์ฝ์ผ๋ก์.
Bodlaender(1998)์ ํธ๋ฆฌ ๋ถํด ์ด๋ก ์ ํ์ฉํฉ๋๋ค:
- ์ต์ ์ต๋ ๋ฐฑ ํฌ๊ธฐ์ ํธ๋ฆฌ ๋ถํด D* ํ์(ํธ๋ฆฌ ๋๋น)
- ํธ๋ฆฌ ๋๋น๋ ๋ด์ฌ์ ๋ฌธ์ ๋ณต์ก๋๋ฅผ ํน์ง์ง์
- ๊ตญ์ ์ผ๊ด์ฑ์ด ์ ์ญ ์ผ๊ด์ฑ์ ๋ณด์ฅํจ
- ํ์ํ๋ ๋ณต์ก๋ ์ธก์ : ๊ทธ๋ํ ์ด๋ก ์ ํธ๋ฆฌ ๋๋น๋ฅผ LLM ์์
๋ณต์ก๋์ ์ ๋ํ ์งํ๋ก ์ฒ์ ์ฌ์ฉ
- ์ ์ญ ์ผ๊ด์ฑ ๋ณด์ฅ: ํธ๋ฆฌ ๋ถํด๋ ๊ตญ์ ๋ถ๋ถ๊ทธ๋ํ์ ์ผ๊ด์ฑ์ด ์ ์ญ CSP ํด์ ์ผ๊ด์ฑ์ ์๋ฏธํจ์ ๋ณด์ฅ
- ์ต์ ๋ถํด ์ ๋ต: ์ต์ ํธ๋ฆฌ ๋๋น ๊ธฐ๋ฐ ๋ถํด๋ก ๊ตญ์ ๋ณต์ก๋ ์ต์ํ
- ์๋ ์ถ์ฝ ์ ์ฐจ: ํน์ ๋ฒค์น๋งํฌ๋ฅผ ์ํ ์๋ ์ถ์ฝ ์ ์ฐจ ๊ฐ๋ฐ๋ก ์๋ ๋ชจ๋ธ๋ง ๊ฐ์
- SAT ๋ฌธ์ ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋ ์์ฐ์ด ์คํ ๋ฆฌ ๋ฌธ์
- CNF ํํ, ์์ฐ์ด ์ค๋ช
๋ฐ ์ํฐํฐ-SAT ์ ๋ ฌ ๋งคํ ํฌํจ
- Claude3.5-Sonnet(์์
์ ์ ๋ฐ์ ๋ฌด์์ ์ํ๋ง) ๋ฐ Llama-3-70B(์ ์ฒด ์์
) ํ๊ฐ
- ์ธ๊ธฐ ์๋ NL2SQL ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
- ์๋ฐฑ ๊ฐ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํฌํจ, ๊ฐ๊ฐ ์ต๋ 37๊ฐ ํ
์ด๋ธ, 90๊ฐ ์ธ๋ ํค, 100๊ฐ ์ด์์ ์ด
- ์์
์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์คํค๋ง S, ์์ฐ์ด ์ฟผ๋ฆฌ q ๋ฐ ์ค์ SQL ์ฟผ๋ฆฌ q* ํฌํจ
- SAT-Bench: ์์
์๋ฃ์จ(์ฑ๊ณต/์คํจ)
- Spider: SQL ์ฟผ๋ฆฌ ์ ํ๋, ๋์ด๋ ๋ฑ๊ธ๋ณ ํ๊ฐ(Easy/Medium/Hard/Extra)
- Chain-of-Thought (CoT): ํ์ค ์ฌ๊ณ ์ ์ฐ์ ํ๋กฌํํ
๋ฐฉ๋ฒ์ ๊ธฐ์ค์ ์ผ๋ก ์ฌ์ฉ
- ์์ ๊ด์ฐฐ vs ๋ถํด ๊ด์ฐฐ: ์ ์ญ ์ ๋ณด ์ ๊ทผ๊ณผ ๊ตญ์ ๋ถํด ์ ๋ณด ์ ๊ทผ ๋น๊ต
- SageMath๋ฅผ ์ฌ์ฉํ์ฌ ํธ๋ฆฌ ๋ถํด ๊ณ์ฐ, ์ต์ ์ฑ์ฐ๊ธฐ ํด๋ฆฌ์คํฑ ๋ฐ ์ ํ ํด๊ฒฐ๊ธฐ ์ฑํ
- SAT-Bench๋ ๋จ๊ณ์ ๋ณ์ ํ ๋น ์ ๋ต ์ฌ์ฉ
- Spider๋ WITH ์ ์ ์ฆ๋ถ ๊ตฌ์ฑ ์ ๋ต ์ฌ์ฉ
- Claude3.5-Sonnet: 49.3%์์ 58.1%๋ก ํฅ์(+8.8%)
- Llama-3-70B: 21.5%์์ 36.5%๋ก ํฅ์(+15.0%)
- ๋ณต์ก๋ ์ธก์ ์ด ๋์ด๋ ๊ฒฝ๊ณ๋ฅผ ๋ช
ํํ ์ ์ํ๋ฉฐ, ACONIC์ ๊ฒฝ๊ณ๋ฅผ ๋ ๋ณต์กํ ๋ฌธ์ ๋ก ์ด๋
CoT ๊ธฐ์ค์ ๋๋น ACONIC์ ๋ชจ๋ ๋์ด๋ ๋ฑ๊ธ์์ ํ์ ํ ํฅ์์ ๋ณด์
๋๋ค:
- Easy: 42.7%์์ 75.8%๋ก ํฅ์(+33.1%)
- Medium: 38.1%์์ 58.1%๋ก ํฅ์(+20.0%)
- Hard: 36.2%์์ 62.7%๋ก ํฅ์(+26.5%)
- Extra: 19.3%์์ 37.9%๋ก ํฅ์(+18.6%)
- ๋ณต์ก๋ ๊ฒฝ๊ณ: ์คํ์ ๋ฌธ์ ํธ๋ฆฌ ๋๋น ๋ฐ ๋ฐฑ ๊ฐ์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ณ ์ ๋ "์ด ์์
๋ณต์ก๋" ๊ฒฝ๊ณ๋ฅผ ๋๋ฌ๋
๋๋ค.
- ์ผ๊ด๋ ๊ฐ์ : ACONIC ๋ถํด๋ ๋ ๊ฐ์ง ๋ค๋ฅธ ๋ชจ๋ธ(Claude ๋ฐ LLaMA)์์ ์ผ๊ด๋ ์ฑ๋ฅ ํฅ์์ ๋ณด์
๋๋ค.
- ๋์ด๋ ๊ตฌ๋ฐฐ: ๋ ๊ฐ๋ ฅํ ๋ชจ๋ธ(์: Claude)์ ๊ฒฝ๊ณ๋ฅผ ๋ ๋ณต์กํ ๋ฌธ์ ๋ฐฉํฅ์ผ๋ก ์ด๋ํฉ๋๋ค.
- ๋ถํด ํจ๊ณผ: ๊ถค์ ์ ์ฆ๊ฐ๋ ์ ํ๋๋ฅผ ์ฝ๊ฐ ๊ฐ์ ํ์ง๋ง, ๋ณต์ก๋ ์ ๋ ๋ถํด๋ ๋ ํ์ ํ ํฅ์์ ๊ฐ์ ธ์ต๋๋ค.
- Chain-of-Thought ์๋ฆฌ์ฆ: Wei et al.(2022), Yao et al.(2023), Khot et al.(2023)
- ๋๊ตฌ ๋ณด์กฐ ๋ฐฉ๋ฒ: Wang et al.(2024), Singh et al.(2024)
- ์์ญ ํน์ ๋ถํด: Pourreza and Rafiei(2023), Chen et al.(2024)
- ๊ณํ์ผ๋ก์์ ๋ง์กฑ์ฑ: Selman et al.์ ๊ณ ์ ์ฐ๊ตฌ
- ํธ๋ฆฌ ๋ถํด ์ด๋ก : Bodlaender(1998)์ ๊ทธ๋ํ ์ด๋ก ๊ธฐ์ด
- ๋ค์ค ์์ด์ ํธ ๊ฒฝ๋ก ๊ณํ: Surynek et al.(2016)
- ์ ์ฝ ์กฐ๊ฑด ๊ทธ๋ํ ๋ชจ๋ธ๋ง: Gottlob et al.(2001)
- NL2SQL ๋ฐฉ๋ฒ: Wang et al.(2019)์ ๊ด๊ณ ์ธ์ ์ธ์ฝ๋ฉ
- ํ์ํ ํ๋ ์์ํฌ์ ํจ๊ณผ์ฑ: ACONIC์ ์ ์ฝ ์กฐ๊ฑด ๋ง์กฑ์ ๊ธฐ๋ฐ์ผ๋ก ํ LLM ์์
๋ณต์ก๋ ์ ๋ํ์ ์ฒซ ๋ฒ์งธ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ์ฒด๊ณ์ ๋ถํด์ ์ฅ์ : ๋ณต์ก๋ ๊ธฐ๋ฐ ๋ถํด๋ ํด๋ฆฌ์คํฑ ๋ฐฉ๋ฒ์ ํ์ ํ ๋ฅ๊ฐํฉ๋๋ค.
- ํต์ฉ์ฑ: ํ๋ ์์ํฌ๋ ๋ค์ํ ์์
์ ํ(์กฐํฉ ๋ฌธ์ ๋ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฟผ๋ฆฌ)์์ ํจ๊ณผ์ ์
๋๋ค.
- ์ด๋ก ์ด ์ค์ ๋ฅผ ์ง๋ํจ: ํธ๋ฆฌ ๋๋น ๋ฑ์ ๊ทธ๋ํ ์ด๋ก ๊ฐ๋
์ LLM ์์
๋ถํด์ ์ด๋ก ์ ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ์ ์ฉ ๋ฒ์ ์ ํ: ์ ์ฝ ์กฐ๊ฑด ๋ง์กฑ ๋ฌธ์ ๋ก ํธ๋ฆฌํ๊ฒ ๋ชจ๋ธ๋งํ ์ ์๋ ์์
์๋ง ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค.
- ์์ ํ ํํ์ ์ด๋ ค์: ์ค์ ๋ฌธ์ ๋ ๋ฌธ์ ๋ชจํธ์ฑ, ์์ด์ ํธ ๋์์ ๋ถํฌ๋ช
์ฑ ๋๋ ๋ชจํธํ ์ปจํ
์คํธ ์ ๋ณด๋ก ์ธํด ์์ ํ ๋
ผ๋ฆฌ์ ์ผ๋ก ํํ๋ ์ ์์ต๋๋ค.
- ์์ ์์จ์ฑ ๋ถ์ฌ: ACONIC์ ์์ ํ ์์จ์ ์ธ ๋ถํด ๋๋ ์ถ๋ก ์์คํ
์ ๊ตฌ์ฑํ์ง ์์ต๋๋ค.
- ๋ฒค์น๋งํฌ ํน์ด์ฑ: ํ๊ฐ ์์
์ ์ ์ฝ ์กฐ๊ฑด ํด๊ฒฐ๊ธฐ ๋๋ ๊ฐ๋จํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ์ง์ ํด๊ฒฐํ ์ ์์ต๋๋ค.
- ํผํฉ ๋ถํด ๋ฐฉ๋ฒ: ๋
ผ๋ฆฌ์ ์ ์ฝ ์กฐ๊ฑด๊ณผ ์์ ์ ์ฝ ์กฐ๊ฑด์ ๊ฒฐํฉํ๋ ํผํฉ ๋ถํด ๋ฐฉ๋ฒ ์ฐ๊ตฌ
- ๋ ๊ด๋ฒ์ํ ์์
์ ํ: ๊ต์ฐฉ ์ํ ๊ฐ์ง, ์์ ์ค์ผ์ค๋ง ๋ฑ ๋ ๋ง์ ์ค์ ๋ฌธ์ ๋ก ํ์ฅ
- ์์ ์์จ ์์คํ
: ์์ ํ ์์จ์ ์ธ ๋ถํด ๋ฐ ์ถ๋ก ์์คํ
์ผ๋ก ๋ฐ์
- ํ์ต ๊ธฐ๋ฐ ๋ถํด: ๋ค๋ฅธ ์ด๋ก ์ ๊ธฐ์ด ๋๋ ํ์ต ๊ธฐ๋ฐ ๋ถํด ํ๋ ์์ํฌ์์ ๋น๊ต ์ฐ๊ตฌ
- ์ด๋ก ์ ํ์ : ๊ทธ๋ํ ์ด๋ก ์ ํธ๋ฆฌ ๋ถํด ์ด๋ก ์ LLM ์์
๋ถํด์ ์ฒด๊ณ์ ์ผ๋ก ์ฒ์ ์ ์ฉ
- ํ์ํ ์๋ฐ์ฑ: PaS์์ CSP๋ฅผ ๊ฑฐ์ณ ํธ๋ฆฌ ๋ถํด๊น์ง์ ์์ ํ ์ถ์ฝ ์ฒด์ธ์ ์ ๊ณตํ๋ ์๊ฒฉํ ์ํ์ ํ๋ ์์ํฌ
- ์ถฉ๋ถํ ์ค์ฆ: ๋ ๊ฐ์ง ๋ค๋ฅธ ์ ํ์ ๋ฒค์น๋งํฌ์์ ๊ฒ์ฆ๋์์ผ๋ฉฐ ๊ฒฐ๊ณผ๊ฐ ์ผ๊ด๋๊ณ ํ์ ํจ
- ๊ฐํ ํด์ ๊ฐ๋ฅ์ฑ: ๋ณต์ก๋ ์ธก์ ์ด ์์
๋์ด๋์ ๋ํ ์ง๊ด์ ์ดํด๋ฅผ ์ ๊ณต
- ํต์ฉ ํ๋ ์์ํฌ: ํน์ ์์
์ ํ์ ๊ตญํ๋์ง ์์ผ๋ฉฐ ์ข์ ํต์ฉ์ฑ์ ๊ฐ์ง
- ๋ชจ๋ธ๋ง ๋ณต์ก์ฑ: ์ค์ ์์
์ CSP๋ก ์ถ์ฝํ๋ ค๋ฉด ์ ๋ฌธ ์ง์๊ณผ ์๋ ์์ง๋์ด๋ง์ด ํ์ํฉ๋๋ค.
- ๊ณ์ฐ ์ค๋ฒํค๋: ํธ๋ฆฌ ๋ถํด ๊ณ์ฐ ์์ฒด๊ฐ ๋์ ๋ณต์ก๋๋ฅผ ๊ฐ์ง ์ ์์ต๋๋ค.
- ์ ํ๋ ๊ธฐ์ค์ ๋น๊ต: ์ฃผ๋ก CoT์ ๋น๊ตํ๋ฉฐ ๋ค๋ฅธ ์ฒด๊ณ์ ๋ถํด ๋ฐฉ๋ฒ๊ณผ์ ๋น๊ต๊ฐ ๋ถ์กฑํฉ๋๋ค.
- ์์
์ ํ ์ ํ: ๋ ๊ฐ์ง ์์
์ ํ์์๋ง ๊ฒ์ฆ๋์์ผ๋ฉฐ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ ๊ด๋ฒ์ํ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค.
- ์ด๋ก ์ ๊ธฐ์ฌ: LLM ์์
๋ถํด์ ์๋ก์ด ์ด๋ก ์ ๊ด์ ์ ๊ณต
- ๋ฐฉ๋ฒ๋ก ์ ๊ฐ์น: ACONIC ํ๋ ์์ํฌ๋ ํ์ํ ๋ฐฉ๋ฒ ๊ธฐ๋ฐ์ ๋ ๋ง์ LLM ์ฐ๊ตฌ์ ์๊ฐ์ ์ค ์ ์์
- ์ค์ฉ์ ๊ฐ์น: ํน์ ์ ํ ์์
์์์ ํ์ ํ ์ฑ๋ฅ ํฅ์์ ์ค์ ์์ฉ ๊ฐ์น๋ฅผ ๊ฐ์ง
- ์ฐ๊ตฌ ๋ฐฉํฅ: LLM๊ณผ ์ ํต์ AI ๊ธฐํธ ๋ฐฉ๋ฒ ๊ฒฐํฉ์ ์๋ก์ด ์ฐ๊ตฌ ๋ฐฉํฅ์ ๊ฐ์ฒํ ์ ์์
- ์กฐํฉ ์ต์ ํ ๋ฌธ์ : ์ค์ผ์ค๋ง, ์์ ํ ๋น ๋ฑ CSP๋ก ๋ชจ๋ธ๋งํ ์ ์๋ ๋ฌธ์
- ๊ตฌ์กฐํ๋ ์ฟผ๋ฆฌ ์์
: ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฟผ๋ฆฌ, ์ง์ ๊ทธ๋ํ ์ถ๋ก ๋ฑ
- ๋ค์ค ์ ์ฝ ๊ณํ: ์ฌ๋ฌ ์ ์ฝ ์กฐ๊ฑด์ ๋ง์กฑํด์ผ ํ๋ ๊ณํ ์์
- ๋
ผ๋ฆฌ ์ถ๋ก ์์
: ๋
ผ๋ฆฌ ์ ์ฝ์ผ๋ก ํ์ํํ ์ ์๋ ์ถ๋ก ๋ฌธ์
- Bodlaender, H. L. (1998). A partial k-arboretum of graphs with bounded treewidth. Theoretical computer science, 209(1-2):1โ45.
- Wei, J., et al. (2022). Chain-of-thought prompting elicits reasoning in large language models. arXiv preprint arXiv:2201.11903.
- Yu, T., et al. (2019). Spider: A large-scale human-labeled dataset for complex and cross-domain semantic parsing and text-to-sql task.
- Gottlob, G., Leone, N., & Scarcello, F. (2001). Hypertree decompositions: A survey. International Symposium on Mathematical Foundations of Computer Science.
์์ฝ: ๋ณธ ๋
ผ๋ฌธ์์ ์ ์ํ ACONIC ํ๋ ์์ํฌ๋ LLM ์์
๋ถํด ์์ญ์ ์ค์ํ ์ด๋ก ์ ์ง์ ์ ๋ํ๋
๋๋ค. ํ์ํ๋ ๋ณต์ก๋ ์ธก์ ๊ณผ ์ฒด๊ณ์ ๋ถํด ์ ๋ต์ ๋์
ํจ์ผ๋ก์จ ๋ณต์กํ LLM ์์
ํด๊ฒฐ์ ์ํ ์๋ก์ด ์ฌ๊ณ ๋ฐฉ์์ ์ ๊ณตํฉ๋๋ค. ์ ์ฉ ๋ฒ์ ๋ฐ ๋ชจ๋ธ๋ง ๋ณต์ก์ฑ์ ํ๊ณ๊ฐ ์์์๋ ๋ถ๊ตฌํ๊ณ , ํน์ ์์
์์์ ํ์ ํ ์ฑ๋ฅ ํฅ์๊ณผ ์ด๋ก ์ ๊ธฐ์ฌ๋ก ์ธํด ๋ณธ ์ฐ๊ตฌ๋ ํด๋น ๋ถ์ผ์ ์ค์ํ ์
์ ์
๋๋ค.