2025-11-13T14:19:10.992196

Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning

Yamin, Ghosal, Wilder
Large Language Models have been shown to contain extensive world knowledge in their parameters, enabling impressive performance on many knowledge intensive tasks. However, when deployed in novel settings, LLMs often encounter situations where they must integrate parametric knowledge with new or unfamiliar information. In this work, we explore whether LLMs can combine knowledge in-context with their parametric knowledge through the lens of counterfactual reasoning. Through synthetic and real experiments in multi-hop reasoning problems, we show that LLMs generally struggle with counterfactual reasoning, often resorting to exclusively using their parametric knowledge. Moreover, we show that simple post-hoc finetuning can struggle to instill counterfactual reasoning ability -- often leading to degradation in stored parametric knowledge. Ultimately, our work reveals important limitations of current LLM's abilities to re-purpose parametric knowledge in novel settings.
academic

LLM์ด ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์—์„œ ์ง€์‹ ์ถฉ๋Œ์„ ์กฐํ™”์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š”๊ฐ€?

๊ธฐ๋ณธ ์ •๋ณด

  • ๋…ผ๋ฌธ ID: 2506.15732
  • ์ œ๋ชฉ: Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning?
  • ์ €์ž: Khurram Yamin*, Gaurav Ghosal*, Bryan Wilder (Carnegie Mellon University)
  • ๋ถ„๋ฅ˜: cs.AI cs.LG
  • ๋ฐœํ‘œ ์‹œ๊ฐ„/ํ•™ํšŒ: ICLR 2026
  • ๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2506.15732v2

์ดˆ๋ก

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๋งค๊ฐœ๋ณ€์ˆ˜์— ํ’๋ถ€ํ•œ ์„ธ๊ณ„ ์ง€์‹์„ ํฌํ•จํ•˜๊ณ  ์žˆ์œผ๋ฉฐ ๋งŽ์€ ์ง€์‹ ์ง‘์•ฝ์  ์ž‘์—…์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ์— ๋ฐฐํฌ๋  ๋•Œ LLM์€ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์„ ์ƒˆ๋กœ์šด ์ •๋ณด ๋˜๋Š” ๋‚ฏ์„  ์ •๋ณด์™€ ๊ฒฐํ•ฉํ•ด์•ผ ํ•˜๋Š” ์ƒํ™ฉ์— ์ž์ฃผ ์ง๋ฉดํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์˜ ๊ด€์ ์—์„œ LLM์ด ๋ฌธ๋งฅ ์ง€์‹์„ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹๊ณผ ๊ฒฐํ•ฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก  ๋ฌธ์ œ์— ๋Œ€ํ•œ ํ•ฉ์„ฑ ๋ฐ ์‹ค์ œ ์‹คํ—˜์„ ํ†ตํ•ด, ๋ณธ ์—ฐ๊ตฌ๋Š” LLM์ด ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์—์„œ ๊ด‘๋ฒ”์œ„ํ•œ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ์œผ๋ฉฐ ์ข…์ข… ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์—๋งŒ ์˜์กดํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋”์šฑ์ด, ๋‹จ์ˆœํ•œ ์‚ฌํ›„ ๋ฏธ์„ธ ์กฐ์ •์€ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ฃผ์ž…ํ•˜๊ธฐ ์–ด๋ ต๊ณ , ์ข…์ข… ์ €์žฅ๋œ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์˜ ์ €ํ•˜๋ฅผ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๊ถ๊ทน์ ์œผ๋กœ ๋ณธ ์—ฐ๊ตฌ๋Š” ํ˜„์žฌ LLM์ด ์ƒˆ๋กœ์šด ์„ค์ •์—์„œ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์„ ์žฌํ™œ์šฉํ•˜๋Š” ๋Šฅ๋ ฅ์˜ ์ค‘์š”ํ•œ ํ•œ๊ณ„๋ฅผ ๋“œ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋™๊ธฐ

ํ•ต์‹ฌ ๋ฌธ์ œ

๋ณธ ์—ฐ๊ตฌ๊ฐ€ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•˜๋Š” ํ•ต์‹ฌ ๋ฌธ์ œ๋Š”: ํ˜„๋Œ€ LLM์ด ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์„ ๋ฌธ๋งฅ ๋‚ด ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ์™€ ์„ ํƒ์ ์œผ๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ ๋‹ค์ค‘ ํ™‰ ๋ฌธ์ œ์— ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋‹ตํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

๋ฌธ์ œ์˜ ์ค‘์š”์„ฑ

  1. ์‹ค์ œ ์‘์šฉ ์š”๊ตฌ์‚ฌํ•ญ: ํ˜„์‹ค์˜ ๋งŽ์€ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ LLM์ด ์‚ฌ์ „ ํ•™์Šต๋œ ์ง€์‹์„ ์ถ”๋ก  ์‹œ์ ์— ์ œ๊ณต๋˜๋Š” ์ƒˆ๋กœ์šด ๋˜๋Š” ๊ฐ€์ •์  ์ •๋ณด์™€ ๊ฒฐํ•ฉํ•ด์•ผ ํ•จ
  2. ์ง€์‹ ์ถฉ๋Œ ๊ณผ์ œ: ์™ธ๋ถ€ ๋ฌธ์„œ๊ฐ€ ๋‚ด๋ถ€ ์ง€์‹๊ณผ ์ถฉ๋Œํ•  ๋•Œ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ์ด ์–ด๋ ค์›€
  3. ์•ˆ์ „ ์ค‘์š” ์‘์šฉ: ์ƒํ˜ธ์ž‘์šฉ ์‹œ์Šคํ…œ, ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ํŒŒ์ดํ”„๋ผ์ธ ๋ฐ ์•ˆ์ „ ์ค‘์š” ์‘์šฉ์—์„œ ์ •ํ™•ํ•œ ์กฐ๊ฑด๋ถ€ ์ถ”๋ก ์ด ํ•„์ˆ˜์ 

๊ธฐ์กด ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„

  • ๊ธฐ์กด ๋‹ค์ค‘ ํ™‰ QA ๋ฒค์น˜๋งˆํฌ๋Š” ์ฃผ๋กœ ๋ชจ๋ธ์ด ์ €์žฅ๋œ ์‚ฌ์‹ค์„ ํšŒ์ƒํ•˜๊ฑฐ๋‚˜ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹ ์ฒด์ธ์„ ๊ฒฐํ•ฉํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, ์ด์ค‘ ์š”๊ตฌ์‚ฌํ•ญ์„ ํ…Œ์ŠคํŠธํ•˜์ง€ ์•Š์Œ
  • ์ง€์‹ ์ถฉ๋Œ ์—ฐ๊ตฌ๋Š” ๋ฐ˜์‚ฌ์‹ค์  ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก ์— ๋Œ€ํ•œ ์ฒด๊ณ„์  ํƒ๊ตฌ ๋ถ€์กฑ
  • RAG ๋ฐฉ๋ฒ•์€ ์™ธ๋ถ€ ์ •๋ณด๋ฅผ ๋ณ‘ํ•ฉํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์˜ ๊ณ ์œ ํ•œ ๊ณผ์ œ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†์Œ

์—ฐ๊ตฌ ๋™๊ธฐ

๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์ด๋ผ๋Š” ๊ตฌ์ฒด์ ์ธ ์ž‘์—…์„ ํ†ตํ•ด LLM์ด ์ง€์‹ ์ถฉ๋Œ์— ์ง๋ฉดํ–ˆ์„ ๋•Œ์˜ ์„ฑ๋Šฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์—ฐ๊ตฌํ•˜๋ฉฐ, ํŠนํžˆ **๋ฌธ๋งฅ ๋ฌด์‹œ(Contextual Override)**์™€ ์„ ํƒ์  ๊ฒ€์ƒ‰(Selective Retrieval) ๋Šฅ๋ ฅ์ด ๋™์‹œ์— ํ•„์š”ํ•œ ๊ฒฝ์šฐ๋ฅผ ์ค‘์ ์ ์œผ๋กœ ์‚ดํŽด๋ด…๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ๋ฐ˜์‚ฌ์‹ค์  QA ๋ฒค์น˜๋งˆํฌ: ํ•ฉ์„ฑ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ž‘์—…๊ณผ ํ˜„์‹ค ์„ธ๊ณ„ ์ธ๊ณผ ์ถ”๋ก  ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ๋„์ž…ํ•˜์—ฌ ์‚ฌ์ „ ํ•™์Šต๋œ ์ง€์‹ ๊ทธ๋ž˜ํ”„์— ๋Œ€ํ•œ (i)๊ฐ•ํ™”, (ii)์ถ”๊ฐ€, (iii)๋ชจ์ˆœ ๋ฐ (iv)๋ฌด๊ด€ํ•œ ๋ฌธ๋งฅ ๊ฒฝ์šฐ๋ฅผ ๋ถ„๋ฆฌ
  2. ์‹ค์ฆ ๋ถ„์„: GPT-4o ๋ฐ ๊ธฐํƒ€ ์ตœ์‹  ๋ชจ๋ธ์˜ ์‹คํ—˜์„ ํ†ตํ•ด ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ์‹คํŒจ ํŒจํ„ด ์‹๋ณ„: (a)๋ฌธ๋งฅ ๋ฌด์‹œ(๋ชจ๋ธ์ด ์ €์žฅ๋œ ์‚ฌ์‹ค์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ์‚ฌ์šฉ) ๋ฐ (b)๋ฌธ๋งฅ ๊ณผ์ ํ•ฉ(๋ชจ๋ธ์ด ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋งน๋ชฉ์ ์œผ๋กœ ๋”ฐ๋ฆ„)
  3. ๋ฏธ์„ธ ์กฐ์ • ํ•จ์ • ๋ถ„์„: ๋‹จ์ˆœํ•œ ์‚ฌํ›„ ๋ฏธ์„ธ ์กฐ์ •์ด ๋ฐ˜์‚ฌ์‹ค์  ์˜ˆ์ œ์—์„œ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฏธ๋ฏธํ•œ ์ด๋“๋งŒ ๊ฐ€์ ธ์˜ค๋ฉฐ, ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ํœด๋ฆฌ์Šคํ‹ฑ์„ ์œ ๋„ํ•˜์—ฌ ํ‘œ์ค€ ์‚ฌ์‹ค ๋ฒค์น˜๋งˆํฌ์˜ ์„ฑ๋Šฅ์„ ์ €ํ•˜์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ์„ ์ฆ๋ช…
  4. ์‹ค๋ฌด์  ์˜์˜: ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๊ฐ€ ์ƒํ˜ธ์ž‘์šฉ ์‹œ์Šคํ…œ, ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ํŒŒ์ดํ”„๋ผ์ธ ๋ฐ ์•ˆ์ „ ์ค‘์š” ์‘์šฉ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ๋…ผ์˜

๋ฐฉ๋ฒ•๋ก  ์ƒ์„ธ ์„ค๋ช…

์ž‘์—… ์ •์˜

์—ฐ๊ตฌ๋Š” ๋‹ค์Œ์„ ์š”๊ตฌํ•˜๋Š” ๋ฐ˜์‚ฌ์‹ค์  ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก  ์ž‘์—…์„ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค:

  1. ๋ฌธ๋งฅ ๋ฌด์‹œ: ๊ธฐ๋ณธ ์‚ฌ์‹ค์„ ์ผ์‹œ์ ์œผ๋กœ ์–ต์ œํ•˜๊ณ  ๊ฐ€์ •์  ์ „์ œ ์ˆ˜์šฉ
  2. ์„ ํƒ์  ๊ฒ€์ƒ‰: ๊ฐ€์ค‘์น˜์— ์ €์žฅ๋œ ๊ด€๋ จ ์—ฐ๊ด€์„ฑ์„ ๊ฒ€์ƒ‰ํ•˜๊ณ  ํ™œ์šฉํ•˜๋˜, ์ผ๋ถ€ ์ •๋ณด๊ฐ€ ๋ณ€๊ฒฝ๋˜์—ˆ๋”๋ผ๋„

์˜ˆ์‹œ: "ํŒŒ๋ฆฌ๊ฐ€ ์ดํƒˆ๋ฆฌ์•„์— ์œ„์น˜ํ•œ๋‹ค๋ฉด, ์—ํŽ ํƒ‘์€ ์–ด๋А ๊ตญ๊ฐ€์— ์žˆ์„๊นŒ?"

  • "ํŒŒ๋ฆฌ๋Š” ํ”„๋ž‘์Šค์— ์žˆ๋‹ค"๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹ ๋ฌด์‹œ ํ•„์š”
  • "์—ํŽ ํƒ‘์€ ํŒŒ๋ฆฌ์— ์žˆ๋‹ค"๋Š” ์—ฐ๊ด€์„ฑ ์œ ์ง€ ํ•„์š”

์‹คํ—˜ ์„ค๊ณ„

์‹ค์ œ LLM ์‹คํ—˜

๋ฌธ๋งฅ ์ •๋ณด๋ฅผ 4๊ฐ€์ง€ ์‹œ๋‚˜๋ฆฌ์˜ค๋กœ ๋ถ„๋ฅ˜:

  1. ์‹œ๋‚˜๋ฆฌ์˜ค 1(์‚ฌ์ „ ์ง€์‹ ๊ฐ•ํ™”): ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹ ๊ทธ๋ž˜ํ”„์— ์ด๋ฏธ ์กด์žฌํ•˜๋Š” ๊ด€๊ณ„ ์ œ๊ณต
  2. ์‹œ๋‚˜๋ฆฌ์˜ค 2(์ƒˆ ์ •๋ณด ์ถ”๊ฐ€): ์ฟผ๋ฆฌ ๋‹ต๋ณ€์— ํ•„์š”ํ•˜์ง€๋งŒ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹ ๊ทธ๋ž˜ํ”„์— ์—†๋Š” ์ •๋ณด ์ œ๊ณต
  3. ์‹œ๋‚˜๋ฆฌ์˜ค 3(์‚ฌ์ „ ์ง€์‹ ๋ชจ์ˆœ): ๊ธฐ์กด ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹๊ณผ ๊ฐ•ํ•˜๊ฒŒ ์ถฉ๋Œํ•˜๋Š” ์ •๋ณด ์ œ๊ณต
  4. ์‹œ๋‚˜๋ฆฌ์˜ค 4(๋ฌด๊ด€ํ•œ ์ •๋ณด): ์ฟผ๋ฆฌ์™€ ๋ฌด๊ด€ํ•œ ์ •๋ณด ์ œ๊ณต

ํ•ฉ์„ฑ ํ™˜๊ฒฝ ์‹คํ—˜

์ œ์–ด๋œ ํ•ฉ์„ฑ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ์„ค์ •์—์„œ:

  • ๋ฌด์ž‘์œ„๋กœ ๋ฐฉํ–ฅ ๊ทธ๋ž˜ํ”„ G ์ƒ์„ฑ, ์ •์ ์€ ์—”ํ‹ฐํ‹ฐ, ๊ฐ„์„ ์€ ๊ด€๊ณ„ ํ‘œํ˜„
  • ์›์ž ์‚ฌ์‹ค(๋‹จ์ผ ๊ฐ„์„ )๊ณผ ์ถ”๋ก  ์‚ฌ์‹ค(2ํ™‰ ์กฐํ•ฉ) ๊ตฌ๋ถ„
  • ์„ธ ๊ฐ€์ง€ ๋ฐ˜์‚ฌ์‹ค์  ์œ ํ˜• ํ…Œ์ŠคํŠธ:
    • Hop 1 ๊ด€๋ จ: ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๊ฐ€ ์ถ”๋ก  ์‚ฌ์‹ค์˜ ์ฒซ ๋ฒˆ์งธ ํ™‰ ์ˆ˜์ •
    • Hop 2 ๊ด€๋ จ: ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๊ฐ€ ๋ธŒ๋ฆฟ์ง€ ์—”ํ‹ฐํ‹ฐ์™€ ์ตœ์ข… ๋‹ต๋ณ€ ๊ฐ„ ๋งํฌ ์ˆ˜์ •
    • ๋ฌด๊ด€ํ•œ ๋ฐ˜์‚ฌ์‹ค: ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๊ฐ€ ๋‹ค์ค‘ ํ™‰ ์ฟผ๋ฆฌ์™€ ์™„์ „ํžˆ ๋ฌด๊ด€

ํ”„๋กฌํ”„ํŠธ ์ „๋žต

์„ธ ๊ฐ€์ง€ ์ „๋žต ๋น„๊ต:

  1. ํ‘œ์ค€: ์ง์ ‘ ์ธ๊ณผ ์ฟผ๋ฆฌ
  2. CoT: ์‚ฌ๊ณ ์˜ ์—ฐ์‡„ ํ”„๋กฌํ”„ํŒ…
  3. FT: CoT ์„ค๋ช…์ด ์žˆ๋Š” ๋ฐ˜์‚ฌ์‹ค์  ์˜ˆ์ œ์— ๋Œ€ํ•œ ๋ฏธ์„ธ ์กฐ์ •

์‹คํ—˜ ์„ค์ •

๋ฐ์ดํ„ฐ์…‹

  • ์‹ค์ œ ์„ธ๊ณ„ ์‹คํ—˜: ์ธ๊ณผ ๊ด€๊ณ„ ๊ธฐ๋ฐ˜ ์ด์ง„ ๋ถ„๋ฅ˜ ์ž‘์—…, ๋ฌด์ž‘์œ„ ๊ธฐ์ค€์„  50%
  • ํ•ฉ์„ฑ ์‹คํ—˜: ์›์ž ์‚ฌ์‹ค๊ณผ ์ถ”๋ก  ์‚ฌ์‹ค์„ ํฌํ•จํ•œ ๋ฌด์ž‘์œ„ ์ƒ์„ฑ ์ง€์‹ ๊ทธ๋ž˜ํ”„

ํ‰๊ฐ€ ์ง€ํ‘œ

  • ์ •ํ™•๋„(Accuracy)
  • 1ํ™‰ ๋ฐ 2ํ™‰ ์ถ”๋ก  ์ž‘์—…์˜ ์„ฑ๋Šฅ

๋น„๊ต ๋ฐฉ๋ฒ•

  • GPT-4o(ํ‘œ์ค€, CoT, ๋ฏธ์„ธ ์กฐ์ • ๋ฒ„์ „)
  • GPT-5 (Thinking)
  • Llama 3.1 8B

๊ตฌํ˜„ ์„ธ๋ถ€์‚ฌํ•ญ

  • GPT ๋ฏธ์„ธ ์กฐ์ •: ํ•™์Šต ํ† ํฐ 38,754, 3 ์—ํฌํฌ, ๋ฐฐ์น˜ ํฌ๊ธฐ 1, ํ•™์Šต๋ฅ  ๋ฐฐ์ˆ˜ 2
  • Llama ๋ฏธ์„ธ ์กฐ์ •: 5 ์—ํฌํฌ, LoRA rank 8, ํ•™์Šต๋ฅ  0.0001
  • ํ•ฉ์„ฑ ์‹คํ—˜: 4๊ฐœ NVIDIA A6000 GPU ์‚ฌ์šฉ, ์ด 72 GPU ์‹œ๊ฐ„

์‹คํ—˜ ๊ฒฐ๊ณผ

์ฃผ์š” ๊ฒฐ๊ณผ

์‹ค์ œ LLM ์„ฑ๋Šฅ

  1. ์‹œ๋‚˜๋ฆฌ์˜ค 1(์‚ฌ์ „ ์ง€์‹ ๊ฐ•ํ™”): ๋ชจ๋“  ๋ชจ๋ธ์ด ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ, ์ •ํ™•๋„ 90%-100% ๋ฒ”์œ„
  2. ์‹œ๋‚˜๋ฆฌ์˜ค 2(์ •๋ณด ์ถ”๊ฐ€): ๋ฏธ์„ธ ์กฐ์ • ๋ฏธ์ ์šฉ ๋ชจ๋ธ ์ •ํ™•๋„ 60-75%, ๋ฏธ์„ธ ์กฐ์ • ํ›„ ์•ฝ 90%๋กœ ์ƒ์Šน
  3. ์‹œ๋‚˜๋ฆฌ์˜ค 3(์‚ฌ์ „ ์ง€์‹ ๋ชจ์ˆœ): ์„ฑ๋Šฅ์ด 50% ๊ธฐ์ค€์„  ๊ทผ์ฒ˜๋กœ ๋ถ•๊ดด, ๋ฏธ์„ธ ์กฐ์ •์€ ๋ฏธ๋ฏธํ•œ ๊ฐœ์„ ๋งŒ ์ œ๊ณต
  4. ์‹œ๋‚˜๋ฆฌ์˜ค 4(๋ฌด๊ด€ํ•œ ์ •๋ณด): ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ, GPT-5๋Š” ๊ฑฐ์˜ ์™„๋ฒฝํ•œ ์ •ํ™•๋„ ๋‹ฌ์„ฑ

ํ•ฉ์„ฑ ํ™˜๊ฒฝ ๋ฐœ๊ฒฌ

  • ๋ฏธ์„ธ ์กฐ์ • ์œ ๋„ ์ง€๋ฆ„๊ธธ: ๋ชจ๋ธ์ด ์ง„์ •ํ•œ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ๋ณด๋‹ค๋Š” ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ์— ํ‘œ์‹œ๋œ ์—”ํ‹ฐํ‹ฐ๋ฅผ ๋ฐ˜๋ณตํ•˜๋Š” ๋ฒ•์„ ๋น ๋ฅด๊ฒŒ ํ•™์Šต
  • ์„ ํƒ์  ๋ฌด์‹œ ์–ด๋ ค์›€: ๋ชจ๋ธ์ด ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๊ฐ€ ์–ธ์ œ ๊ด€๋ จ์ด ์žˆ๋Š”์ง€ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ฒ•์„ ํ•™์Šตํ•  ์ˆ˜ ์—†์Œ
  • ์‚ฌ์ „ ํ•™์Šต ์ค‘ ๋ฐ˜์‚ฌ์‹ค์  ๋ฐ์ดํ„ฐ ํฌํ•จ: ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ์‚ฌ์‹ค ์ž‘์—… ์„ฑ๋Šฅ์„ ์†์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ

์†Œ๊ฑฐ ์‹คํ—˜

์ œ์–ด ์‹คํ—˜์„ ํ†ตํ•ด ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ํ˜•์‹ ๋ณ€ํ™”๋กœ ์ธํ•œ ๊ฒƒ์ด ์•„๋‹˜์„ ์ฆ๋ช…:

  • ๋ฌธ๋งฅ ๋ฌด์‹œ๊ฐ€ ํ•„์š” ์—†๋Š” CoT ์ž‘์—… ๊ตฌ์„ฑ
  • ๋ฏธ์„ธ ์กฐ์ •์ด ์ด๋Ÿฌํ•œ ์ž‘์—…์— ๋น ๋ฅด๊ฒŒ ์ ์‘(100% ํ…Œ์ŠคํŠธ ์ •ํ™•๋„)
  • ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ์‹คํŒจ๊ฐ€ ์ผ๋ฐ˜์  ์žฌ์•™์  ๋ง๊ฐ์ด ์•„๋‹Œ ์ž‘์—… ์ž์ฒด์˜ ์–ด๋ ค์›€์—์„œ ๋น„๋กฏ๋จ์„ ์‹œ์‚ฌ

์ฃผ์š” ๋ฐœ๊ฒฌ

  1. ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ์‹คํŒจ ํŒจํ„ด:
    • ๋ฌธ๋งฅ ๋ฌด์‹œ: ๋ชจ๋ธ์ด ์ €์žฅ๋œ ์‚ฌ์‹ค์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ์‚ฌ์šฉ
    • ๋ฌธ๋งฅ ๊ณผ์ ํ•ฉ: ๋ชจ๋ธ์ด ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋งน๋ชฉ์ ์œผ๋กœ ๋”ฐ๋ฅด์ง€๋งŒ ๊ด€๋ จ ๋งํฌ๋ฅผ ์žŠ์Œ
  2. ์ •๋ ฌ์˜ ์˜ํ–ฅ: ํ˜„๋Œ€ ํ”„๋กœ๋•์…˜ LLM์€ ์‚ฌ์‹ค์„ฑ ๋ฐ ์•ˆ์ „ ์ •๋ ฌ ํ•™์Šต์„ ๊ฑฐ์ณ ์‚ฌ์ „ ํ•™์Šต๋œ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์— ์˜์กดํ•˜๋Š” ๊ฒฝํ–ฅ
  3. ๋ฏธ์„ธ ์กฐ์ •์˜ ํ•œ๊ณ„: ๋‹จ์ˆœํ•œ ์‚ฌํ›„ ๋ฏธ์„ธ ์กฐ์ •์€ ๊ฒฌ๊ณ ํ•œ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ฃผ์ž…ํ•˜๊ธฐ ์–ด๋ ค์›€

๊ด€๋ จ ์—ฐ๊ตฌ

๋‹ค์ค‘ ํ™‰ ์งˆ์˜์‘๋‹ต

  • HotpotQA ๋“ฑ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก  ๋Šฅ๋ ฅ ํ…Œ์ŠคํŠธ
  • ๊ธฐ์กด ์—ฐ๊ตฌ๋Š” ์ฃผ๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹๋งŒ ํฌํ•จํ•˜๋Š” ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก ์— ์ดˆ์ 
  • ๋ณธ ๋…ผ๋ฌธ์€ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹๊ณผ ๋ฌธ๋งฅ ์ง€์‹ ๊ฒฐํ•ฉ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ๋ฅผ ๋…ํŠนํ•˜๊ฒŒ ์—ฐ๊ตฌ

์ง€์‹ ์ถฉ๋Œ

  • RAG ๋ฐฉ๋ฒ•์ด ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ๋ฉ”๋ชจ๋ฆฌ์™€ ๊ฒ€์ƒ‰๋œ ์ •๋ณด ๋ณ‘ํ•ฉ ์‹œ๋„
  • ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์˜ ๊ณ ์œ ํ•œ ๊ณผ์ œ์— ๋ถ€์ ํ•ฉ
  • ์™„์ „ํžˆ ๋ฒ„๋ฆฌ๊ธฐ๋ณด๋‹ค๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹์„ ์„ ํƒ์ ์œผ๋กœ ๋ณด์กด ๋ฐ ํ†ตํ•ฉ ํ•„์š”

์ธ๊ณผ ์ถ”๋ก  ๋ฐ ๋ฐ˜์‚ฌ์‹ค

  • LLM์˜ ์ธ๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์€ ํ™œ๋ฐœํ•œ ์—ฐ๊ตฌ ๋ถ„์•ผ
  • ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ(CLadder, CounterBench ๋“ฑ)๋Š” ํ˜•์‹์  ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์—์„œ LLM์˜ ํ•œ๊ณ„ ๋“œ๋Ÿฌ๋ƒ„
  • ๋ณธ ๋…ผ๋ฌธ์€ LLM์ด ๋‹ค์ค‘ ํ™‰ ์ถ”๋ก ์—์„œ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”๋œ ์ง€์‹๊ณผ ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ํ†ตํ•ฉํ•˜๋Š”์ง€ ์ดํ•ดํ•˜๋Š” ๊ณต๋ฐฑ ์ฑ„์›€

๊ฒฐ๋ก  ๋ฐ ๋…ผ์˜

์ฃผ์š” ๊ฒฐ๋ก 

  1. ๊ทผ๋ณธ์  ํ•œ๊ณ„: ํ˜„์žฌ LLM์€ ์ถฉ๋Œํ•˜๊ฑฐ๋‚˜ ์ƒˆ๋กœ์šด ์ •๋ณด์— ๋Œ€์‘ํ•˜์—ฌ ๋‚ด๋ถ€ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ๋™์ ์œผ๋กœ ์ˆ˜์ • ๋˜๋Š” ํ™•์žฅํ•˜๋Š” ๊ฒฌ๊ณ ํ•œ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ถ€์กฑ
  2. ์‹คํŒจ ํŒจํ„ด์˜ ๋ณดํŽธ์„ฑ: ๋ฌธ๋งฅ ๋ฌด์‹œ ๋ฐ ๋ฌธ๋งฅ ๊ณผ์ ํ•ฉ ๋ฌธ์ œ๋Š” ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ ์ „๋žต ๋ฐ ๋ฏธ์„ธ ์กฐ์ • ๋ฐฉ๋ฒ•์—์„œ ์ง€์†์ ์œผ๋กœ ๋‚˜ํƒ€๋‚จ
  3. ๋ฏธ์„ธ ์กฐ์ • ํšจ๊ณผ ์ œํ•œ: ๋‹จ์ˆœํ•œ ๋ฏธ์„ธ ์กฐ์ • ๋ฐฉ๋ฒ•์€ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†์œผ๋ฉฐ, ๊ธฐ์กด ์ง€์‹์„ ์†์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ

ํ•œ๊ณ„

  1. ๋‹จ์ˆœํ™”๋œ ์„ค์ •: ํ•ฉ์„ฑ ํ™˜๊ฒฝ์—์„œ ๋ฐ˜์‚ฌ์‹ค์  ์ „์ œ๋Š” ์ •์  ์ง€์‹ ๊ทธ๋ž˜ํ”„์˜ ๋‹จ์ผ ๊ฐ„์„  ํŽธ์ง‘์œผ๋กœ ํ‘œํ˜„๋˜๋ฉฐ, ์ฟผ๋ฆฌ๋Š” 2ํ™‰ ๋งํฌ๋กœ ์ œํ•œ
  2. ๋ณต์žก์„ฑ ๋ถ€์กฑ: ํ˜„์‹ค ์„ธ๊ณ„ ์‹œ๋‚˜๋ฆฌ์˜ค๋Š” ๋‹ค์ค‘ ์ˆ ์–ด ์ƒํ˜ธ์ž‘์šฉ, ๋ชจํ˜ธํ•˜๊ฑฐ๋‚˜ ํ™•๋ฅ ์  ๊ด€๊ณ„, ๋‹ค์ค‘ ์†Œ์Šค ๋…ธ์ด์ฆˆ ์ฆ๊ฑฐ ํฌํ•จ
  3. ๊นŠ์ด ์ œํ•œ: ๋” ๊นŠ๊ณ  ๋” ๋ณต์žกํ•œ ๋‹ค์ค‘ ํ™‰ ๊ด€๊ณ„๋กœ ํ™•์žฅ๋˜์ง€ ์•Š์Œ

ํ–ฅํ›„ ๋ฐฉํ–ฅ

  1. ์ƒˆ๋กœ์šด ๋ชจ๋ธ๋ง ํŒจ๋Ÿฌ๋‹ค์ž„: ์ €์žฅ๋œ ์ง€์‹๊ณผ ๋ฌธ๋งฅ ์ง€์‹์„ ๋™์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๋ฉด์„œ ์–ด๋А ์ชฝ๋„ ์†์ƒ์‹œํ‚ค์ง€ ์•Š๋Š” ์ƒˆ๋กœ์šด ๋ชจ๋ธ๋ง ๋ฐ ํ•™์Šต ํŒจ๋Ÿฌ๋‹ค์ž„ ๊ฐœ๋ฐœ ํ•„์š”
  2. ๋ฉ”์ปค๋‹ˆ์ฆ˜ ์—ฐ๊ตฌ: ์„ ํƒ์  ์ง€์‹ ๋ฌด์‹œ์˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ตฌํ˜„์— ๋Œ€ํ•œ ์‹ฌ์ธต ์—ฐ๊ตฌ
  3. ๋ณต์žก์„ฑ ํ™•์žฅ: ๋ถ„์„์„ ๋” ๊นŠ๊ณ  ๋ณต์žกํ•œ ๋‹ค์ค‘ ํ™‰ ๊ด€๊ณ„ ๋ฐ ํ˜„์‹ค ์‹œ๋‚˜๋ฆฌ์˜ค๋กœ ํ™•์žฅ

์‹ฌ์ธต ํ‰๊ฐ€

์žฅ์ 

  1. ๋ฌธ์ œ์˜ ์ค‘์š”์„ฑ: LLM์ด ์ง€์‹ ์ถฉ๋Œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์ง๋ฉดํ•œ ํ•ต์‹ฌ ํ•œ๊ณ„๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ์ฒด๊ณ„์ ์œผ๋กœ ์—ฐ๊ตฌ
  2. ์—„๊ฒฉํ•œ ์‹คํ—˜ ์„ค๊ณ„: ์‹ค์ œ ์„ธ๊ณ„ ๋ฐ ํ•ฉ์„ฑ ํ™˜๊ฒฝ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ํฌ๊ด„์ ์ธ ๋ถ„์„ ๊ด€์  ์ œ๊ณต
  3. ํ†ต์ฐฐ๋ ฅ ์žˆ๋Š” ๋ฐœ๊ฒฌ: ๋‘ ๊ฐ€์ง€ ๋ช…ํ™•ํ•œ ์‹คํŒจ ํŒจํ„ด์„ ๋“œ๋Ÿฌ๋‚ด์–ด LLM ํ–‰๋™ ์ดํ•ด์— ์ค‘์š”ํ•œ ํ†ต์ฐฐ๋ ฅ ์ œ๊ณต
  4. ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์—ฌ: ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ๋Šฅ๋ ฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ํšจ๊ณผ์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์‹œ

๋ถ€์กฑํ•œ ์ 

  1. ํ•ด๊ฒฐ์ฑ… ๋ถ€์žฌ: ์ฃผ๋กœ ๋ฌธ์ œ๋ฅผ ์‹๋ณ„ํ•˜์ง€๋งŒ ํšจ๊ณผ์ ์ธ ํ•ด๊ฒฐ์ฑ… ์ œ์‹œํ•˜์ง€ ์•Š์Œ
  2. ๋ชจ๋ธ ๋ฒ”์œ„ ์ œํ•œ: ์ฃผ๋กœ ์†Œ์ˆ˜ ๋ชจ๋ธ๋งŒ ํ…Œ์ŠคํŠธํ•˜์—ฌ ๊ด‘๋ฒ”์œ„ํ•œ ๋ชจ๋ธ ํ‰๊ฐ€ ๋ถ€์กฑ
  3. ์ž‘์—… ๋ณต์žก์„ฑ: ํ˜„์žฌ ์ž‘์—… ์„ค์ •์ด ์ƒ๋Œ€์ ์œผ๋กœ ๋‹จ์ˆœํ•˜์—ฌ ์‹ค์ œ ์‘์šฉ๊ณผ ๊ฒฉ์ฐจ ์กด์žฌ
  4. ์ด๋ก ์  ๋ถ„์„ ๋ถ€์กฑ: ์‹คํŒจ ๋ฉ”์ปค๋‹ˆ์ฆ˜์— ๋Œ€ํ•œ ์‹ฌ์ธต ์ด๋ก ์  ์„ค๋ช… ๋ถ€์กฑ

์˜ํ–ฅ๋ ฅ

  1. ํ•™์ˆ ์  ๊ฐ€์น˜: LLM ์ง€์‹ ํ†ตํ•ฉ ์—ฐ๊ตฌ์— ์ค‘์š”ํ•œ ๊ธฐ์ดˆ ์ œ๊ณตํ•˜์—ฌ ํ›„์† ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ์˜๊ฐ ๊ฐ€๋Šฅ
  2. ์‹ค๋ฌด์  ์˜์˜: RAG ์‹œ์Šคํ…œ ๋ฐ ๋™์  ์ง€์‹ ํ†ตํ•ฉ์ด ํ•„์š”ํ•œ ์‘์šฉ์— ์ค‘์š”ํ•œ ์ง€์นจ ์ œ๊ณต
  3. ๊ฒฝ๊ณ  ์—ญํ• : ์—ฐ๊ตฌ์ž ๋ฐ ์‹ค๋ฌด์ž์—๊ฒŒ LLM์ด ์ง€์‹ ์ถฉ๋Œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ์˜ ํ•œ๊ณ„ ์ฃผ์˜ ํ™˜๊ธฐ

์ ์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค

  1. ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์‹œ์Šคํ…œ: ์ถฉ๋Œํ•˜๋Š” ์ •๋ณด ์ฒ˜๋ฆฌ ์‹œ RAG ์‹œ์Šคํ…œ ์„ค๊ณ„ ์ง€์นจ
  2. ์ƒํ˜ธ์ž‘์šฉํ˜• AI: ๊ฐ€์ •์  ์‹œ๋‚˜๋ฆฌ์˜ค ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ๋Œ€ํ™” ์‹œ์Šคํ…œ์— ์ฐธ๊ณ  ์ž๋ฃŒ ์ œ๊ณต
  3. ์•ˆ์ „ ์ค‘์š” ์‘์šฉ: ์ •ํ™•ํ•œ ์กฐ๊ฑด๋ถ€ ์ถ”๋ก ์ด ํ•„์š”ํ•œ ๋ถ„์•ผ ์ ์šฉ ์‹œ ํŠน๋ณ„ํ•œ ์ฃผ์˜ ํ•„์š”

์ฐธ๊ณ ๋ฌธํ—Œ

๋…ผ๋ฌธ์€ ๊ด€๋ จ ๋ถ„์•ผ์˜ ์ค‘์š”ํ•œ ์—ฐ๊ตฌ๋ฅผ ์ธ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋‹ค์ค‘ ํ™‰ ์งˆ์˜์‘๋‹ต ๋ฒค์น˜๋งˆํฌ(HotpotQA, NaturalQuestions)
  • ์ง€์‹ ์ถฉ๋Œ ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•(RAG, REALM, DPR)
  • ์ธ๊ณผ ์ถ”๋ก  ํ‰๊ฐ€(CLadder, CounterBench)
  • LLM ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ถ„์„(Grokking transformers ๋“ฑ)

์ข…ํ•ฉ ํ‰๊ฐ€: ์ด๋Š” LLM์ด ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์—์„œ ์ง๋ฉดํ•œ ์ค‘์š”ํ•œ ํ•œ๊ณ„๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์‹๋ณ„ํ•˜๊ณ  ๋ถ„์„ํ•˜๋Š” ๊ณ ํ’ˆ์งˆ ์—ฐ๊ตฌ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค. ์™„์ „ํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•˜์ง€๋Š” ์•Š์ง€๋งŒ, LLM์˜ ์ง€์‹ ํ†ตํ•ฉ ๋Šฅ๋ ฅ์„ ์ดํ•ดํ•˜๊ณ  ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ ์ค‘์š”ํ•œ ๊ธฐ์ดˆ๋ฅผ ๋งˆ๋ จํ•˜๋ฉฐ, ํ•ด๋‹น ๋ถ„์•ผ์˜ ๋ฐœ์ „์— ์ค‘์š”ํ•œ ์ถ”์ง„๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.