2025-11-14T19:07:12.969387

Navigating Nuance: In Quest for Political Truth

Sar, Roy
This study investigates the several nuanced rationales for countering the rise of political bias. We evaluate the performance of the Llama-3 (70B) language model on the Media Bias Identification Benchmark (MBIB), based on a novel prompting technique that incorporates subtle reasons for identifying political leaning. Our findings underscore the challenges of detecting political bias and highlight the potential of transfer learning methods to enhance future models. Through our framework, we achieve a comparable performance with the supervised and fully fine-tuned ConvBERT model, which is the state-of-the-art model, performing best among other baseline models for the political bias task on MBIB. By demonstrating the effectiveness of our approach, we contribute to the development of more robust tools for mitigating the spread of misinformation and polarization. Our codes and dataset are made publicly available in github.
academic

๋‰˜์•™์Šค ํƒ์ƒ‰: ์ •์น˜์  ์ง„์‹ค ์ถ”๊ตฌ

๊ธฐ๋ณธ ์ •๋ณด

  • ๋…ผ๋ฌธ ID: 2501.00782
  • ์ œ๋ชฉ: Navigating Nuance: In Quest for Political Truth
  • ์ €์ž: Soumyadeep Sar (Indian Institute of Science Education and Research Kolkata), Dwaipayan Roy (Indian Institute of Science Education and Research Kolkata)
  • ๋ถ„๋ฅ˜: cs.CL cs.IR
  • ๋ฐœํ‘œ ์‹œ๊ฐ„/ํ•™ํšŒ: JCDL '24 (2024 ACM/IEEE Joint Conference on Digital Libraries), 2024๋…„ 12์›” 16-20์ผ, ํ™์ฝฉ, ์ค‘๊ตญ
  • ๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2501.00782

์ดˆ๋ก

๋ณธ ์—ฐ๊ตฌ๋Š” ์ •์น˜์  ํŽธ๊ฒฌ ์ƒ์Šน์— ๋Œ€ํ•ญํ•˜๋Š” ๋‹ค์–‘ํ•œ ๋ฏธ๋ฌ˜ํ•œ ์ด์œ ๋“ค์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ๋ฏธ๋””์–ด ํŽธ๊ฒฌ ์‹๋ณ„ ๋ฒค์น˜๋งˆํฌ(MBIB)์—์„œ Llama-3(70B) ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ–ˆ์œผ๋ฉฐ, ์ •์น˜์  ์„ฑํ–ฅ์˜ ๋ฏธ๋ฌ˜ํ•œ ์›์ธ์„ ์‹๋ณ„ํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋Š” ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€์˜ ๋„์ „์„ฑ์„ ๊ฐ•์กฐํ–ˆ์œผ๋ฉฐ, ์ „์ด ํ•™์Šต ๋ฐฉ๋ฒ•์ด ํ–ฅํ›„ ๋ชจ๋ธ ๊ฐœ์„ ์˜ ์ž ์žฌ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ์„ ๋ถ€๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด ์ €์ž๋“ค์€ ๊ฐ๋… ํ•™์Šต ๋ฐ ์™„์ „ ๋ฏธ์„ธ์กฐ์ •๋œ ConvBERT ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ์ด๋Š” MBIB ์ •์น˜์  ํŽธ๊ฒฌ ์ž‘์—…์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์˜ ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋ฐฉ๋ฒ•์˜ ์œ ํšจ์„ฑ์„ ์ž…์ฆํ•จ์œผ๋กœ์จ ๋ณธ ์—ฐ๊ตฌ๋Š” ํ—ˆ์œ„ ์ •๋ณด ๋ฐ ์–‘๊ทนํ™” ํ™•์‚ฐ์„ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ๋”์šฑ ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ ๊ฐœ๋ฐœ์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋™๊ธฐ

๋ฌธ์ œ ์ •์˜

์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP) ๋ถ„์•ผ์˜ ํ•ต์‹ฌ ์—ฐ๊ตฌ ์˜์—ญ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฏธ๋””์–ด ๋ฌธํ•ด๋ ฅ, ์—ฌ๋ก  ํ˜•์„ฑ, ๋ฏผ์ฃผ์ฃผ์˜ ๊ณผ์ •์— ์ค‘๋Œ€ํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋ฏธ๋””์–ด ๋ฐ ์˜จ๋ผ์ธ ์ฝ˜ํ…์ธ ์—์„œ ์ •์น˜์  ํŽธ๊ฒฌ์˜ ๊ด‘๋ฒ”์œ„ํ•œ ํ™•์‚ฐ์€ ๊ฐ•๋ ฅํ•œ ์‹๋ณ„ ๋ฐ ๋ถ„์„ ๋ฐฉ๋ฒ• ๊ตฌ์ถ•์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค.

๋ฌธ์ œ์˜ ์ค‘์š”์„ฑ

  1. ์‚ฌํšŒ์  ์˜ํ–ฅ: ์ •์น˜์  ํŽธ๊ฒฌ์€ ์–ดํœ˜ ์„ ํƒ, ์ด์Šˆ ํ”„๋ ˆ์ด๋ฐ, ์„ ํƒ์  ์ •๋ณด ์ƒ๋žต ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ๋กœ ๋‚˜ํƒ€๋‚˜๋ฉฐ, ๋…์ž์˜ ์ธ์‹๊ณผ ์‹ ๋…์— ๋ฏธ๋ฌ˜ํ•˜๊ฒŒ ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค
  2. ๊ธฐ์ˆ ์  ๋„์ „: ์ •์น˜์  ํŽธ๊ฒฌ์˜ ์ฃผ๊ด€์  ํŠน์„ฑ๊ณผ ์ •์น˜ ๋‹ด๋ก ์˜ ๋™์  ์ง„ํ™”๋Š” ์ž‘์—…์˜ ๋ณต์žก์„ฑ์„ ์ฆ๊ฐ€์‹œํ‚ต๋‹ˆ๋‹ค
  3. ์‹ค์ œ ํ•„์š”์„ฑ: ์†Œ์…œ ๋ฏธ๋””์–ด ์‹œ๋Œ€์—๋Š” ํŽธ๊ฒฌ ํ™•์‚ฐ์„ ์‹๋ณ„ํ•˜๊ณ  ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ์ž๋™ํ™” ๋„๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค

๊ธฐ์กด ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„

  1. ์ „ํ†ต์  ๋ฐฉ๋ฒ•: ์‚ฌ์ „ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์€ ๋ฏธ๋ฆฌ ์ •์˜๋œ ํŽธ๊ฒฌ ์šฉ์–ด ๋ฐ ๊ตฌ๋ฌธ ๋ชฉ๋ก์— ์˜์กดํ•˜๋ฉฐ, ์ •์น˜์  ํŽธ๊ฒฌ์˜ ๋ฏธ๋ฌ˜ํ•˜๊ณ  ์ƒํ™ฉ ์˜์กด์  ํŠน์„ฑ์„ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค
  2. ์‹ฌ์ธต ํ•™์Šต ๋ฐฉ๋ฒ•: ๋”์šฑ ๋ฏธ๋ฌ˜ํ•œ ํŽธ๊ฒฌ ํ˜•ํƒœ๋ฅผ ํฌ์ฐฉํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹ ๋ฐ ์ •์น˜ ํ™˜๊ฒฝ์—์„œ ๋†’์€ ์ •ํ™•๋„์™€ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ์ „ํžˆ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค
  3. ์ž์› ์ง‘์•ฝ์ : ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ํ›ˆ๋ จ์—๋Š” ๋ง‰๋Œ€ํ•œ ๊ณ„์‚ฐ ์ž์›๊ณผ ์ฃผ์„ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค

์—ฐ๊ตฌ ๋™๊ธฐ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ์ถœํ˜„์œผ๋กœ ๊ทน๋„๋กœ ํฐ ๊ทœ๋ชจ์˜ ๋ชจ๋ธ ํ›ˆ๋ จ์ด ์ž์› ์ง‘์•ฝ์ ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋งฅ๋ฝ ๋‚ด ํ•™์Šต ๊ธฐ๋ฒ•์€ ์ ์ ˆํ•œ ๋งฅ๋ฝ ์˜ˆ์ œ ๋ฐ ์ง€์‹œ์‚ฌํ•ญ์„ ํ†ตํ•ด ๋ชจ๋ธ์— ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ๊ฐ€๋ฅด์น˜๋Š” ์šฐ์ˆ˜ํ•œ ์ˆ˜๋‹จ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. Chain-of-Thought(CoT) ๊ธฐ๋ฐ˜์˜ ์ƒˆ๋กœ์šด ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ• ์ œ์•ˆ: ์ •์น˜์  ํŽธ๊ฒฌ ์‹๋ณ„์˜ ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ๋‹จ๊ณ„๋ฅผ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค
  2. ๊ฐ๋… ํ•™์Šต ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•๋งŒ์œผ๋กœ ์™„์ „ ๊ฐ๋… ๋ฏธ์„ธ์กฐ์ •๋œ ConvBERT ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•œ ํšจ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค
  3. ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŒ… ์ „๋žต์˜ ์ฒด๊ณ„์  ํ‰๊ฐ€: ์˜์  ์ƒท, ์†Œ์ˆ˜ ์ƒท, CoT ํ”„๋กฌํ”„ํŒ…์„ ํฌํ•จํ•œ ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€ ์ž‘์—…์—์„œ์˜ ์„ฑ๋Šฅ ๋น„๊ต
  4. ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์‹คํ—˜ ์„ค์ • ์ œ๊ณต: ์ฝ”๋“œ ๋ฐ ๋ฐ์ดํ„ฐ์…‹์ด ๊ณต๊ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค
  5. ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€ ๋ณต์žก์„ฑ์˜ ์‹ฌ์ธต ๋ถ„์„: ์ด ๋ถ„์•ผ์˜ ํ‘œ์ค€ํ™”๋œ ๊ธฐ๋ฒ• ๊ฐœ๋ฐœ์— ๋Œ€ํ•œ ํ†ต์ฐฐ๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค

๋ฐฉ๋ฒ•๋ก  ์ƒ์„ธ ์„ค๋ช…

์ž‘์—… ์ •์˜

์ž…๋ ฅ: ํ…์ŠคํŠธ ๋ฌธ์žฅ ์ถœ๋ ฅ: ์ด์ง„ ๋ถ„๋ฅ˜ ๋ ˆ์ด๋ธ” (0: ํŽธ๊ฒฌ ์—†์Œ, 1: ์ •์น˜์  ํŽธ๊ฒฌ ์žˆ์Œ) ์ œ์•ฝ ์กฐ๊ฑด: ๋งฅ๋ฝ ๋‚ด ํ•™์Šต๋งŒ ์‚ฌ์šฉ, ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ • ์—†์Œ

๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜

์—ฐ๊ตฌ๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ Llama-3-70B๋ฅผ ๊ธฐ๋ณธ ๋ชจ๋ธ๋กœ ์‚ฌ์šฉํ•˜๋ฉฐ, Groq ํ”Œ๋žซํผ์˜ API ์„œ๋น„์Šค๋ฅผ ํ†ตํ•ด ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์ธ ๊ตฌ์„ฑ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ๊ธฐ๋ณธ ๋ชจ๋ธ: Meta์˜ Llama-3-70B-Instruct
  • ์˜จ๋„ ์„ค์ •: 0.0 (ํ™˜๊ฐ ๋ฐ ์ง€์‹œ์‚ฌํ•ญ ์ดํƒˆ ๋ฐฉ์ง€)
  • ์ถ”๋ก  ํ”Œ๋žซํผ: Groq API + Langchain-groq ํ†ตํ•ฉ
  • ๊ธฐํƒ€ ๋งค๊ฐœ๋ณ€์ˆ˜: ๊ธฐ๋ณธ ์„ค์ •

๊ธฐ์ˆ  ํ˜์‹ ์ 

1. Chain-of-Thought ํ”„๋กฌํ”„ํŒ… ์„ค๊ณ„

์ €์ž๋“ค์€ ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•˜๋Š” CoT ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ–ˆ์œผ๋ฉฐ, ๋‹ค์Œ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค:

  • ์‚ฌ์‹ค ๋ณด๋„ ๋ถ„์„: ํ…์ŠคํŠธ์˜ ๊ฐ๊ด€์„ฑ ํ‰๊ฐ€
  • ์–ธ์–ด ์ค‘๋ฆฝ์„ฑ ๊ฒ€์‚ฌ: ๊ฐ์ •์  ๋˜๋Š” ์„ ๋™์  ์–ด์กฐ ์‹๋ณ„
  • ํŽธ๊ฒฌ ๊ฐ์ง€: ์•”๋ฌต์  ๋˜๋Š” ๋ช…์‹œ์  ํŽธ๊ฒฌ ํƒ์ƒ‰
  • ๋งฅ๋ฝ ์ƒ๋žต ๋ถ„์„: ์˜ค๋„ํ•˜๋Š” ์ •๋ณด ์ƒ๋žต ์—ฌ๋ถ€ ํ™•์ธ
  • ์—ฐ๊ด€์„ฑ ์•”์‹œ ์‹๋ณ„: ์—ฐ๊ด€์„ ํ†ตํ•ด ์ƒ์„ฑ๋œ ํŽธ๊ฒฌ ๋ฐœ๊ฒฌ

2. ์˜ˆ์ œ ์„ ํƒ ์ „๋žต

  • ์–ด๋ ค์šด ์ƒ˜ํ”Œ ์„ ํƒ: ์˜์  ์ƒท ํ”„๋กฌํ”„ํŒ…์˜ ์˜ค๋ถ„๋ฅ˜ ์ƒ˜ํ”Œ์—์„œ CoT ์˜ˆ์ œ ์„ ํƒ
  • ๊ท ํ˜• ์žกํžŒ ๋Œ€ํ‘œ์„ฑ: ํŽธ๊ฒฌ ์žˆ์Œ ๋ฐ ํŽธ๊ฒฌ ์—†์Œ ์ƒ˜ํ”Œ์˜ ๋™๋“ฑํ•œ ํ‘œํ˜„ ๋ณด์žฅ
  • ์‹œ๋“œ ๊ณ ์ •: ๊ณ ์ • ์‹œ๋“œ ๊ฐ’(42)์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹คํ—˜ ์žฌํ˜„์„ฑ ๋ณด์žฅ

3. ์„ธ ๊ฐ€์ง€ ํ”„๋กฌํ”„ํŒ… ์ „๋žต ๋น„๊ต

  1. ์˜์  ์ƒท ํ”„๋กฌํ”„ํŒ…: ์ง์ ‘ ์ž‘์—… ์„ค๋ช…, ์˜ˆ์ œ ์—†์Œ
  2. ์†Œ์ˆ˜ ์ƒท ํ”„๋กฌํ”„ํŒ…: ๋ฌด์ž‘์œ„๋กœ ์„ ํƒ๋œ 8๊ฐœ์˜ ๊ท ํ˜• ์žกํžŒ ์˜ˆ์ œ
  3. CoT ํ”„๋กฌํ”„ํŒ…: 2๊ฐœ์˜ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ํƒ๋œ ์–ด๋ ค์šด ์ƒ˜ํ”Œ + ์ƒ์„ธํ•œ ์ถ”๋ก  ๋‹จ๊ณ„

์‹คํ—˜ ์„ค์ •

๋ฐ์ดํ„ฐ์…‹

  • ๋ฐ์ดํ„ฐ ์ถœ์ฒ˜: Media Bias Identification Benchmark (MBIB) ์ •์น˜์  ํŽธ๊ฒฌ ๋ถ€๋ถ„์ง‘ํ•ฉ
  • ๋ฐ์ดํ„ฐ ๊ทœ๋ชจ: 17,704๊ฐœ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ
  • ํด๋ž˜์Šค ๋ถ„ํฌ: ๊ท ํ˜• ์žกํžŒ ๋ฐ์ดํ„ฐ์…‹ (8,852๊ฐœ ํŽธ๊ฒฌ ์—†์Œ + 8,852๊ฐœ ํŽธ๊ฒฌ ์žˆ์Œ)
  • ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ: ์‹œ๋“œ 42๋ฅผ ์‚ฌ์šฉํ•œ ๋ฌด์ž‘์œ„ ์…”ํ”Œ, 18๊ฐœ์˜ ๋™์ผ ํฌ๊ธฐ ์ฒญํฌ๋กœ ๋ถ„ํ•  (์ฒญํฌ๋‹น ์•ฝ 1,000๊ฐœ ๋ฌธ์žฅ)

ํ‰๊ฐ€ ์ง€ํ‘œ

  • ์ฃผ์š” ์ง€ํ‘œ: Macro-F1 ์ ์ˆ˜
  • ํ‰๊ฐ€ ๋ฐฉ์‹: 18๊ฐœ ๋ฐ์ดํ„ฐ ์ฒญํฌ์—์„œ ๊ฐ๊ฐ ํ‰๊ฐ€, ํ‰๊ท  ์„ฑ๋Šฅ ๊ณ„์‚ฐ

๋น„๊ต ๋ฐฉ๋ฒ•

  1. ์˜์  ์ƒท ํ”„๋กฌํ”„ํŒ… (Zero-shot prompting)
  2. ์†Œ์ˆ˜ ์ƒท ํ”„๋กฌํ”„ํŒ… (Few-shot prompting)
  3. Chain-of-Thought ํ”„๋กฌํ”„ํŒ… (CoT prompting)
  4. ๊ธฐ์ค€ ๋ชจ๋ธ: ConvBERT (๊ฐ๋… ํ•™์Šต ์ตœ๊ณ  ๊ธฐ์ค€์„ , Macro-F1: 0.7110)

๊ตฌํ˜„ ์„ธ๋ถ€์‚ฌํ•ญ

  • API ํ”Œ๋žซํผ: Groq
  • ํ†ตํ•ฉ ๋„๊ตฌ: Langchain-groq
  • ์˜จ๋„ ๋งค๊ฐœ๋ณ€์ˆ˜: 0.0
  • ์‹œ๋“œ ์„ค์ •: 42 (์žฌํ˜„์„ฑ ๋ณด์žฅ)
  • ๋ฐ์ดํ„ฐ ์ฒญํฌ ํฌ๊ธฐ: ~1,000๊ฐœ ๋ฌธ์žฅ/์ฒญํฌ

์‹คํ—˜ ๊ฒฐ๊ณผ

์ฃผ์š” ๊ฒฐ๊ณผ

๋ฐฉ๋ฒ•ํ‰๊ท  Macro-F1ConvBERT์™€์˜ ๋น„๊ต
Chain-of-Thought0.7061๋™๋“ฑ (0.7110)
Zero-shot0.68833.2% ๋‚ฎ์Œ
Few-shot0.67495.1% ๋‚ฎ์Œ

์ฒญํฌ๋ณ„ ์„ฑ๋Šฅ ๋ถ„์„

CoT ํ”„๋กฌํ”„ํŒ…์€ 18๊ฐœ ๋ฐ์ดํ„ฐ ์ฒญํฌ ์ค‘ 16๊ฐœ ์ฒญํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ํŠนํžˆ ์ฒญํฌ 4, 5, 6, 7, 8, 9, 11์—์„œ ํ˜„์ €ํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

์ฃผ์š” ๋ฐœ๊ฒฌ

  1. CoT ์šฐ์œ„ ๋ช…ํ™•: CoT ํ”„๋กฌํ”„ํŒ…์€ ๋Œ€๋ถ€๋ถ„์˜ ๋ฐ์ดํ„ฐ ์ฒญํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ ํ‰๊ท  ์„ฑ๋Šฅ์ด ๊ฐ€์žฅ ๋†’์Šต๋‹ˆ๋‹ค
  2. ์˜์  ์ƒท์ด ์†Œ์ˆ˜ ์ƒท ์ดˆ๊ณผ: ์˜์  ์ƒท ํ”„๋กฌํ”„ํŒ…์ด ์˜ˆ์ƒ์™ธ๋กœ ์†Œ์ˆ˜ ์ƒท ํ”„๋กฌํ”„ํŒ…์„ ๋Šฅ๊ฐ€ํ–ˆ์œผ๋ฉฐ, ์ด๋Š” ์˜ˆ์ œ ์„ ํƒ ํŽธํ–ฅ ๋•Œ๋ฌธ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค
  3. ๊ฐ๋… ๋ชจ๋ธ๊ณผ ๋™๋“ฑ: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•๋งŒ์œผ๋กœ ์™„์ „ ๊ฐ๋… ๋ฏธ์„ธ์กฐ์ • ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค
  4. ์ผ๊ด€์„ฑ ์šฐ์ˆ˜: ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŒ… ๋ฐฉ๋ฒ• ๊ฐ„ ์ฒญํฌ๋ณ„ ์„ฑ๋Šฅ ์ฐจ์ด๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ์ผ๊ด€์„ฑ ์žˆ์Šต๋‹ˆ๋‹ค

๋ฐฉ๋ฒ• ํ–‰๋™ ๋ถ„์„

  • ์†Œ์ˆ˜ ์ƒท ํ•œ๊ณ„: ์˜ˆ์ œ ์„ ํƒ์— ์‹ฌ๊ฐํ•˜๊ฒŒ ์˜์กดํ•˜๋ฉฐ, ๋ชจ๋ธ์„ ์˜ค๋„ํ•˜๊ฑฐ๋‚˜ ์‹ฌ์ธต ์ถ”๋ก ์ด ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค
  • ์ง€์‹œ์‚ฌํ•ญ ์ค€์ˆ˜: ์†Œ์ˆ˜ ์ƒท ํ”„๋กฌํ”„ํŒ…์€ ์‚ฌ์šฉ์ž ์ง€์‹œ์‚ฌํ•ญ์„ ์—„๊ฒฉํ•˜๊ฒŒ ์ค€์ˆ˜ํ•˜๋Š” ์ธก๋ฉด์—์„œ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค
  • ์ถœ๋ ฅ ํ˜•์‹: CoT ๋ฐฉ๋ฒ•์€ ๋ช…์‹œ์  ์ง€์‹œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ฐ€๋” ์„ค๋ช…์  ์ถœ๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค

๊ด€๋ จ ์—ฐ๊ตฌ

์ฃผ์š” ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

  1. ํ”„๋กฌํ”„ํŒ… ๋ฏธ์„ธ์กฐ์ • ๋ฐฉ๋ฒ•: Unified Prompt Tuning (UPT) ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ž‘์—… ๊ฐ„ ๊ณต๋™ ํ”„๋กฌํ”„ํŒ… ํ•™์Šต์„ ํ†ตํ•ด ์†Œ์ˆ˜ ์ƒท ํ…์ŠคํŠธ ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค
  2. ๋ฏธ๋””์–ด ํŽธ๊ฒฌ ๊ฐ์ง€: ๊ธฐ์กด ์—ฐ๊ตฌ๋Š” MBIB ๋ฒค์น˜๋งˆํฌ์—์„œ ChatGPT์™€ ๋ฏธ์„ธ์กฐ์ • ๋ชจ๋ธ(BART, ConvBERT, GPT-2)์„ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค
  3. ๋งฅ๋ฝ ๋‚ด ํ•™์Šต ๊ฐœ์„ : ์ž‘์—… ์ˆ˜์ค€ ์‚ฌ๊ณ  ๋‹จ๊ณ„ ๋ฐ ์ ์ง„์  ์ˆ˜์ • ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์‹œ์—ฐ ๋ถ„ํฌ๋กœ ์ธํ•œ ํŽธํ–ฅ์„ ์™„ํ™”ํ•ฉ๋‹ˆ๋‹ค

๋ณธ ๋…ผ๋ฌธ์˜ ์žฅ์ 

  1. ์ •์น˜์  ํŽธ๊ฒฌ ์ง‘์ค‘: ํŠน์ •ํ•˜๊ณ  ์ค‘์š”ํ•œ ํŽธ๊ฒฌ ์œ ํ˜•์ธ ์ •์น˜์  ํŽธ๊ฒฌ์— ๋Œ€ํ•œ ์‹ฌ์ธต ์—ฐ๊ตฌ
  2. ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ์„ค๊ณ„: ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•˜๋Š” CoT ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ• ์ œ์•ˆ
  3. ์ฒด๊ณ„์  ํ‰๊ฐ€: ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŒ… ์ „๋žต์˜ ํšจ๊ณผ๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ๋น„๊ต
  4. ์‹ค์šฉ์„ฑ: ๋ฏธ์„ธ์กฐ์ • ์—†์ด ๊ฐ๋… ํ•™์Šต ์„ฑ๋Šฅ ๋‹ฌ์„ฑ

๊ฒฐ๋ก  ๋ฐ ๋…ผ์˜

์ฃผ์š” ๊ฒฐ๋ก 

  1. CoT ํ”„๋กฌํ”„ํŒ… ์œ ํšจ์„ฑ: Chain-of-Thought ๊ธฐ๋ฐ˜ ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์€ ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€ ์ž‘์—…์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค
  2. ๊ฐ๋… ํ•™์Šต ๋Œ€์ฒด: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์€ ์ž์› ์ง‘์•ฝ์  ๊ฐ๋… ํ•™์Šต์˜ ํšจ๊ณผ์ ์ธ ๋Œ€์ฒด ๋ฐฉ์•ˆ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค
  3. ์ถ”๋ก ์˜ ์ค‘์š”์„ฑ: ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ๋‹จ๊ณ„๋Š” ์ •์น˜์  ํŽธ๊ฒฌ ์ดํ•ด ๋ฐ ๊ฐ์ง€์— ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค
  4. ์‹ค์ œ ์‘์šฉ ์ž ์žฌ๋ ฅ: ์ด ๋ฐฉ๋ฒ•์€ ํ—ˆ์œ„ ์ •๋ณด ๋ฐ ์–‘๊ทนํ™” ํ™•์‚ฐ์„ ์™„ํ™”ํ•˜๋Š” ๋„๊ตฌ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๊ฒฝ๋กœ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค

ํ•œ๊ณ„

  1. ์ฃผ๊ด€์„ฑ ๋„์ „: ์ •์น˜์  ํŽธ๊ฒฌ์˜ ์ฃผ๊ด€์  ํŠน์„ฑ์€ ์—ฌ์ „ํžˆ ๊ทผ๋ณธ์ ์ธ ๋„์ „์ž…๋‹ˆ๋‹ค
  2. ๋งฅ๋ฝ ์˜์กด์„ฑ: ๋ฐฉ๋ฒ•์˜ ํšจ๊ณผ๋Š” ์˜ˆ์ œ ์„ ํƒ ๋ฐ ํ”„๋กฌํ”„ํŒ… ์„ค๊ณ„์— ํฌ๊ฒŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค
  3. ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ: ๋‹ค์–‘ํ•œ ์ •์น˜ ํ™˜๊ฒฝ ๋ฐ ๋ฌธํ™”์  ๋ฐฐ๊ฒฝ์—์„œ์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์€ ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค
  4. ์ถœ๋ ฅ ์ œ์–ด: CoT ๋ฐฉ๋ฒ•์€ ์ถœ๋ ฅ ํ˜•์‹ ์ง€์‹œ์‚ฌํ•ญ์„ ์—„๊ฒฉํ•˜๊ฒŒ ์ค€์ˆ˜ํ•˜๋Š” ์ธก๋ฉด์—์„œ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค

ํ–ฅํ›„ ๋ฐฉํ–ฅ

  1. ํ‘œ์ค€ํ™” ๊ธฐ๋ฒ• ๊ฐœ๋ฐœ: ์ด ๋ถ„์•ผ์˜ ํ‘œ์ค€ํ™”๋œ ๊ฐ์ง€ ๊ธฐ๋ฒ• ๊ตฌ์ถ•์„ ์œ„ํ•œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ ํ•„์š”
  2. ๋‹ค์ค‘ ์š”์†Œ ๋ถ„์„: ๋‰ด์Šค ๋ณด๋„ ์ถœ์ฒ˜, ์‚ฌ์‹ค ์„ ํƒ, ๋งฅ๋ฝ ์ƒ๋žต ๋“ฑ ๋‹ค์–‘ํ•œ ์š”์†Œ ๊ณ ๋ ค
  3. ๊ต์ฐจ ์˜์—ญ ์‘์šฉ: ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฅธ ์œ ํ˜•์˜ ํŽธ๊ฒฌ ๊ฐ์ง€ ์ž‘์—…์œผ๋กœ ํ™•์žฅ
  4. ์‹ค์‹œ๊ฐ„ ์‘์šฉ: ์‹ค์ œ ์‘์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์œ„ํ•œ ์‹ค์‹œ๊ฐ„ ํŽธ๊ฒฌ ๊ฐ์ง€ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ

์‹ฌ์ธต ํ‰๊ฐ€

์žฅ์ 

  1. ๋ฐฉ๋ฒ• ํ˜์‹ ์„ฑ: Chain-of-Thought ์ถ”๋ก ์„ ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€์™€ ๊ฒฐํ•ฉํ•˜์—ฌ ์ƒˆ๋กญ๊ณ  ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ• ์ œ์•ˆ
  2. ์‹คํ—˜ ์ถฉ๋ถ„์„ฑ: ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŒ… ์ „๋žต์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋น„๊ตํ•˜๋ฉฐ 18๊ฐœ ๋ฐ์ดํ„ฐ ์ฒญํฌ๋ฅผ ์‚ฌ์šฉํ•œ ํฌ๊ด„์  ํ‰๊ฐ€
  3. ๊ฒฐ๊ณผ ์„ค๋“๋ ฅ: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•๋งŒ์œผ๋กœ ๊ฐ๋… ํ•™์Šต๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ, ๋ฐฉ๋ฒ•์˜ ์œ ํšจ์„ฑ ์ž…์ฆ
  4. ์žฌํ˜„์„ฑ: ์ƒ์„ธํ•œ ์‹คํ—˜ ์„ค์ • ๋ฐ ๊ณต๊ฐœ ์ฝ”๋“œ ๋ฐ์ดํ„ฐ์…‹ ์ œ๊ณต
  5. ์‹ค์šฉ ๊ฐ€์น˜: ์ž์›์ด ์ œํ•œ๋œ ํ™˜๊ฒฝ์—์„œ ํŽธ๊ฒฌ ๊ฐ์ง€๋ฅผ ์œ„ํ•œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜ ์ œ๊ณต

๋ถ€์กฑํ•œ ์ 

  1. ์ด๋ก ์  ๋ถ„์„ ๋ถ€์กฑ: CoT ํ”„๋กฌํ”„ํŒ…์ด ํšจ๊ณผ์ ์ธ ์ด์œ ์— ๋Œ€ํ•œ ์‹ฌ์ธต ์ด๋ก ์  ์„ค๋ช… ๋ถ€์žฌ
  2. ์˜ˆ์ œ ์„ ํƒ ์ฃผ๊ด€์„ฑ: CoT ์˜ˆ์ œ ์„ ํƒ ๊ณผ์ •์ด ์ƒ๋Œ€์ ์œผ๋กœ ์ฃผ๊ด€์ ์ด๋ฉฐ ๊ฒฐ๊ณผ์˜ ์ผ๋ฐ˜์„ฑ์— ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค
  3. ํ‰๊ฐ€ ํ•œ๊ณ„: ๋‹จ์ผ ๋ฐ์ดํ„ฐ์…‹์—์„œ๋งŒ ํ‰๊ฐ€๋˜์—ˆ์œผ๋ฉฐ ๊ต์ฐจ ๋ฐ์ดํ„ฐ์…‹ ๊ฒ€์ฆ ๋ถ€์กฑ
  4. ์˜ค๋ฅ˜ ๋ถ„์„ ๋ถ€์กฑ: ๋ชจ๋ธ ์‹คํŒจ ์‚ฌ๋ก€์— ๋Œ€ํ•œ ์‹ฌ์ธต ๋ถ„์„ ๋ถ€์žฌ
  5. ๊ณ„์‚ฐ ๋น„์šฉ: 70B ๋งค๊ฐœ๋ณ€์ˆ˜ ๋ชจ๋ธ ์‚ฌ์šฉ์˜ ๊ณ„์‚ฐ ๋น„์šฉ ๋ฐ ํšจ์œจ์„ฑ ๋ฌธ์ œ ๋ฏธ๋…ผ์˜

์˜ํ–ฅ๋ ฅ

  1. ํ•™์ˆ  ๊ธฐ์—ฌ: ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€ ๋ถ„์•ผ์— ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ์‚ฌ๊ณ  ๋ฐ ๋ฐฉ๋ฒ• ์ œ๊ณต
  2. ์‹ค์šฉ ๊ฐ€์น˜: ๋ฐฉ๋ฒ•์ด ๊ฐ„๋‹จํ•˜๊ณ  ํšจ๊ณผ์ ์ด๋ฉฐ ์‹ค์ œ ์‘์šฉ์— ์‰ฝ๊ฒŒ ๋ฐฐํฌ ๊ฐ€๋Šฅ
  3. ํ™•์žฅ์„ฑ: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ• ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹ค๋ฅธ ํŽธ๊ฒฌ ๊ฐ์ง€ ์ž‘์—…์œผ๋กœ ํ™•์žฅ ๊ฐ€๋Šฅ
  4. ์‚ฌํšŒ์  ์˜์˜: ํ—ˆ์œ„ ์ •๋ณด ํ™•์‚ฐ ์™„ํ™” ๋„๊ตฌ ๊ฐœ๋ฐœ์— ๊ธฐ์—ฌ

์ ์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค

  1. ๋ฏธ๋””์–ด ๋ชจ๋‹ˆํ„ฐ๋ง: ๋‰ด์Šค ๊ธฐ๊ด€ ๋ฐ ๋ฏธ๋””์–ด ๊ทœ์ œ ๋ถ€์„œ์˜ ํŽธ๊ฒฌ ๊ฐ์ง€
  2. ์†Œ์…œ ํ”Œ๋žซํผ: ์†Œ์…œ ๋ฏธ๋””์–ด ํ”Œ๋žซํผ์˜ ์ฝ˜ํ…์ธ  ๊ฒ€ํ†  ๋ฐ ํŽธ๊ฒฌ ์‹๋ณ„
  3. ๊ต์œก ์‘์šฉ: ๋ฏธ๋””์–ด ๋ฌธํ•ด๋ ฅ ๊ต์œก์—์„œ์˜ ํŽธ๊ฒฌ ์‹๋ณ„ ํ›ˆ๋ จ
  4. ์—ฐ๊ตฌ ๋„๊ตฌ: ์ •์น˜ํ•™ ๋ฐ ์ปค๋ฎค๋‹ˆ์ผ€์ด์…˜ ์—ฐ๊ตฌ์˜ ํ…์ŠคํŠธ ๋ถ„์„ ๋„๊ตฌ
  5. ์ž์› ์ œํ•œ ํ™˜๊ฒฝ: ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ •์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์—†๋Š” ์‘์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค

์ฐธ๊ณ ๋ฌธํ—Œ

๋…ผ๋ฌธ์€ ๋‹ค์Œ์„ ํฌํ•จํ•œ ์—ฌ๋Ÿฌ ์ค‘์š”ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ๋ฅผ ์ธ์šฉํ•ฉ๋‹ˆ๋‹ค:

  • Wei et al. (2022): Chain-of-Thought Prompting์˜ ์›๋ณธ ์—ฐ๊ตฌ
  • Wessel et al. (2023): MBIB ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹
  • Brown et al. (2020): ์†Œ์ˆ˜ ์ƒท ํ•™์Šต์˜ ๊ธฐ์ดˆ ์—ฐ๊ตฌ
  • Entman (2007): ์ •์น˜์  ํŽธ๊ฒฌ ์ด๋ก  ๊ธฐ์ดˆ

์ข…ํ•ฉ ํ‰๊ฐ€: ์ด๋Š” ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€ ๋ถ„์•ผ์—์„œ ์‹ค์šฉ์  ๊ฐ€์น˜๋ฅผ ๊ฐ€์ง„ ์—ฐ๊ตฌ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ Chain-of-Thought ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์„ ์ •์น˜์  ํŽธ๊ฒฌ ๊ฐ์ง€์— ์˜๋ฆฌํ•˜๊ฒŒ ์ ์šฉํ•˜์—ฌ ๋ชจ๋ธ ๋ฏธ์„ธ์กฐ์ • ์—†์ด ๊ฐ๋… ํ•™์Šต๊ณผ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ก ์  ๋ถ„์„ ๋ฐ ํ‰๊ฐ€ ํฌ๊ด„์„ฑ ์ธก๋ฉด์—์„œ ๋ถ€์กฑํ•œ ์ ์ด ์žˆ์ง€๋งŒ, ๋ฐฉ๋ฒ•์˜ ๋‹จ์ˆœ์„ฑ๊ณผ ํšจ๊ณผ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์‹ค์ œ ์‘์šฉ ์ž ์žฌ๋ ฅ์€ ์ด๋ฅผ ํ•ด๋‹น ๋ถ„์•ผ์˜ ๊ฐ€์น˜ ์žˆ๋Š” ๊ธฐ์—ฌ๋กœ ๋งŒ๋“ญ๋‹ˆ๋‹ค.