This study investigates the several nuanced rationales for countering the rise of political bias. We evaluate the performance of the Llama-3 (70B) language model on the Media Bias Identification Benchmark (MBIB), based on a novel prompting technique that incorporates subtle reasons for identifying political leaning. Our findings underscore the challenges of detecting political bias and highlight the potential of transfer learning methods to enhance future models. Through our framework, we achieve a comparable performance with the supervised and fully fine-tuned ConvBERT model, which is the state-of-the-art model, performing best among other baseline models for the political bias task on MBIB. By demonstrating the effectiveness of our approach, we contribute to the development of more robust tools for mitigating the spread of misinformation and polarization. Our codes and dataset are made publicly available in github.
- ๋
ผ๋ฌธ ID: 2501.00782
- ์ ๋ชฉ: Navigating Nuance: In Quest for Political Truth
- ์ ์: Soumyadeep Sar (Indian Institute of Science Education and Research Kolkata), Dwaipayan Roy (Indian Institute of Science Education and Research Kolkata)
- ๋ถ๋ฅ: cs.CL cs.IR
- ๋ฐํ ์๊ฐ/ํํ: JCDL '24 (2024 ACM/IEEE Joint Conference on Digital Libraries), 2024๋
12์ 16-20์ผ, ํ์ฝฉ, ์ค๊ตญ
- ๋
ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2501.00782
๋ณธ ์ฐ๊ตฌ๋ ์ ์น์ ํธ๊ฒฌ ์์น์ ๋ํญํ๋ ๋ค์ํ ๋ฏธ๋ฌํ ์ด์ ๋ค์ ํ๊ตฌํฉ๋๋ค. ์ ์๋ค์ ๋ฏธ๋์ด ํธ๊ฒฌ ์๋ณ ๋ฒค์น๋งํฌ(MBIB)์์ Llama-3(70B) ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ์ผ๋ฉฐ, ์ ์น์ ์ฑํฅ์ ๋ฏธ๋ฌํ ์์ธ์ ์๋ณํ๋ ์๋ก์ด ํ๋กฌํํ
๊ธฐ๋ฒ์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค. ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง์ ๋์ ์ฑ์ ๊ฐ์กฐํ์ผ๋ฉฐ, ์ ์ด ํ์ต ๋ฐฉ๋ฒ์ด ํฅํ ๋ชจ๋ธ ๊ฐ์ ์ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์์ ๋ถ๊ฐํ์ต๋๋ค. ์ด ํ๋ ์์ํฌ๋ฅผ ํตํด ์ ์๋ค์ ๊ฐ๋
ํ์ต ๋ฐ ์์ ๋ฏธ์ธ์กฐ์ ๋ ConvBERT ๋ชจ๋ธ๊ณผ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ์ด๋ MBIB ์ ์น์ ํธ๊ฒฌ ์์
์์ ์ต๊ณ ์ฑ๋ฅ์ ์ต์ฒจ๋จ ๋ชจ๋ธ์
๋๋ค. ๋ฐฉ๋ฒ์ ์ ํจ์ฑ์ ์
์ฆํจ์ผ๋ก์จ ๋ณธ ์ฐ๊ตฌ๋ ํ์ ์ ๋ณด ๋ฐ ์๊ทนํ ํ์ฐ์ ์ํํ๊ธฐ ์ํ ๋์ฑ ๊ฐ๋ ฅํ ๋๊ตฌ ๊ฐ๋ฐ์ ๊ธฐ์ฌํฉ๋๋ค.
์ ์น์ ํธ๊ฒฌ ๊ฐ์ง๋ ์์ฐ์ด ์ฒ๋ฆฌ(NLP) ๋ถ์ผ์ ํต์ฌ ์ฐ๊ตฌ ์์ญ์ด ๋์์ต๋๋ค. ์ด๋ ๋ฏธ๋์ด ๋ฌธํด๋ ฅ, ์ฌ๋ก ํ์ฑ, ๋ฏผ์ฃผ์ฃผ์ ๊ณผ์ ์ ์ค๋ํ ์ํฅ์ ๋ฏธ์น๊ธฐ ๋๋ฌธ์
๋๋ค. ๋ฏธ๋์ด ๋ฐ ์จ๋ผ์ธ ์ฝํ
์ธ ์์ ์ ์น์ ํธ๊ฒฌ์ ๊ด๋ฒ์ํ ํ์ฐ์ ๊ฐ๋ ฅํ ์๋ณ ๋ฐ ๋ถ์ ๋ฐฉ๋ฒ ๊ตฌ์ถ์ ์๊ตฌํฉ๋๋ค.
- ์ฌํ์ ์ํฅ: ์ ์น์ ํธ๊ฒฌ์ ์ดํ ์ ํ, ์ด์ ํ๋ ์ด๋ฐ, ์ ํ์ ์ ๋ณด ์๋ต ๋ฑ ๋ค์ํ ํํ๋ก ๋ํ๋๋ฉฐ, ๋
์์ ์ธ์๊ณผ ์ ๋
์ ๋ฏธ๋ฌํ๊ฒ ์ํฅ์ ๋ฏธ์นฉ๋๋ค
- ๊ธฐ์ ์ ๋์ : ์ ์น์ ํธ๊ฒฌ์ ์ฃผ๊ด์ ํน์ฑ๊ณผ ์ ์น ๋ด๋ก ์ ๋์ ์งํ๋ ์์
์ ๋ณต์ก์ฑ์ ์ฆ๊ฐ์ํต๋๋ค
- ์ค์ ํ์์ฑ: ์์
๋ฏธ๋์ด ์๋์๋ ํธ๊ฒฌ ํ์ฐ์ ์๋ณํ๊ณ ์ํํ๊ธฐ ์ํ ์๋ํ ๋๊ตฌ๊ฐ ํ์ํฉ๋๋ค
- ์ ํต์ ๋ฐฉ๋ฒ: ์ฌ์ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ๋ฏธ๋ฆฌ ์ ์๋ ํธ๊ฒฌ ์ฉ์ด ๋ฐ ๊ตฌ๋ฌธ ๋ชฉ๋ก์ ์์กดํ๋ฉฐ, ์ ์น์ ํธ๊ฒฌ์ ๋ฏธ๋ฌํ๊ณ ์ํฉ ์์กด์ ํน์ฑ์ ์ฒ๋ฆฌํ๊ธฐ ์ด๋ ต์ต๋๋ค
- ์ฌ์ธต ํ์ต ๋ฐฉ๋ฒ: ๋์ฑ ๋ฏธ๋ฌํ ํธ๊ฒฌ ํํ๋ฅผ ํฌ์ฐฉํ ์ ์์ง๋ง, ๋ค์ํ ๋ฐ์ดํฐ์
๋ฐ ์ ์น ํ๊ฒฝ์์ ๋์ ์ ํ๋์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ์ฌ์ ํ ์ด๋ ค์์ ๊ฒช๊ณ ์์ต๋๋ค
- ์์ ์ง์ฝ์ : ๋๊ท๋ชจ ๋ชจ๋ธ ํ๋ จ์๋ ๋ง๋ํ ๊ณ์ฐ ์์๊ณผ ์ฃผ์ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ถํ์ผ๋ก ๊ทน๋๋ก ํฐ ๊ท๋ชจ์ ๋ชจ๋ธ ํ๋ จ์ด ์์ ์ง์ฝ์ ์ด ๋์์ต๋๋ค. ๋ฐ๋ผ์ ๋งฅ๋ฝ ๋ด ํ์ต ๊ธฐ๋ฒ์ ์ ์ ํ ๋งฅ๋ฝ ์์ ๋ฐ ์ง์์ฌํญ์ ํตํด ๋ชจ๋ธ์ ์์
์ ์ํํ๋๋ก ๊ฐ๋ฅด์น๋ ์ฐ์ํ ์๋จ์ด ๋์์ต๋๋ค.
- Chain-of-Thought(CoT) ๊ธฐ๋ฐ์ ์๋ก์ด ํ๋กฌํํ
๊ธฐ๋ฒ ์ ์: ์ ์น์ ํธ๊ฒฌ ์๋ณ์ ๋ฏธ๋ฌํ ์ถ๋ก ๋จ๊ณ๋ฅผ ํตํฉํฉ๋๋ค
- ๊ฐ๋
ํ์ต ๋ชจ๋ธ๊ณผ ๋๋ฑํ ์ฑ๋ฅ ๋ฌ์ฑ: ํ๋กฌํํ
๊ธฐ๋ฒ๋ง์ผ๋ก ์์ ๊ฐ๋
๋ฏธ์ธ์กฐ์ ๋ ConvBERT ๋ชจ๋ธ๊ณผ ๋๋ฑํ ํจ๊ณผ๋ฅผ ๋ฌ์ฑํ์ต๋๋ค
- ๋ค์ํ ํ๋กฌํํ
์ ๋ต์ ์ฒด๊ณ์ ํ๊ฐ: ์์ ์ท, ์์ ์ท, CoT ํ๋กฌํํ
์ ํฌํจํ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง ์์
์์์ ์ฑ๋ฅ ๋น๊ต
- ์ฌํ ๊ฐ๋ฅํ ์คํ ์ค์ ์ ๊ณต: ์ฝ๋ ๋ฐ ๋ฐ์ดํฐ์
์ด ๊ณต๊ฐ๋์์ต๋๋ค
- ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง ๋ณต์ก์ฑ์ ์ฌ์ธต ๋ถ์: ์ด ๋ถ์ผ์ ํ์คํ๋ ๊ธฐ๋ฒ ๊ฐ๋ฐ์ ๋ํ ํต์ฐฐ๋ ฅ์ ์ ๊ณตํฉ๋๋ค
์
๋ ฅ: ํ
์คํธ ๋ฌธ์ฅ
์ถ๋ ฅ: ์ด์ง ๋ถ๋ฅ ๋ ์ด๋ธ (0: ํธ๊ฒฌ ์์, 1: ์ ์น์ ํธ๊ฒฌ ์์)
์ ์ฝ ์กฐ๊ฑด: ๋งฅ๋ฝ ๋ด ํ์ต๋ง ์ฌ์ฉ, ๋ชจ๋ธ ๋ฏธ์ธ์กฐ์ ์์
์ฐ๊ตฌ๋ ์คํ์์ค ๋ชจ๋ธ Llama-3-70B๋ฅผ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ก ์ฌ์ฉํ๋ฉฐ, Groq ํ๋ซํผ์ API ์๋น์ค๋ฅผ ํตํด ์ถ๋ก ์ ์ํํฉ๋๋ค. ๊ตฌ์ฒด์ ์ธ ๊ตฌ์ฑ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๊ธฐ๋ณธ ๋ชจ๋ธ: Meta์ Llama-3-70B-Instruct
- ์จ๋ ์ค์ : 0.0 (ํ๊ฐ ๋ฐ ์ง์์ฌํญ ์ดํ ๋ฐฉ์ง)
- ์ถ๋ก ํ๋ซํผ: Groq API + Langchain-groq ํตํฉ
- ๊ธฐํ ๋งค๊ฐ๋ณ์: ๊ธฐ๋ณธ ์ค์
์ ์๋ค์ ๋ฏธ๋ฌํ ์ถ๋ก ๋จ๊ณ๋ฅผ ํฌํจํ๋ CoT ํ๋กฌํํธ๋ฅผ ์ค๊ณํ์ผ๋ฉฐ, ๋ค์์ ํฌํจํฉ๋๋ค:
- ์ฌ์ค ๋ณด๋ ๋ถ์: ํ
์คํธ์ ๊ฐ๊ด์ฑ ํ๊ฐ
- ์ธ์ด ์ค๋ฆฝ์ฑ ๊ฒ์ฌ: ๊ฐ์ ์ ๋๋ ์ ๋์ ์ด์กฐ ์๋ณ
- ํธ๊ฒฌ ๊ฐ์ง: ์๋ฌต์ ๋๋ ๋ช
์์ ํธ๊ฒฌ ํ์
- ๋งฅ๋ฝ ์๋ต ๋ถ์: ์ค๋ํ๋ ์ ๋ณด ์๋ต ์ฌ๋ถ ํ์ธ
- ์ฐ๊ด์ฑ ์์ ์๋ณ: ์ฐ๊ด์ ํตํด ์์ฑ๋ ํธ๊ฒฌ ๋ฐ๊ฒฌ
- ์ด๋ ค์ด ์ํ ์ ํ: ์์ ์ท ํ๋กฌํํ
์ ์ค๋ถ๋ฅ ์ํ์์ CoT ์์ ์ ํ
- ๊ท ํ ์กํ ๋ํ์ฑ: ํธ๊ฒฌ ์์ ๋ฐ ํธ๊ฒฌ ์์ ์ํ์ ๋๋ฑํ ํํ ๋ณด์ฅ
- ์๋ ๊ณ ์ : ๊ณ ์ ์๋ ๊ฐ(42)์ ์ฌ์ฉํ์ฌ ์คํ ์ฌํ์ฑ ๋ณด์ฅ
- ์์ ์ท ํ๋กฌํํ
: ์ง์ ์์
์ค๋ช
, ์์ ์์
- ์์ ์ท ํ๋กฌํํ
: ๋ฌด์์๋ก ์ ํ๋ 8๊ฐ์ ๊ท ํ ์กํ ์์
- CoT ํ๋กฌํํ
: 2๊ฐ์ ์ ์คํ๊ฒ ์ ํ๋ ์ด๋ ค์ด ์ํ + ์์ธํ ์ถ๋ก ๋จ๊ณ
- ๋ฐ์ดํฐ ์ถ์ฒ: Media Bias Identification Benchmark (MBIB) ์ ์น์ ํธ๊ฒฌ ๋ถ๋ถ์งํฉ
- ๋ฐ์ดํฐ ๊ท๋ชจ: 17,704๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ
- ํด๋์ค ๋ถํฌ: ๊ท ํ ์กํ ๋ฐ์ดํฐ์
(8,852๊ฐ ํธ๊ฒฌ ์์ + 8,852๊ฐ ํธ๊ฒฌ ์์)
- ๋ฐ์ดํฐ ์ฒ๋ฆฌ: ์๋ 42๋ฅผ ์ฌ์ฉํ ๋ฌด์์ ์
ํ, 18๊ฐ์ ๋์ผ ํฌ๊ธฐ ์ฒญํฌ๋ก ๋ถํ (์ฒญํฌ๋น ์ฝ 1,000๊ฐ ๋ฌธ์ฅ)
- ์ฃผ์ ์งํ: Macro-F1 ์ ์
- ํ๊ฐ ๋ฐฉ์: 18๊ฐ ๋ฐ์ดํฐ ์ฒญํฌ์์ ๊ฐ๊ฐ ํ๊ฐ, ํ๊ท ์ฑ๋ฅ ๊ณ์ฐ
- ์์ ์ท ํ๋กฌํํ
(Zero-shot prompting)
- ์์ ์ท ํ๋กฌํํ
(Few-shot prompting)
- Chain-of-Thought ํ๋กฌํํ
(CoT prompting)
- ๊ธฐ์ค ๋ชจ๋ธ: ConvBERT (๊ฐ๋
ํ์ต ์ต๊ณ ๊ธฐ์ค์ , Macro-F1: 0.7110)
- API ํ๋ซํผ: Groq
- ํตํฉ ๋๊ตฌ: Langchain-groq
- ์จ๋ ๋งค๊ฐ๋ณ์: 0.0
- ์๋ ์ค์ : 42 (์ฌํ์ฑ ๋ณด์ฅ)
- ๋ฐ์ดํฐ ์ฒญํฌ ํฌ๊ธฐ: ~1,000๊ฐ ๋ฌธ์ฅ/์ฒญํฌ
| ๋ฐฉ๋ฒ | ํ๊ท Macro-F1 | ConvBERT์์ ๋น๊ต |
|---|
| Chain-of-Thought | 0.7061 | ๋๋ฑ (0.7110) |
| Zero-shot | 0.6883 | 3.2% ๋ฎ์ |
| Few-shot | 0.6749 | 5.1% ๋ฎ์ |
CoT ํ๋กฌํํ
์ 18๊ฐ ๋ฐ์ดํฐ ์ฒญํฌ ์ค 16๊ฐ ์ฒญํฌ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ผ๋ฉฐ, ํนํ ์ฒญํฌ 4, 5, 6, 7, 8, 9, 11์์ ํ์ ํ ์ฑ๋ฅ ํฅ์์ ๋ณด์์ต๋๋ค.
- CoT ์ฐ์ ๋ช
ํ: CoT ํ๋กฌํํ
์ ๋๋ถ๋ถ์ ๋ฐ์ดํฐ ์ฒญํฌ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ ํ๊ท ์ฑ๋ฅ์ด ๊ฐ์ฅ ๋์ต๋๋ค
- ์์ ์ท์ด ์์ ์ท ์ด๊ณผ: ์์ ์ท ํ๋กฌํํ
์ด ์์์ธ๋ก ์์ ์ท ํ๋กฌํํ
์ ๋ฅ๊ฐํ์ผ๋ฉฐ, ์ด๋ ์์ ์ ํ ํธํฅ ๋๋ฌธ์ผ ์ ์์ต๋๋ค
- ๊ฐ๋
๋ชจ๋ธ๊ณผ ๋๋ฑ: ํ๋กฌํํ
๊ธฐ๋ฒ๋ง์ผ๋ก ์์ ๊ฐ๋
๋ฏธ์ธ์กฐ์ ๋ชจ๋ธ๊ณผ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค
- ์ผ๊ด์ฑ ์ฐ์: ๋ค์ํ ํ๋กฌํํ
๋ฐฉ๋ฒ ๊ฐ ์ฒญํฌ๋ณ ์ฑ๋ฅ ์ฐจ์ด๊ฐ ์๋์ ์ผ๋ก ์ผ๊ด์ฑ ์์ต๋๋ค
- ์์ ์ท ํ๊ณ: ์์ ์ ํ์ ์ฌ๊ฐํ๊ฒ ์์กดํ๋ฉฐ, ๋ชจ๋ธ์ ์ค๋ํ๊ฑฐ๋ ์ฌ์ธต ์ถ๋ก ์ด ๋ถ์กฑํ ์ ์์ต๋๋ค
- ์ง์์ฌํญ ์ค์: ์์ ์ท ํ๋กฌํํ
์ ์ฌ์ฉ์ ์ง์์ฌํญ์ ์๊ฒฉํ๊ฒ ์ค์ํ๋ ์ธก๋ฉด์์ ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์
๋๋ค
- ์ถ๋ ฅ ํ์: CoT ๋ฐฉ๋ฒ์ ๋ช
์์ ์ง์์๋ ๋ถ๊ตฌํ๊ณ ๊ฐ๋ ์ค๋ช
์ ์ถ๋ ฅ์ ์ ๊ณตํฉ๋๋ค
- ํ๋กฌํํ
๋ฏธ์ธ์กฐ์ ๋ฐฉ๋ฒ: Unified Prompt Tuning (UPT) ํ๋ ์์ํฌ๋ ์์
๊ฐ ๊ณต๋ ํ๋กฌํํ
ํ์ต์ ํตํด ์์ ์ท ํ
์คํธ ๋ถ๋ฅ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค
- ๋ฏธ๋์ด ํธ๊ฒฌ ๊ฐ์ง: ๊ธฐ์กด ์ฐ๊ตฌ๋ MBIB ๋ฒค์น๋งํฌ์์ ChatGPT์ ๋ฏธ์ธ์กฐ์ ๋ชจ๋ธ(BART, ConvBERT, GPT-2)์ ๋น๊ตํฉ๋๋ค
- ๋งฅ๋ฝ ๋ด ํ์ต ๊ฐ์ : ์์
์์ค ์ฌ๊ณ ๋จ๊ณ ๋ฐ ์ ์ง์ ์์ ํ๋ ์์ํฌ๋ ์์ฐ ๋ถํฌ๋ก ์ธํ ํธํฅ์ ์ํํฉ๋๋ค
- ์ ์น์ ํธ๊ฒฌ ์ง์ค: ํน์ ํ๊ณ ์ค์ํ ํธ๊ฒฌ ์ ํ์ธ ์ ์น์ ํธ๊ฒฌ์ ๋ํ ์ฌ์ธต ์ฐ๊ตฌ
- ๋ฏธ๋ฌํ ์ถ๋ก ์ค๊ณ: ๋ฏธ๋ฌํ ์ถ๋ก ๋จ๊ณ๋ฅผ ํฌํจํ๋ CoT ํ๋กฌํํ
๊ธฐ๋ฒ ์ ์
- ์ฒด๊ณ์ ํ๊ฐ: ๋ค์ํ ํ๋กฌํํ
์ ๋ต์ ํจ๊ณผ๋ฅผ ํฌ๊ด์ ์ผ๋ก ๋น๊ต
- ์ค์ฉ์ฑ: ๋ฏธ์ธ์กฐ์ ์์ด ๊ฐ๋
ํ์ต ์ฑ๋ฅ ๋ฌ์ฑ
- CoT ํ๋กฌํํ
์ ํจ์ฑ: Chain-of-Thought ๊ธฐ๋ฐ ํ๋กฌํํ
๊ธฐ๋ฒ์ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง ์์
์์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์์ต๋๋ค
- ๊ฐ๋
ํ์ต ๋์ฒด: ํ๋กฌํํ
๊ธฐ๋ฒ์ ์์ ์ง์ฝ์ ๊ฐ๋
ํ์ต์ ํจ๊ณผ์ ์ธ ๋์ฒด ๋ฐฉ์์ด ๋ ์ ์์ต๋๋ค
- ์ถ๋ก ์ ์ค์์ฑ: ๋ฏธ๋ฌํ ์ถ๋ก ๋จ๊ณ๋ ์ ์น์ ํธ๊ฒฌ ์ดํด ๋ฐ ๊ฐ์ง์ ์ค์ํฉ๋๋ค
- ์ค์ ์์ฉ ์ ์ฌ๋ ฅ: ์ด ๋ฐฉ๋ฒ์ ํ์ ์ ๋ณด ๋ฐ ์๊ทนํ ํ์ฐ์ ์ํํ๋ ๋๊ตฌ ๊ฐ๋ฐ์ ์ํ ์คํ ๊ฐ๋ฅํ ๊ฒฝ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค
- ์ฃผ๊ด์ฑ ๋์ : ์ ์น์ ํธ๊ฒฌ์ ์ฃผ๊ด์ ํน์ฑ์ ์ฌ์ ํ ๊ทผ๋ณธ์ ์ธ ๋์ ์
๋๋ค
- ๋งฅ๋ฝ ์์กด์ฑ: ๋ฐฉ๋ฒ์ ํจ๊ณผ๋ ์์ ์ ํ ๋ฐ ํ๋กฌํํ
์ค๊ณ์ ํฌ๊ฒ ์์กดํฉ๋๋ค
- ์ผ๋ฐํ ๋ฅ๋ ฅ: ๋ค์ํ ์ ์น ํ๊ฒฝ ๋ฐ ๋ฌธํ์ ๋ฐฐ๊ฒฝ์์์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์ถ๊ฐ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค
- ์ถ๋ ฅ ์ ์ด: CoT ๋ฐฉ๋ฒ์ ์ถ๋ ฅ ํ์ ์ง์์ฌํญ์ ์๊ฒฉํ๊ฒ ์ค์ํ๋ ์ธก๋ฉด์์ ๋ถ์กฑํฉ๋๋ค
- ํ์คํ ๊ธฐ๋ฒ ๊ฐ๋ฐ: ์ด ๋ถ์ผ์ ํ์คํ๋ ๊ฐ์ง ๊ธฐ๋ฒ ๊ตฌ์ถ์ ์ํ ์ถ๊ฐ ์ฐ๊ตฌ ํ์
- ๋ค์ค ์์ ๋ถ์: ๋ด์ค ๋ณด๋ ์ถ์ฒ, ์ฌ์ค ์ ํ, ๋งฅ๋ฝ ์๋ต ๋ฑ ๋ค์ํ ์์ ๊ณ ๋ ค
- ๊ต์ฐจ ์์ญ ์์ฉ: ๋ฐฉ๋ฒ์ ๋ค๋ฅธ ์ ํ์ ํธ๊ฒฌ ๊ฐ์ง ์์
์ผ๋ก ํ์ฅ
- ์ค์๊ฐ ์์ฉ: ์ค์ ์์ฉ ์๋๋ฆฌ์ค๋ฅผ ์ํ ์ค์๊ฐ ํธ๊ฒฌ ๊ฐ์ง ์์คํ
๊ฐ๋ฐ
- ๋ฐฉ๋ฒ ํ์ ์ฑ: Chain-of-Thought ์ถ๋ก ์ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง์ ๊ฒฐํฉํ์ฌ ์๋กญ๊ณ ํจ๊ณผ์ ์ธ ํ๋กฌํํ
๊ธฐ๋ฒ ์ ์
- ์คํ ์ถฉ๋ถ์ฑ: ๋ค์ํ ํ๋กฌํํ
์ ๋ต์ ์ฒด๊ณ์ ์ผ๋ก ๋น๊ตํ๋ฉฐ 18๊ฐ ๋ฐ์ดํฐ ์ฒญํฌ๋ฅผ ์ฌ์ฉํ ํฌ๊ด์ ํ๊ฐ
- ๊ฒฐ๊ณผ ์ค๋๋ ฅ: ํ๋กฌํํ
๊ธฐ๋ฒ๋ง์ผ๋ก ๊ฐ๋
ํ์ต๊ณผ ๋๋ฑํ ์ฑ๋ฅ ๋ฌ์ฑ, ๋ฐฉ๋ฒ์ ์ ํจ์ฑ ์
์ฆ
- ์ฌํ์ฑ: ์์ธํ ์คํ ์ค์ ๋ฐ ๊ณต๊ฐ ์ฝ๋ ๋ฐ์ดํฐ์
์ ๊ณต
- ์ค์ฉ ๊ฐ์น: ์์์ด ์ ํ๋ ํ๊ฒฝ์์ ํธ๊ฒฌ ๊ฐ์ง๋ฅผ ์ํ ์คํ ๊ฐ๋ฅํ ์๋ฃจ์
์ ๊ณต
- ์ด๋ก ์ ๋ถ์ ๋ถ์กฑ: CoT ํ๋กฌํํ
์ด ํจ๊ณผ์ ์ธ ์ด์ ์ ๋ํ ์ฌ์ธต ์ด๋ก ์ ์ค๋ช
๋ถ์ฌ
- ์์ ์ ํ ์ฃผ๊ด์ฑ: CoT ์์ ์ ํ ๊ณผ์ ์ด ์๋์ ์ผ๋ก ์ฃผ๊ด์ ์ด๋ฉฐ ๊ฒฐ๊ณผ์ ์ผ๋ฐ์ฑ์ ์ํฅ์ ๋ฏธ์น ์ ์์ต๋๋ค
- ํ๊ฐ ํ๊ณ: ๋จ์ผ ๋ฐ์ดํฐ์
์์๋ง ํ๊ฐ๋์์ผ๋ฉฐ ๊ต์ฐจ ๋ฐ์ดํฐ์
๊ฒ์ฆ ๋ถ์กฑ
- ์ค๋ฅ ๋ถ์ ๋ถ์กฑ: ๋ชจ๋ธ ์คํจ ์ฌ๋ก์ ๋ํ ์ฌ์ธต ๋ถ์ ๋ถ์ฌ
- ๊ณ์ฐ ๋น์ฉ: 70B ๋งค๊ฐ๋ณ์ ๋ชจ๋ธ ์ฌ์ฉ์ ๊ณ์ฐ ๋น์ฉ ๋ฐ ํจ์จ์ฑ ๋ฌธ์ ๋ฏธ๋
ผ์
- ํ์ ๊ธฐ์ฌ: ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง ๋ถ์ผ์ ์๋ก์ด ์ฐ๊ตฌ ์ฌ๊ณ ๋ฐ ๋ฐฉ๋ฒ ์ ๊ณต
- ์ค์ฉ ๊ฐ์น: ๋ฐฉ๋ฒ์ด ๊ฐ๋จํ๊ณ ํจ๊ณผ์ ์ด๋ฉฐ ์ค์ ์์ฉ์ ์ฝ๊ฒ ๋ฐฐํฌ ๊ฐ๋ฅ
- ํ์ฅ์ฑ: ํ๋กฌํํ
๊ธฐ๋ฒ ํ๋ ์์ํฌ๋ ๋ค๋ฅธ ํธ๊ฒฌ ๊ฐ์ง ์์
์ผ๋ก ํ์ฅ ๊ฐ๋ฅ
- ์ฌํ์ ์์: ํ์ ์ ๋ณด ํ์ฐ ์ํ ๋๊ตฌ ๊ฐ๋ฐ์ ๊ธฐ์ฌ
- ๋ฏธ๋์ด ๋ชจ๋ํฐ๋ง: ๋ด์ค ๊ธฐ๊ด ๋ฐ ๋ฏธ๋์ด ๊ท์ ๋ถ์์ ํธ๊ฒฌ ๊ฐ์ง
- ์์
ํ๋ซํผ: ์์
๋ฏธ๋์ด ํ๋ซํผ์ ์ฝํ
์ธ ๊ฒํ ๋ฐ ํธ๊ฒฌ ์๋ณ
- ๊ต์ก ์์ฉ: ๋ฏธ๋์ด ๋ฌธํด๋ ฅ ๊ต์ก์์์ ํธ๊ฒฌ ์๋ณ ํ๋ จ
- ์ฐ๊ตฌ ๋๊ตฌ: ์ ์นํ ๋ฐ ์ปค๋ฎค๋์ผ์ด์
์ฐ๊ตฌ์ ํ
์คํธ ๋ถ์ ๋๊ตฌ
- ์์ ์ ํ ํ๊ฒฝ: ๋๊ท๋ชจ ๋ชจ๋ธ ๋ฏธ์ธ์กฐ์ ์ ์ํํ ์ ์๋ ์์ฉ ์๋๋ฆฌ์ค
๋
ผ๋ฌธ์ ๋ค์์ ํฌํจํ ์ฌ๋ฌ ์ค์ํ ๊ด๋ จ ์ฐ๊ตฌ๋ฅผ ์ธ์ฉํฉ๋๋ค:
- Wei et al. (2022): Chain-of-Thought Prompting์ ์๋ณธ ์ฐ๊ตฌ
- Wessel et al. (2023): MBIB ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
- Brown et al. (2020): ์์ ์ท ํ์ต์ ๊ธฐ์ด ์ฐ๊ตฌ
- Entman (2007): ์ ์น์ ํธ๊ฒฌ ์ด๋ก ๊ธฐ์ด
์ข
ํฉ ํ๊ฐ: ์ด๋ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง ๋ถ์ผ์์ ์ค์ฉ์ ๊ฐ์น๋ฅผ ๊ฐ์ง ์ฐ๊ตฌ ๋
ผ๋ฌธ์
๋๋ค. ์ ์๋ค์ Chain-of-Thought ํ๋กฌํํ
๊ธฐ๋ฒ์ ์ ์น์ ํธ๊ฒฌ ๊ฐ์ง์ ์๋ฆฌํ๊ฒ ์ ์ฉํ์ฌ ๋ชจ๋ธ ๋ฏธ์ธ์กฐ์ ์์ด ๊ฐ๋
ํ์ต๊ณผ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค. ์ด๋ก ์ ๋ถ์ ๋ฐ ํ๊ฐ ํฌ๊ด์ฑ ์ธก๋ฉด์์ ๋ถ์กฑํ ์ ์ด ์์ง๋ง, ๋ฐฉ๋ฒ์ ๋จ์์ฑ๊ณผ ํจ๊ณผ์ฑ, ๊ทธ๋ฆฌ๊ณ ์ค์ ์์ฉ ์ ์ฌ๋ ฅ์ ์ด๋ฅผ ํด๋น ๋ถ์ผ์ ๊ฐ์น ์๋ ๊ธฐ์ฌ๋ก ๋ง๋ญ๋๋ค.