The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
본 논문은 대규모 언어 모델(LLM)에서 호기심의 문화 간 표현을 연구합니다. 저자들은 Yahoo! Answers 다국가 데이터셋을 사용하여 CUEST(CUriosity Evaluation across SocieTies) 평가 프레임워크를 제안하며, 언어 스타일, 주제 선호도 및 사회과학 이론을 통해 인간과 모델의 호기심 표현 일치도를 측정합니다. 연구 결과 LLM은 문화 간 차이를 평탄화하며 서방 국가의 호기심 표현 방식을 선호하는 경향을 보입니다. 미세 조정 전략을 통해 저자들은 인간-모델 정렬 격차를 50% 축소했으며, 호기심이 LLM의 문화 간 적응성에 미치는 실용적 가치를 입증했습니다.
호기심은 인간의 학습과 탐구의 핵심 동력이며, 서로 다른 문화에서 다양한 형태로 나타납니다. LLM이 인간-컴퓨터 상호작용에서의 역할이 확대됨에 따라, 호기심 표현 능력은 사용자 경험에 영향을 미치는 중요한 요소가 됩니다. 그러나 기존 연구는 주로 LLM의 답변 능력에 초점을 맞추고 있으며, 특히 문화 간 맥락에서 질문 제기 및 호기심 표현 능력을 간과하고 있습니다.
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
평가 요약: 이는 LLM의 문화 간 호기심 문제를 처음으로 체계적으로 탐구한 개척적 연구입니다. CUEST 프레임워크는 합리적으로 설계되었으며, 실험 설정은 포괄적이고, 결과는 중요한 이론적 및 실무적 의미를 갖습니다. 데이터 범위 및 평가 주관성 등의 한계가 있음에도 불구하고, 문화 간 NLP 연구에 새로운 방향을 개척했으며 상당한 학술적 가치와 응용 잠재력을 갖습니다.