The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic
Любопытный случай любопытства в различных культурах человека и LLM
В данной работе исследуется кросс-культурное проявление любопытства в больших языковых моделях (LLM). Авторы используют многонациональный набор данных Yahoo! Answers и предлагают оценочную базу CUEST (CUriosity Evaluation across SocieTies) для измерения согласованности между человеком и моделью в выражении любопытства через лингвистический стиль, предпочтения тем и теории социальных наук. Исследование показывает, что LLM нивелируют кросс-культурные различия, отдавая предпочтение западным способам выражения любопытства. Посредством стратегий тонкой настройки авторы сокращают разрыв в выравнивании человека и модели на 50% и демонстрируют практическую ценность любопытства для кросс-культурной адаптации LLM.
Любопытство является ключевым движущим фактором обучения и исследования человека, проявляясь по-разному в различных культурах. По мере расширения роли LLM в человеко-машинном взаимодействии их способность выражать любопытство становится важным фактором, влияющим на пользовательский опыт. Однако существующие исследования сосредоточены главным образом на способности LLM отвечать на вопросы, игнорируя их способность задавать вопросы и выражать любопытство, особенно в кросс-культурном контексте.
Предложение базы оценки CUEST: Комплексная система оценки, сочетающая лингвистический анализ, анализ содержания и культурно-теоретическую основу
Создание кросс-культурного набора данных о любопытстве: Набор реальных вопросов из 18 стран по 16 темам на основе Yahoo! Answers
Исследование стратегий вызывания любопытства: Повышение способности LLM выражать культурно-чувствительное любопытство посредством различных методов тонкой настройки
Проверка практической ценности: Демонстрация роли любопытства в повышении культурной адаптивности LLM на трех кросс-культурных эталонах
Корпус NatQuest (Ceraolo et al., 2024): открытость и причинная направленность естественных вопросов
Исследования культурного представления: в основном сосредоточены на предвзятости и оценке культурного восприятия, но не анализируют способность задавать вопросы
Существующие работы в основном проверяют способность ответов на вопросы, используя эталоны опросов (такие как WVS, Pew Research). Данная работа является первым систематическим сравнением кросс-культурных вопросов человека и LLM.
Ограниченное покрытие набора данных: 18 стран и 16 тем не могут полностью представить глобальный культурный ландшафт
Языковые ограничения: в основном используется английский язык, что может привести к смещению WEIRD (западный, образованный, индустриализированный, богатый, демократический)
Ограничения теоретической базы: теории Хофстеде и др. могут не охватить современные или субкультурные вариации
Субъективность оценки: оценка любопытства и релевантности включает субъективные суждения
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
Итоговая оценка: Это новаторское исследование, впервые систематически исследующее проблему кросс-культурного любопытства в LLM. База CUEST хорошо спроектирована, экспериментальная установка комплексна, результаты имеют важное теоретическое и практическое значение. Несмотря на ограничения в охвате данных и субъективности оценки, исследование открывает новое направление в кросс-культурных исследованиях NLP и обладает высокой академической ценностью и потенциалом применения.