The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic
حالة الفضول الغريبة عبر الثقافات البشرية ونماذج اللغة الكبيرة
تبحث هذه الورقة عن التعبير عن الفضول عبر الثقافات في نماذج اللغة الكبيرة (LLMs). يستخدم المؤلفون مجموعة بيانات Yahoo! Answers متعددة الدول، ويقترحون إطار عمل CUEST (تقييم الفضول عبر المجتمعات) لقياس الاتساق بين البشر والنماذج في التعبير عن الفضول من خلال أسلوب اللغة وتفضيلات الموضوعات والنظريات العلمية الاجتماعية. تكشف الدراسة أن نماذج اللغة الكبيرة تمحو الاختلافات عبر الثقافات وتميل نحو طرق التعبير عن الفضول الغربية. من خلال استراتيجيات الضبط الدقيق، قلل المؤلفون فجوة المحاذاة بين البشر والنموذج بنسبة 50%، وأثبتوا القيمة العملية للفضول في التكيف عبر الثقافات لنماذج اللغة الكبيرة.
الفضول هو القوة الدافعة الأساسية للتعلم والاستكشاف البشري، وتختلف أشكال تعبيره عبر الثقافات المختلفة. مع توسع دور نماذج اللغة الكبيرة في التفاعل بين الإنسان والآلة، أصبحت قدرتها على التعبير عن الفضول عاملاً مهماً يؤثر على تجربة المستخدم. ومع ذلك، يركز البحث الحالي بشكل أساسي على قدرة نماذج اللغة الكبيرة على الإجابة، متجاهلاً قدرتها على طرح الأسئلة والتعبير عن الفضول، خاصة في السياق عبر الثقافي.
تركز الأعمال الموجودة بشكل أساسي على اختبار قدرة الإجابة عن الأسئلة، باستخدام معايير المسح (مثل WVS و Pew Research)، وهذه الورقة هي الأولى التي تقارن بشكل منهجي أسئلة البشر ونماذج اللغة الكبيرة عبر الثقافات.
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
ملخص التقييم: هذا بحث رائد يستكشف لأول مرة بشكل منهجي مسألة الفضول عبر الثقافات في نماذج اللغة الكبيرة. يتمتع إطار عمل CUEST بتصميم معقول، وإعداد التجارب شامل، والنتائج ذات أهمية نظرية وعملية كبيرة. على الرغم من وجود قيود في تغطية البيانات والذاتية في التقييم، فإن هذا البحث يفتح اتجاهاً جديداً لأبحاث اللسانيات الحاسوبية عبر الثقافات، ويتمتع بقيمة أكاديمية وإمكانية تطبيق عالية.