The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic
Der merkwürdige Fall der Neugier über menschliche Kulturen und LLMs hinweg
Dieses Paper untersucht die kulturübergreifende Manifestation von Neugier in großen Sprachmodellen (LLMs). Die Autoren verwenden einen multinationalen Datensatz von Yahoo! Answers und schlagen das CUEST-Framework (CUriosity Evaluation across SocieTies) vor, um die Konsistenz zwischen Menschen und Modellen in der Neugierausdrucksweise durch Sprachstil, Themenpräferenzen und sozialwissenschaftliche Theorien zu messen. Die Forschung zeigt, dass LLMs kulturelle Unterschiede nivellieren und eher westliche Ausdrucksformen von Neugier bevorzugen. Durch Feinabstimmungsstrategien reduzieren die Autoren die Mensch-Modell-Ausrichtungslücke um 50% und demonstrieren den praktischen Wert von Neugier für die kulturübergreifende Anpassung von LLMs.
Neugier ist eine zentrale Triebkraft für menschliches Lernen und Erkunden und manifestiert sich in verschiedenen Kulturen unterschiedlich. Mit der wachsenden Rolle von LLMs in der Mensch-Maschine-Interaktion wird die Fähigkeit zur Neugierausdrucksweise zu einem wichtigen Faktor für die Benutzerexperience. Allerdings konzentriert sich die bestehende Forschung hauptsächlich auf die Antwortkompetenz von LLMs und vernachlässigt deren Fähigkeit zum Fragen stellen und zur Neugierausdrucksweise, besonders im kulturübergreifenden Kontext.
Vorschlag des CUEST-Evaluierungsframeworks: Ein umfassendes Evaluierungssystem, das Sprachanalyse, Inhaltsanalyse und kulturtheoretische Grundlagen kombiniert
Konstruktion eines kulturübergreifenden Neugier-Datensatzes: Ein Datensatz echter Fragen aus 18 Ländern zu 16 Themen basierend auf Yahoo! Answers
Erforschung von Neugier-Induktionsstrategien: Verbesserung der kulturell sensiblen Neugierausdrucksfähigkeit von LLMs durch verschiedene Feinabstimmungsmethoden
Validierung des praktischen Wertes: Nachweis der Verbesserung der kulturellen Anpassungsfähigkeit von LLMs durch Neugier in drei kulturübergreifenden Benchmarks
NatQuest-Korpus (Ceraolo et al., 2024): Offenheit und kausale Ausrichtung natürlicher Fragen
Kulturelle Repräsentationsforschung: Konzentriert sich hauptsächlich auf Verzerrungen und kulturelle Wahrnehmungsbewertung, fehlt aber Analyse der Fragestellungskompetenz
Bestehende Arbeiten testen hauptsächlich Wissensantwortkompetenz unter Verwendung von Umfrage-Benchmarks (wie WVS, Pew Research). Dieses Paper ist das erste, das systematisch kulturübergreifende Mensch-LLM-Fragen vergleicht.
Theoretische Rahmenwerk-Limitierungen: Hofstede und andere Theorien können möglicherweise zeitgenössische oder subkulturelle Variationen nicht erfassen
Evaluierungssubjektivität: Neugier- und Relevanzbeurteilungen beinhalten subjektive Urteile
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
Bewertungszusammenfassung: Dies ist eine bahnbrechende Forschungsarbeit, die erstmals systematisch das Problem der kulturübergreifenden Neugier in LLMs untersucht. Das CUEST-Framework ist gut konzipiert, die experimentelle Einrichtung umfassend, und die Ergebnisse haben wichtige theoretische und praktische Bedeutung. Trotz Limitierungen bei der Datensatzabdeckung und Evaluierungssubjektivität eröffnet diese Arbeit neue Richtungen für kulturübergreifende NLP-Forschung und hat hohes akademisches und Anwendungspotenzial.