The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic
Il Curioso Caso della Curiosità tra le Culture Umane e gli LLM
Questo articolo esamina la manifestazione transculturale della curiosità nei modelli linguistici di grandi dimensioni (LLM). Gli autori utilizzano un dataset multipaese di Yahoo! Answers e propongono il framework di valutazione CUEST (CUriosity Evaluation across SocieTies), misurando la coerenza tra umani e modelli nell'espressione della curiosità attraverso lo stile linguistico, le preferenze tematiche e le teorie delle scienze sociali. La ricerca rivela che gli LLM appiattiscono le differenze transculturali, tendendo verso modalità di espressione della curiosità occidentali. Attraverso strategie di fine-tuning, gli autori riducono il divario di allineamento umano-modello del 50% e dimostrano il valore pratico della curiosità per l'adattabilità transculturale degli LLM.
La curiosità è una forza motrice fondamentale nell'apprendimento e nell'esplorazione umana, manifestandosi diversamente in culture differenti. Con l'espansione del ruolo degli LLM nell'interazione uomo-macchina, la loro capacità di esprimere curiosità diventa un fattore importante che influenza l'esperienza dell'utente. Tuttavia, la ricerca esistente si concentra principalmente sulla capacità di risposta degli LLM, trascurando la loro capacità di porre domande ed esprimere curiosità, in particolare in contesti transculturali.
La ricerca transculturale si concentra principalmente sul test della capacità di risposta alle domande degli LLM, trascurando la capacità di porre domande
Manca un framework sistematico di confronto della curiosità tra umani e LLM
La ricerca esistente sulla curiosità manca di considerazioni culturali dettagliate
Proposta del Framework CUEST: Un sistema di valutazione completo che combina analisi linguistica, analisi dei contenuti e fondamenti teorici culturali
Costruzione di un Dataset Transculturale sulla Curiosità: Dataset di domande reali da 18 paesi e 16 argomenti basato su Yahoo! Answers
Esplorazione di Strategie di Induzione della Curiosità: Miglioramento della capacità di espressione della curiosità sensibile alla cultura negli LLM attraverso vari metodi di fine-tuning
Verifica del Valore Pratico: Dimostrazione del ruolo della curiosità nel migliorare l'adattabilità culturale degli LLM su tre benchmark transculturali
Corpus NatQuest (Ceraolo et al., 2024): Apertura e orientamento causale delle domande naturali
Ricerca sulla Rappresentazione Culturale: Si concentra principalmente su pregiudizi e valutazione della percezione culturale, ma manca l'analisi della capacità di porre domande
I lavori esistenti testano principalmente la capacità di risposta alle domande, utilizzando benchmark di indagine (come WVS, Pew Research). Questo articolo è il primo a confrontare sistematicamente le domande umane-LLM transculturali.
Gli LLM Appiattiscono le Differenze Culturali: L'output del modello è più conforme alle norme occidentali, mancando di diversità culturale
Gli Umani Si Discostano dagli Stereotipi Tradizionali: L'espressione reale della curiosità è più complessa di quanto previsto dalla teoria tradizionale
Il Fine-tuning dell'Adattatore è Efficace: Mostra le migliori prestazioni nella valutazione della curiosità sensibile alla cultura e intrinseca
La Curiosità Migliora l'Adattabilità Culturale: Verificata su più benchmark con valore pratico
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
Sintesi della Valutazione: Questo è uno studio pioneristico che esplora sistematicamente per la prima volta il problema della curiosità transculturale negli LLM. Il framework CUEST è ben progettato, la configurazione sperimentale è completa e i risultati hanno un significato teorico e pratico importante. Nonostante le limitazioni nella copertura dei dati e nella soggettività della valutazione, apre nuove direzioni per la ricerca NLP transculturale e possiede un elevato valore accademico e potenziale applicativo.