The Curious Case of Curiosity across Human Cultures and LLMs
Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic
El Curioso Caso de la Curiosidad entre Culturas Humanas y LLMs
Este artículo investiga la manifestación transcultural de la curiosidad en modelos de lenguaje grandes (LLMs). Los autores utilizan un conjunto de datos multinacional de Yahoo! Answers y proponen el marco de evaluación CUEST (CUriosity Evaluation across SocieTies), que mide la coherencia entre humanos y modelos en la expresión de curiosidad a través del estilo lingüístico, preferencias temáticas y teorías de ciencias sociales. El estudio revela que los LLMs uniformizan las diferencias transculturales, tendiendo hacia formas de expresión de curiosidad occidentales. Mediante estrategias de ajuste fino, los autores reducen la brecha de alineación humano-modelo en un 50% y demuestran el valor práctico de la curiosidad para la adaptabilidad transcultural de los LLMs.
La curiosidad es un impulsor fundamental del aprendizaje y la exploración humana, manifestándose de formas diversas en diferentes culturas. Con la expansión del papel de los LLMs en la interacción humano-máquina, su capacidad para expresar curiosidad se convierte en un factor importante que afecta la experiencia del usuario. Sin embargo, la investigación existente se centra principalmente en la capacidad de respuesta de los LLMs, descuidando su capacidad para hacer preguntas y expresar curiosidad, especialmente en contextos transculturales.
La investigación transcultural se centra principalmente en probar la capacidad de respuesta de conocimiento de los LLMs, descuidando la capacidad de hacer preguntas
Falta un marco sistemático de comparación de curiosidad humano-LLM
La investigación existente sobre curiosidad carece de consideraciones de detalle cultural
Propuesta del Marco de Evaluación CUEST: Un sistema de evaluación integral que combina análisis lingüístico, análisis de contenido y bases teóricas culturales
Construcción de Conjunto de Datos Transcultural de Curiosidad: Conjunto de datos de preguntas reales de 18 países y 16 temas basado en Yahoo! Answers
Exploración de Estrategias de Inducción de Curiosidad: Mejora de la capacidad de expresión de curiosidad culturalmente sensible de los LLMs mediante múltiples métodos de ajuste fino
Verificación de Valor Práctico: Demostración del efecto de mejora de la curiosidad en la adaptabilidad cultural de los LLMs en tres pruebas de referencia transculturales
Esta investigación define dos tareas fundamentales:
Evaluación de Curiosidad Culturalmente Sensible: Comparación de formas de expresión de preguntas entre humanos y LLMs en diferentes contextos culturales
Inducción de Curiosidad: Entrenamiento de LLMs para poseer mejor capacidad de formulación de preguntas culturalmente sensible
Corpus NatQuest (Ceraolo et al., 2024): Apertura y orientación causal de preguntas naturales
Investigación de Representación Cultural: Se centra principalmente en evaluación de sesgos y percepción cultural, pero carece de análisis de capacidad de formulación de preguntas
El trabajo existente prueba principalmente la capacidad de respuesta de conocimiento, utilizando puntos de referencia de encuestas (como WVS, Pew Research). Este artículo es el primero en comparar sistemáticamente preguntas humano-LLM transculturales.
Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.
Resumen de Evaluación: Esta es una investigación pionera que explora sistemáticamente por primera vez el problema de la curiosidad transcultural en LLMs. El marco CUEST está bien diseñado, la configuración experimental es integral y los resultados tienen significado teórico y práctico importante. Aunque existen limitaciones en cobertura de datos y subjetividad de evaluación, abre nuevas direcciones para investigación PNL transcultural, con considerable valor académico y potencial de aplicación.