2025-11-13T16:19:11.096230

The Curious Case of Curiosity across Human Cultures and LLMs

Borah, Mihalcea
Recent advances in Large Language Models (LLMs) have expanded their role in human interaction, yet curiosity -- a central driver of inquiry -- remains underexplored in these systems, particularly across cultural contexts. In this work, we investigate cultural variation in curiosity using Yahoo! Answers, a real-world multi-country dataset spanning diverse topics. We introduce CUEST (CUriosity Evaluation across SocieTies), an evaluation framework that measures human-model alignment in curiosity through linguistic (style), topic preference (content) analysis and grounding insights in social science constructs. Across open- and closed-source models, we find that LLMs flatten cross-cultural diversity, aligning more closely with how curiosity is expressed in Western countries. We then explore fine-tuning strategies to induce curiosity in LLMs, narrowing the human-model alignment gap by up to 50\%. Finally, we demonstrate the practical value of curiosity for LLM adaptability across cultures, showing its importance for future NLP research.
academic

जिज्ञासा का जिज्ञासु मामला: मानव संस्कृतियों और LLMs में

मूल जानकारी

  • पेपर ID: 2510.12943
  • शीर्षक: The Curious Case of Curiosity across Human Cultures and LLMs
  • लेखक: अंगना बोराह, राडा मिहालसिया (मिशिगन विश्वविद्यालय, एन आर्बर)
  • वर्गीकरण: cs.CL (कम्प्यूटेशनल भाषाविज्ञान)
  • प्रकाशन समय: 14 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.12943v1

सारांश

यह पेपर बड़े भाषा मॉडल (LLMs) में जिज्ञासा की अंतर-सांस्कृतिक अभिव्यक्ति का अध्ययन करता है। लेखकों ने Yahoo! Answers बहु-राष्ट्रीय डेटासेट का उपयोग करते हुए CUEST (CUriosity Evaluation across SocieTies) मूल्यांकन ढांचा प्रस्तावित किया है, जो भाषाई शैली, विषय वरीयताओं और सामाजिक विज्ञान सिद्धांतों के माध्यम से मानव और मॉडल के बीच जिज्ञासा अभिव्यक्ति में संरेखण को मापता है। अनुसंधान से पता चलता है कि LLMs अंतर-सांस्कृतिक अंतरों को समतल करते हैं और पश्चिमी देशों की जिज्ञासा अभिव्यक्ति के तरीकों की ओर अधिक झुकते हैं। सूक्ष्म-समायोजन रणनीतियों के माध्यम से, लेखकों ने मानव-मॉडल संरेखण अंतराल को 50% तक कम किया है और LLM के अंतर-सांस्कृतिक अनुकूलन के लिए जिज्ञासा के व्यावहारिक मूल्य को प्रमाणित किया है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. मूल समस्या

जिज्ञासा मानव सीखने और अन्वेषण की मूल प्रेरक शक्ति है, जो विभिन्न संस्कृतियों में विभिन्न रूपों में प्रकट होती है। मानव-मशीन इंटरैक्शन में LLMs की भूमिका के विस्तार के साथ, इसकी जिज्ञासा अभिव्यक्ति क्षमता उपयोगकर्ता अनुभव को प्रभावित करने वाला एक महत्वपूर्ण कारक बन गई है। हालांकि, मौजूदा अनुसंधान मुख्य रूप से LLMs की उत्तर देने की क्षमता पर केंद्रित है, जबकि इसकी प्रश्न पूछने और जिज्ञासा अभिव्यक्ति की क्षमता को नजरअंदाज करता है, विशेष रूप से अंतर-सांस्कृतिक संदर्भ में।

2. समस्या की महत्ता

  • जिज्ञासा सांस्कृतिक सीखने, शिक्षा और मानव-मशीन इंटरैक्शन का एक मुख्य तत्व है
  • विभिन्न सांस्कृतिक पृष्ठभूमि में जिज्ञासा की अभिव्यक्ति के तरीकों में महत्वपूर्ण अंतर मौजूद हैं
  • बेहतर उपयोगकर्ता अनुभव प्रदान करने के लिए LLMs को सांस्कृतिक रूप से संवेदनशील जिज्ञासा अभिव्यक्ति क्षमता की आवश्यकता है

3. मौजूदा विधियों की सीमाएं

  • अंतर-सांस्कृतिक अनुसंधान मुख्य रूप से LLM की ज्ञान उत्तर क्षमता का परीक्षण करता है, प्रश्न पूछने की क्षमता को नजरअंदाज करता है
  • मानव-LLM जिज्ञासा तुलना के लिए व्यवस्थित ढांचे की कमी है
  • मौजूदा जिज्ञासा अनुसंधान में सांस्कृतिक विवरणों पर विचार की कमी है

4. अनुसंधान प्रेरणा

लेखकों ने तीन मुख्य अनुसंधान प्रश्न प्रस्तावित किए हैं:

  1. क्या ऑनलाइन प्लेटफॉर्म पर जिज्ञासा-संचालित प्रश्नों में अंतर-सांस्कृतिक अंतर मौजूद हैं, और क्या LLMs इन पैटर्न को पुनः प्रस्तुत कर सकते हैं?
  2. LLMs में जिज्ञासा को कैसे प्रेरित किया जाए?
  3. सांस्कृतिक रूप से संवेदनशील जिज्ञासा का LLMs के डाउनस्ट्रीम अनुप्रयोगों पर क्या व्यावहारिक महत्व है?

मुख्य योगदान

  1. CUEST मूल्यांकन ढांचा प्रस्तावित करना: भाषाई विश्लेषण, सामग्री विश्लेषण और सांस्कृतिक सिद्धांत आधार को जोड़ने वाली एक व्यापक मूल्यांकन प्रणाली
  2. अंतर-सांस्कृतिक जिज्ञासा डेटासेट का निर्माण: Yahoo! Answers के आधार पर 18 देशों, 16 विषयों की वास्तविक प्रश्न डेटासेट
  3. जिज्ञासा प्रेरण रणनीतियों की खोज: विभिन्न सूक्ष्म-समायोजन विधियों के माध्यम से LLMs की सांस्कृतिक रूप से संवेदनशील जिज्ञासा अभिव्यक्ति क्षमता को बढ़ाना
  4. व्यावहारिक मूल्य का सत्यापन: तीन अंतर-सांस्कृतिक बेंचमार्क परीक्षणों में LLM सांस्कृतिक अनुकूलन पर जिज्ञासा के प्रभाव को प्रमाणित करना

विधि विवरण

कार्य परिभाषा

यह अनुसंधान दो मुख्य कार्यों को परिभाषित करता है:

  1. सांस्कृतिक रूप से संवेदनशील जिज्ञासा मूल्यांकन: विभिन्न सांस्कृतिक पृष्ठभूमि में मानव और LLM के प्रश्न अभिव्यक्ति तरीकों की तुलना
  2. जिज्ञासा प्रेरण: प्रशिक्षण के माध्यम से LLMs को बेहतर सांस्कृतिक रूप से संवेदनशील प्रश्न पूछने की क्षमता प्रदान करना

CUEST मूल्यांकन ढांचा

1. भाषाई संरेखण विश्लेषण (Linguistic Alignment)

चार आयामों का मूल्यांकन:

अस्पष्टता (Ambiguity):

L(q) = 1/n (∑w∈W 1[w ∈ A] + ∑w∈W 1[|POS(w)| > 1])

जहां A बहु-अर्थी शब्दों की सूची है, POS(w) शब्द w के भाषाई टैग का समूह है।

अलंकारिक उपकरण (Rhetorical Devices):

RD = (R + Q + A + P + M)/n

पुनरावृत्ति शब्द (R), प्रश्नवाचक वाक्य (Q), अनुप्रास (A), समानांतर संरचना (P), सादृश्य चिह्न (M) शामिल हैं।

खुली-समाप्ति प्रश्न (Open-Endedness):

Ω(u) = 1[starts_with_wh(q) = 1 ∧ NLI(q) ≠ entailment]

सुसंगतता स्कोर (Cohesion Score):

COH(q) = 1/3 (Lx + min(1,Tx) + Sx)

शब्दावली ओवरलैप, संक्रमण शब्द और शब्दार्थ समानता को जोड़ता है।

2. विषय वरीयता संरेखण (Topic Preference Alignment)

मानव और LLM की विषय वरीयता क्रम की तुलना के लिए Spearman और Kendall सहसंबंध गुणांक का उपयोग।

3. सामाजिक विज्ञान सिद्धांत आधार (Social Science Grounding)

चार सैद्धांतिक ढांचों पर आधारित:

  • Hofstede सांस्कृतिक आयाम: अनिश्चितता से बचाव, व्यक्तिवाद-सामूहिकता आदि
  • Schwartz मूल्य सिद्धांत: खुलापन बनाम रूढ़िवाद
  • Hall संदर्भ सिद्धांत: उच्च संदर्भ बनाम निम्न संदर्भ संस्कृति
  • शिक्षा प्रणाली: रटना बनाम समग्र सीखना

जिज्ञासा प्रेरण विधि

सूक्ष्म-समायोजन रणनीति

  1. पूर्ण सूक्ष्म-समायोजन (Full Fine-tuning)
  2. अनुकूलक-आधारित सूक्ष्म-समायोजन (Adapter-based Fine-tuning)

प्रशिक्षण उद्देश्य

  • Obj1: विशिष्ट देश के प्रश्न सीधे उत्पन्न करना
  • Obj2: संवाद संदर्भ के आधार पर प्रश्न उत्पन्न करना

डेटा वृद्धि

शब्दावली प्रतिस्थापन, शब्द क्रम परिवर्तन आदि तकनीकों का उपयोग करके प्रशिक्षण डेटा को प्रति देश 1000 नमूनों तक विस्तारित करना।

प्रयोगात्मक सेटअप

डेटासेट

  1. Yahoo! Answers: 18 देश, 16 विषय, एशिया, यूरोप, अमेरिका और ओशिनिया को कवर करते हैं
  2. Reddit: r/brazil, r/askuk, r/philippines से प्रश्न डेटा
  3. LLM-उत्पन्न डेटा: सांस्कृतिक व्यक्तित्व संकेत का उपयोग करके उत्पन्न प्रश्न और विषय वरीयताएं

मूल्यांकन मेट्रिक्स

  • भाषाई संरेखण: मानव और मॉडल स्कोर अंतर को मापने के लिए L2 दूरी
  • विषय वरीयता: Spearman और Kendall सहसंबंध गुणांक
  • सामाजिक विज्ञान संरेखण: LIWC आयामों के आधार पर औसत निरपेक्ष त्रुटि
  • आंतरिक जिज्ञासा: जिज्ञासा दर और प्रासंगिकता स्कोर

तुलना विधि

छह मॉडलों का परीक्षण: GPT-4o, GPT-5, Claude-Sonnet-4, Qwen-3-14b, LLaMA-3-8b, LLaMA-3-70b

कार्यान्वयन विवरण

  • NVIDIA A40 GPU का उपयोग
  • उच्च-दक्ष सूक्ष्म-समायोजन के लिए LoRA अनुकूलक
  • अधिकतम अनुक्रम लंबाई 1024 टोकन
  • प्रत्येक प्रयोग 3 बार चलाया गया और औसत लिया गया

प्रयोगात्मक परिणाम

मुख्य निष्कर्ष

1. अंतर-सांस्कृतिक अंतर पैटर्न

  • मानव मानक विचलन > LLM मानक विचलन (0.0785 बनाम 0.029, F-stat: 7.33)
  • LLMs अंतर-सांस्कृतिक अंतरों को समतल करते हैं
  • पश्चिमी देश सर्वोच्च मानव-मॉडल संरेखण दिखाते हैं

2. मॉडल प्रदर्शन रैंकिंग

भाषाई संरेखण: LLaMA-3-8b (0.25) > LLaMA-3-70b (0.27) > Claude-Sonnet-4 (0.28) = GPT-4o (0.28) > Qwen-3-14b (0.29) > GPT-5 (0.42)

विषय वरीयता संरेखण: केवल LLaMA-3-8b सकारात्मक सहसंबंध दिखाता है (0.17), अन्य सभी मॉडल नकारात्मक सहसंबंध हैं

3. सामाजिक विज्ञान सिद्धांत संरेखण

  • सभी मॉडल पश्चिमी देशों में बेहतर प्रदर्शन करते हैं
  • LLaMA-3-8b अधिकांश सैद्धांतिक आयामों पर मानव के सबसे करीब है
  • Hall का उच्च-निम्न संदर्भ सिद्धांत सबसे बड़ा विचलन दिखाता है

जिज्ञासा प्रेरण परिणाम

सांस्कृतिक रूप से संवेदनशील जिज्ञासा वृद्धि

  • अनुकूलक विधि > पूर्ण सूक्ष्म-समायोजन > केवल संकेत-आधारित विधि
  • Reddit प्रशिक्षण डेटा सर्वोत्तम परिणाम
  • Obj2 प्रशिक्षण उद्देश्य Obj1 से बेहतर

आंतरिक जिज्ञासा मूल्यांकन

  • अनुकूलक मॉडल: 75% मामलों में प्रश्न पूछते हैं
  • पूर्ण सूक्ष्म-समायोजन मॉडल: 20% मामलों में प्रश्न पूछते हैं
  • केवल संकेत मॉडल: 0% प्रश्न दर
  • प्रासंगिकता 98-100% पर बनी रहती है

डाउनस्ट्रीम कार्य सत्यापन

स्थितिNormADCulturalBenchCultural CS
गैर-जिज्ञासु70.48%64.71%48.48%
जिज्ञासु (संकेत)72.09%67.64%49.64%
जिज्ञासु (सूक्ष्म-समायोजन+संकेत)71.06%68.21%56.16%

जिज्ञासा प्रेरण सभी सांस्कृतिक अनुकूलन बेंचमार्क पर प्रदर्शन वृद्धि दिखाता है।

संबंधित कार्य

मनोविज्ञान अनुसंधान

  • सूचना अंतराल सिद्धांत (Loewenstein, 1994)
  • जिज्ञासा-संचालित सिद्धांत (Berlyne, 1960)
  • इष्टतम जागरूकता सिद्धांत (Hebb, 1955)

NLP क्षेत्र

  • NatQuest कॉर्पस (Ceraolo et al., 2024): प्राकृतिक प्रश्नों की खुली-समाप्ति और कारण-संचालन
  • सांस्कृतिक प्रतिनिधित्व अनुसंधान: मुख्य रूप से पूर्वाग्रह और सांस्कृतिक धारणा मूल्यांकन पर केंद्रित, लेकिन प्रश्न पूछने की क्षमता विश्लेषण की कमी

अंतर-सांस्कृतिक LLM अनुसंधान

मौजूदा कार्य मुख्य रूप से ज्ञान उत्तर क्षमता का परीक्षण करता है, सर्वेक्षण बेंचमार्क (जैसे WVS, Pew Research) का उपयोग करता है, यह पेपर अंतर-सांस्कृतिक मानव-LLM प्रश्नों की तुलना करने वाला पहला व्यवस्थित अध्ययन है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. LLMs सांस्कृतिक अंतरों को समतल करते हैं: मॉडल आउटपुट पश्चिमी मानदंडों के अनुरूप अधिक है, सांस्कृतिक विविधता की कमी है
  2. मानव पारंपरिक रूढ़ियों से विचलित होते हैं: वास्तविक जिज्ञासा अभिव्यक्ति पारंपरिक सिद्धांत की अपेक्षा से अधिक जटिल है
  3. अनुकूलक सूक्ष्म-समायोजन प्रभावी है: सांस्कृतिक संवेदनशीलता और आंतरिक जिज्ञासा मूल्यांकन में सर्वोत्तम प्रदर्शन
  4. जिज्ञासा सांस्कृतिक अनुकूलन को बढ़ाती है: कई बेंचमार्क परीक्षणों में व्यावहारिक मूल्य सत्यापित

सीमाएं

  1. डेटासेट कवरेज सीमित: 18 देश 16 विषय, वैश्विक सांस्कृतिक परिदृश्य का पूर्ण प्रतिनिधित्व नहीं कर सकते
  2. भाषा सीमाएं: मुख्य रूप से अंग्रेजी का उपयोग, WEIRD (पश्चिमी, शिक्षित, औद्योगिकृत, समृद्ध, लोकतांत्रिक) पूर्वाग्रह का परिचय दे सकता है
  3. सैद्धांतिक ढांचे की सीमाएं: Hofstede आदि सिद्धांत समकालीन या उप-सांस्कृतिक विविधताओं को पकड़ने में विफल हो सकते हैं
  4. मूल्यांकन व्यक्तिपरकता: जिज्ञासा और प्रासंगिकता मूल्यांकन व्यक्तिपरक निर्णय शामिल करते हैं

भविष्य की दिशाएं

  1. बहुभाषी अंतर-सांस्कृतिक जिज्ञासा अनुसंधान
  2. बहु-एजेंट प्रणालियों में सांस्कृतिक जिज्ञासा
  3. इंटरैक्टिव संवाद में जिज्ञासा गतिशीलता का विकास
  4. अधिक विविध सांस्कृतिक सैद्धांतिक ढांचे का एकीकरण

गहन मूल्यांकन

शक्तियां

  1. उच्च नवीनता: LLM में अंतर-सांस्कृतिक जिज्ञासा का अध्ययन करने वाला पहला व्यवस्थित कार्य
  2. व्यापक विधि: CUEST ढांचा भाषाई, सामग्री और सैद्धांतिक तीन आयामों को जोड़ता है
  3. पर्याप्त प्रयोग: कई मॉडल, विभिन्न सूक्ष्म-समायोजन रणनीति और डाउनस्ट्रीम सत्यापन को कवर करता है
  4. दृढ़ सैद्धांतिक आधार: परिपक्व सामाजिक विज्ञान सैद्धांतिक ढांचे पर आधारित
  5. उच्च व्यावहारिक मूल्य: सांस्कृतिक अनुकूलन पर जिज्ञासा के वास्तविक प्रभाव को प्रमाणित करता है

कमियां

  1. सांस्कृतिक प्रतिनिधित्व अपर्याप्त: 18 देश वैश्विक सांस्कृतिक विविधता को पूरी तरह कवर करने में कठिनाई
  2. अनुवाद गुणवत्ता प्रभाव: Google Translate सांस्कृतिक विवरण खो सकता है
  3. मूल्यांकन मानदंड व्यक्तिपरक: कुछ संकेतक मानव निर्णय पर निर्भर हैं, सामंजस्य समस्याएं मौजूद हैं
  4. मॉडल व्याख्या की कमी: LLaMA-3-8b के सर्वोत्तम प्रदर्शन के गहरे कारणों का विश्लेषण अपर्याप्त है

प्रभाव

  1. शैक्षणिक योगदान: अंतर-सांस्कृतिक NLP अनुसंधान के लिए नया मूल्यांकन प्रतिमान प्रदान करता है
  2. व्यावहारिक मूल्य: सांस्कृतिक रूप से संवेदनशील संवाद प्रणाली निर्माण के लिए मार्गदर्शन प्रदान करता है
  3. पुनरुत्पादनीयता: लेखक कोड और डेटा को खुला-स्रोत करने का वादा करते हैं
  4. प्रेरणा: भविष्य के बहु-एजेंट सांस्कृतिक अनुकरण अनुसंधान के लिए आधार तैयार करता है

लागू परिदृश्य

  1. अंतर-सांस्कृतिक संवाद प्रणाली: बहु-सांस्कृतिक उपयोगकर्ता अनुभव में सुधार
  2. शिक्षा प्रौद्योगिकी: सांस्कृतिक रूप से संवेदनशील शिक्षा सहायक उपकरण विकसित करना
  3. अंतर्राष्ट्रीयकरण उत्पाद: वैश्विक AI उत्पादों के स्थानीयकरण अनुकूलन में सुधार
  4. सामाजिक विज्ञान अनुसंधान: सांस्कृतिक मनोविज्ञान अनुसंधान के लिए कम्प्यूटेशनल उपकरण प्रदान करता है

संदर्भ

  1. Berlyne, D. E. (1960). Conflict, arousal, and curiosity.
  2. Hofstede, G. (2001). Culture's consequences: Comparing values, behaviors, institutions and organizations across nations.
  3. Loewenstein, G. (1994). The psychology of curiosity: A review and reinterpretation.
  4. Ceraolo, R. et al. (2024). Analyzing human questioning behavior and causal curiosity through natural queries.

मूल्यांकन सारांश: यह एक अग्रणी अनुसंधान है जो पहली बार LLM में अंतर-सांस्कृतिक जिज्ञासा समस्या की व्यवस्थित रूप से खोज करता है। CUEST ढांचा उचित रूप से डिज़ाइन किया गया है, प्रयोगात्मक सेटअप व्यापक है, परिणामों का महत्वपूर्ण सैद्धांतिक और व्यावहारिक महत्व है। डेटासेट कवरेज और मूल्यांकन व्यक्तिपरकता जैसी सीमाओं के बावजूद, यह अंतर-सांस्कृतिक NLP अनुसंधान के लिए नई दिशा खोलता है, जिसमें उच्च शैक्षणिक मूल्य और अनुप्रयोग क्षमता है।