2025-11-16T07:07:12.103832

The Mechanistic Emergence of Symbol Grounding in Language Models

Wu, Ma, Luo et al.

Symbol grounding (Harnad, 1990) describes how symbols such as words acquire their meanings by connecting to real-world sensorimotor experiences. Recent work has shown preliminary evidence that grounding may emerge in (vision-)language models trained at scale without using explicit grounding objectives. Yet, the specific loci of this emergence and the mechanisms that drive it remain largely unexplored. To address this problem, we introduce a controlled evaluation framework that systematically traces how symbol grounding arises within the internal computations through mechanistic and causal analysis. Our findings show that grounding concentrates in middle-layer computations and is implemented through the aggregate mechanism, where attention heads aggregate the environmental ground to support the prediction of linguistic forms. This phenomenon replicates in multimodal dialogue and across architectures (Transformers and state-space models), but not in unidirectional LSTMs. Our results provide behavioral and mechanistic evidence that symbol grounding can emerge in language models, with practical implications for predicting and potentially controlling the reliability of generation.

academic

भाषा मॉडल में प्रतीक आधारीकरण का यांत्रिक उद्भव

मूल जानकारी

पेपर ID: 2510.13796
शीर्षक: The Mechanistic Emergence of Symbol Grounding in Language Models
लेखक: Shuyu Wu, Ziqiao Ma, Xiaoxi Luo, Yidong Huang, Josue Torres-Fonseca, Freda Shi, Joyce Chai
वर्गीकरण: cs.CL (कम्प्यूटेशनल भाषाविज्ञान), cs.CV (कंप्यूटर विजन)
प्रकाशन तिथि: 15 अक्टूबर 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.13796

सारांश

प्रतीक आधारीकरण (Symbol grounding) वर्णन करता है कि कैसे प्रतीक (जैसे शब्दावली) वास्तविक दुनिया के संवेदी-गतिशील अनुभवों से जुड़कर अर्थ प्राप्त करते हैं। हाल के शोध से पता चलता है कि बड़े पैमाने पर प्रशिक्षित (दृश्य) भाषा मॉडल में, आधारीकरण क्षमता स्वतः उद्भूत हो सकती है, बिना स्पष्ट आधारीकरण लक्ष्यों के उपयोग के। हालांकि, इस उद्भव का विशिष्ट स्थान और संचालन तंत्र अभी तक मूलतः अन्वेषित रहे हैं। इस समस्या को हल करने के लिए, यह पेपर एक नियंत्रित मूल्यांकन ढांचा प्रस्तुत करता है जो यांत्रिक और कारणात्मक विश्लेषण के माध्यम से व्यवस्थित रूप से ट्रैक करता है कि प्रतीक आधारीकरण आंतरिक संगणना में कैसे उत्पन्न होता है। अनुसंधान से पता चलता है कि आधारीकरण मध्य-स्तरीय संगणना में केंद्रित है और एकत्रीकरण तंत्र के माध्यम से प्राप्त होता है, जहां ध्यान सिर भाषाई रूप की भविष्यवाणी का समर्थन करने के लिए पर्यावरणीय आधार को एकत्रित करते हैं। यह घटना बहु-मोडल संवाद और विभिन्न आर्किटेक्चर (ट्रांसफॉर्मर और स्टेट स्पेस मॉडल) में दोहराई जाती है, लेकिन एकदिशात्मक LSTM में नहीं दिखाई देती।

अनुसंधान पृष्ठभूमि और प्रेरणा

मूल समस्या

यह अनुसंधान जो मूल समस्या हल करता है वह है: भाषा मॉडल में प्रतीक आधारीकरण यांत्रिक रूप से कैसे उद्भूत होता है? विशेष रूप से:

प्रशिक्षण प्रक्रिया के दौरान प्रतीक आधारीकरण कब और कहां उद्भूत होता है?
इस उद्भव को कौन सी तंत्र संचालित करती है?
क्या यह तंत्र सार्वभौमिक है?

समस्या की महत्ता

प्रतीक आधारीकरण समस्या संज्ञानात्मक विज्ञान और कृत्रिम बुद्धिमत्ता की मौलिक समस्याओं में से एक है। यह समझना कि भाषा मॉडल अमूर्त प्रतीकों को वास्तविक दुनिया से कैसे जोड़ना सीखते हैं, महत्वपूर्ण है:

मॉडल की विश्वसनीयता और व्याख्यात्मकता में सुधार के लिए
भ्रम (hallucination) घटनाओं को कम करने के लिए
बेहतर बहु-मोडल AI प्रणाली बनाने के लिए

मौजूदा विधियों की सीमाएं

मौजूदा अनुसंधान मुख्य रूप से निम्नलिखित सीमाओं से ग्रस्त है:

यांत्रिक विश्लेषण की कमी: अधिकांश अनुसंधान केवल अंतिम प्रदर्शन के सहसंबंध विश्लेषण पर ध्यान केंद्रित करते हैं, आंतरिक तंत्र की गहन खोज नहीं करते
प्रशिक्षण गतिशीलता की उपेक्षा: प्रशिक्षण प्रक्रिया के दौरान आधारीकरण क्षमता के विकास पथ का व्यवस्थित अध्ययन नहीं
परिभाषा अस्पष्टता: आधारीकरण को दृश्य-पाठ संकेतों के सांख्यिकीय सहसंबंध के समान मानना, Harnad (1990) की कारणात्मक लिंकेज की शास्त्रीय परिभाषा से विचलित होना

अनुसंधान नवाचार

यह पेपर न्यूनतम परीक्षण मंच का निर्माण करके, कारणात्मक हस्तक्षेप और यांत्रिक विश्लेषण विधियों का उपयोग करके, प्रतीक आधारीकरण के उद्भव तंत्र का व्यवस्थित रूप से अध्ययन करता है।

मूल योगदान

नियंत्रित मूल्यांकन ढांचा का निर्माण: पर्यावरण टोकन (⟨ENV⟩) और भाषा टोकन (⟨LAN⟩) के अलगाव के साथ परीक्षण मंच डिजाइन किया, यह सुनिश्चित करते हुए कि पत्राचार संबंध सीखने के माध्यम से प्राप्त होना चाहिए
आधारीकरण के यांत्रिक कार्यान्वयन की खोज: प्रमाणित किया कि प्रतीक आधारीकरण मध्य-स्तरीय एकत्रीकरण तंत्र (aggregate mechanism) के माध्यम से कार्यान्वित होता है
क्रॉस-आर्किटेक्चर सार्वभौमिकता के प्रमाण: ट्रांसफॉर्मर और स्टेट स्पेस मॉडल में आधारीकरण उद्भव देखा गया, लेकिन एकदिशात्मक LSTM में नहीं
कारणात्मक सत्यापन विधि की स्थापना: ध्यान सिर हस्तक्षेप प्रयोगों के माध्यम से एकत्रीकरण सिर की प्रतीक आधारीकरण में महत्वपूर्ण भूमिका को सत्यापित किया
सह-उपस्थिति सांख्यिकी से परे सीखने का प्रकटीकरण: प्रमाणित किया कि मॉडल द्वारा सीखा गया आधारीकरण संबंध पूरी तरह से सतही सह-उपस्थिति सांख्यिकी द्वारा समझाया नहीं जा सकता

विधि विवरण

कार्य परिभाषा

इनपुट: पर्यावरण टोकन (⟨ENV⟩) और भाषा टोकन (⟨LAN⟩) युक्त अनुक्रम आउटपुट: दिए गए पर्यावरण संदर्भ में संबंधित भाषा टोकन की भविष्यवाणी करना बाधा: पर्यावरण टोकन और भाषा टोकन विभिन्न शब्दावली सूचकांक का उपयोग करते हैं, मॉडल को उनके बीच पत्राचार सीखना चाहिए

डेटासेट निर्माण

1. बाल-निर्देशित भाषण (CHILDES)

पर्यावरण टोकन स्रोत: पर्यावरण विवरण, क्रिया परत, परिस्थिति परत एनोटेशन
भाषा टोकन स्रोत: मौखिक कथन प्रतिलेख

उदाहरण:

प्रशिक्षण: ⟨CHI⟩ takes book⟨ENV⟩ from mother ⟨CHI⟩ what's that ⟨MOT⟩ a book⟨LAN⟩ in it
परीक्षण: ⟨CHI⟩ asked for a new book⟨ENV⟩ ⟨CHI⟩ I love this [भविष्यवाणी: book⟨LAN⟩]

2. शीर्षक आधारीकरण संवाद (Visual Dialog)

पर्यावरण टोकन: MSCOCO छवि शीर्षक
भाषा टोकन: बहु-दौर प्रश्न-उत्तर जोड़ी

3. छवि आधारीकरण संवाद

पर्यावरण टोकन: जमे हुए DINOv2 ViT के माध्यम से निकाली गई छवि पैच एम्बेडिंग
भाषा टोकन: संवाद प्रतिलेख

मूल्यांकन प्रोटोकॉल

आधारीकरण सूचना लाभ (Grounding Information Gain)

मेल खाने वाली और गैर-मेल खाने वाली स्थितियों के तहत आश्चर्य में अंतर के रूप में परिभाषित:

$G_\theta(v) = \frac{1}{N}\sum_{n=1}^{N} \frac{1}{M}\sum_{u \neq v} [s_\theta(v^{\langle LAN \rangle} | c_n(u^{\langle ENV \rangle})) - s_\theta(v^{\langle LAN \rangle} | c_n(v^{\langle ENV \rangle}))]$

जहां $s_\theta(w|c) = -\log P_\theta(w|c)$ आश्चर्य है।

यांत्रिक विश्लेषण विधि

1. सार्थकता प्रवाह विश्लेषण (Saliency Flow Analysis)

प्रत्येक परत की सार्थकता मैट्रिक्स की गणना करना: $I_\ell = |\sum_h A_{h,\ell} \odot \frac{\partial L}{\partial A_{h,\ell}}|$

2. ट्यून किए गए लेंस जांच (Tuned Lens Probing)

मध्य-स्तरीय सक्रियण को अंतिम भविष्यवाणी स्थान में मैप करने के लिए एफाइन प्रोजेक्टर प्रशिक्षित करना।

3. कारणात्मक हस्तक्षेप प्रयोग

एकत्रीकरण सिर की पहचान: कम से कम 30% सार्थकता पर्यावरण टोकन से भविष्यवाणी स्थान तक प्रवाहित होने वाले ध्यान सिर
हस्तक्षेप विधि: पहचाने गए ध्यान सिर आउटपुट को शून्य पर सेट करना, प्रदर्शन परिवर्तन देखना

प्रयोग सेटअप

मॉडल आर्किटेक्चर

ट्रांसफॉर्मर: 4-परत, 12-परत, 18-परत GPT-2 शैली मॉडल
स्टेट स्पेस मॉडल: 4-परत, 12-परत Mamba-2 मॉडल
तुलना मॉडल: 4-परत एकदिशात्मक LSTM
बहु-मोडल मॉडल: DINOv2 आधारित दृश्य-भाषा मॉडल

प्रशिक्षण विवरण

आरंभीकरण: यादृच्छिक आरंभीकरण (पूर्व ज्ञान सुनिश्चित करने के लिए)
उद्देश्य फ़ंक्शन: मानक कारणात्मक भाषा मॉडलिंग
दोहराए गए प्रयोग: 5 यादृच्छिक बीज
चेकपॉइंट: प्रारंभिक प्रशिक्षण चरणों का घना नमूना

शब्दावली चयन

MacArthur-Bates संचार विकास पैमाने से 100 उच्च-आवृत्ति संज्ञाएं चुनी गईं, प्रत्येक शब्द के ⟨ENV⟩ और ⟨LAN⟩ रूपों की आवृत्ति कॉर्पस में ≥100 है।

प्रयोग परिणाम

मुख्य निष्कर्ष

1. व्यवहारिक स्तर के प्रमाण

ट्रांसफॉर्मर और Mamba-2: मेल खाने वाली स्थितियों में आश्चर्य गैर-मेल खाने वाली स्थितियों से काफी कम है
LSTM: दोनों स्थितियों में आश्चर्य में कोई महत्वपूर्ण अंतर नहीं
दृश्य संवाद: शीर्षक और छवि आधारीकरण सेटिंग दोनों में आधारीकरण प्रभाव देखा गया

2. सह-उपस्थिति सांख्यिकी से परे

आधारीकरण सूचना लाभ और सह-उपस्थिति सांख्यिकी के बीच R² मान प्रशिक्षण के प्रारंभ में बढ़ता है फिर घटता है
यह दर्शाता है कि मॉडल द्वारा सीखा गया आधारीकरण संबंध सरल सांख्यिकीय सह-उपस्थिति से परे है

3. यांत्रिक स्थानीयकरण

मध्य-परत केंद्रीकरण: आधारीकरण प्रभाव मुख्य रूप से परत 7-9 में दिखाई देता है
एकत्रीकरण तंत्र: विशिष्ट ध्यान सिर पर्यावरण टोकन से भाषा टोकन तक सूचना एकत्रीकरण को कार्यान्वित करते हैं

कारणात्मक सत्यापन परिणाम

चेकपॉइंट	एकत्रीकरण सिर संख्या	औसत परत	हस्तक्षेप आश्चर्य	नियंत्रण आश्चर्य	मूल आश्चर्य
5000	2.28	7.38	6.51***	6.39	6.38
10000	5.09	7.28	5.86***	5.29	5.30
20000	6.71	7.52	5.62***	4.76	4.77

***p < 0.001 पर महत्वपूर्ण अंतर को दर्शाता है

क्रॉस-मोडल सामान्यीकरण

LLaVA-1.5-7B जैसे बड़े VLM में भी समान एकत्रीकरण ध्यान सिर पैटर्न पाए गए, निष्कर्षों की सार्वभौमिकता को प्रमाणित करते हैं।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

प्रतीक आधारीकरण भाषा मॉडल में स्वतः उद्भूत हो सकता है, स्पष्ट पर्यवेक्षण के बिना
मध्य-परत एकत्रीकरण तंत्र आधारीकरण को कार्यान्वित करने की कुंजी है, विशिष्ट ध्यान सिर सूचना एकत्रीकरण के लिए जिम्मेदार हैं
आर्किटेक्चर निर्भरता: ट्रांसफॉर्मर और SSM आधारीकरण उद्भव का समर्थन करते हैं, लेकिन LSTM नहीं करता
सतही सांख्यिकी से परे: मॉडल द्वारा सीखा गया आधारीकरण संबंध गहन शब्दार्थ विशेषताओं को धारण करता है

सैद्धांतिक योगदान

प्रतीक आधारीकरण के दार्शनिक मूल को पुनः परीक्षा करता है, सहसंबंध से कारणात्मकता तक यांत्रिक प्रमाण प्रदान करता है, "संयोजनवादी प्रणालियों में कोई आंतरिक प्रतीक संरचना नहीं है" के विचार को चुनौती देता है।

व्यावहारिक अनुप्रयोग मूल्य

भ्रम का पता लगाना: एकत्रीकरण सिर गतिविधि की निगरानी के माध्यम से मॉडल विश्वसनीयता की भविष्यवाणी करना
ध्यान नियंत्रण: भ्रम को कम करने के लिए डिकोडिंग समय रणनीति प्रदान करना
मॉडल डिजाइन: अधिक विश्वसनीय बहु-मोडल प्रणाली बनाने के लिए मार्गदर्शन प्रदान करना

सीमाएं

स्केल सीमा: बड़े VLM में एकत्रीकरण सिर का व्यवस्थित पता लगाना और हस्तक्षेप अभी भी चुनौतीपूर्ण है
कम्प्यूटेशनल जटिलता: दृश्य टोकन संख्या में भारी वृद्धि विश्लेषण जटिलता को बढ़ाती है
सामान्यीकरण: अधिक कार्यों और डोमेन में निष्कर्षों की सार्वभौमिकता को सत्यापित करने की आवश्यकता है

भविष्य की दिशाएं

बड़े VLM में एकत्रीकरण सिर की स्वचालित पहचान विधि विकसित करना
कम्प्यूटेशनल रूप से व्यावहार्य कारणात्मक हस्तक्षेप सत्यापन योजना डिजाइन करना
अन्य संज्ञानात्मक क्षमताओं में आधारीकरण तंत्र की भूमिका की खोज करना

गहन मूल्यांकन

शक्तियां

विधि नवाचार मजबूत है: पर्यावरण-भाषा टोकन अलगाव का प्रयोगात्मक डिजाइन चतुर है, कारणात्मक अनुमान की वैधता सुनिश्चित करता है
विश्लेषण गहराई पर्याप्त है: व्यवहार से तंत्र तक बहु-स्तरीय विश्लेषण, पूर्ण प्रमाण श्रृंखला प्रदान करता है
क्रॉस-आर्किटेक्चर सत्यापन: कई मॉडल आर्किटेक्चर में निष्कर्षों को सत्यापित करता है, निष्कर्षों की सार्वभौमिकता को बढ़ाता है
कारणात्मक सत्यापन कठोर है: हस्तक्षेप प्रयोगों के माध्यम से मजबूत कारणात्मक प्रमाण प्रदान करता है

कमियां

शब्दावली सीमा सीमित है: केवल 100 संज्ञाओं तक सीमित, पूर्ण भाषा घटना का प्रतिनिधित्व करने के लिए अपर्याप्त हो सकता है
कार्य सरलीकरण: प्रयोगात्मक कार्य अपेक्षाकृत सरल हैं, वास्तविक भाषा समझ से अंतर है
बड़े पैमाने पर सत्यापन अपर्याप्त: वास्तविक बड़े पैमाने पर मॉडल पर सत्यापन सीमित है

प्रभाव मूल्यांकन

शैक्षणिक मूल्य: प्रतीक आधारीकरण अनुसंधान के लिए नया यांत्रिक दृष्टिकोण प्रदान करता है
व्यावहारिक मूल्य: मॉडल विश्वसनीयता में सुधार के लिए विशिष्ट तकनीकी पथ प्रदान करता है
पुनरुत्पादनीयता: विस्तृत कार्यान्वयन विवरण और कोड लिंक प्रदान करता है

लागू परिदृश्य

बहु-मोडल AI प्रणाली की व्याख्यात्मकता विश्लेषण
भाषा मॉडल भ्रम का पता लगाना और शमन
संज्ञानात्मक विज्ञान में प्रतीक आधारीकरण तंत्र की कम्प्यूटेशनल मॉडलिंग
शैक्षणिक AI में अवधारणा सीखने की तंत्र अनुसंधान

संदर्भ

Harnad, S. (1990). The symbol grounding problem. Physica D, 42(1-3), 335-346.
Bick, A., Xing, E. P., & Gu, A. (2025). Understanding the skill gap in recurrent models: The role of the gather-and-aggregate mechanism.
Wang, L., et al. (2023). Label words are anchors: An information flow perspective for understanding in-context learning.
Belrose, N., et al. (2023). Eliciting latent predictions from transformers with the tuned lens.

यह पेपर कठोर प्रयोगात्मक डिजाइन और गहन यांत्रिक विश्लेषण के माध्यम से, भाषा मॉडल में प्रतीक आधारीकरण के उद्भव तंत्र को समझने के लिए महत्वपूर्ण योगदान प्रदान करता है। इसके निष्कर्ष न केवल सैद्धांतिक मूल्य रखते हैं, बल्कि अधिक विश्वसनीय AI प्रणाली बनाने के लिए व्यावहारिक मार्गदर्शन भी प्रदान करते हैं।