The Mechanistic Emergence of Symbol Grounding in Language Models
Wu, Ma, Luo et al.
Symbol grounding (Harnad, 1990) describes how symbols such as words acquire their meanings by connecting to real-world sensorimotor experiences. Recent work has shown preliminary evidence that grounding may emerge in (vision-)language models trained at scale without using explicit grounding objectives. Yet, the specific loci of this emergence and the mechanisms that drive it remain largely unexplored. To address this problem, we introduce a controlled evaluation framework that systematically traces how symbol grounding arises within the internal computations through mechanistic and causal analysis. Our findings show that grounding concentrates in middle-layer computations and is implemented through the aggregate mechanism, where attention heads aggregate the environmental ground to support the prediction of linguistic forms. This phenomenon replicates in multimodal dialogue and across architectures (Transformers and state-space models), but not in unidirectional LSTMs. Our results provide behavioral and mechanistic evidence that symbol grounding can emerge in language models, with practical implications for predicting and potentially controlling the reliability of generation.
يصف تأسيس الرموز (Symbol grounding) كيفية اكتساب الرموز (مثل المفردات) للمعنى من خلال ربطها بالخبرات الحسية الحركية في العالم الحقيقي. تشير الأبحاث الحديثة إلى أن القدرة على التأسيس قد تظهر بشكل تلقائي في نماذج اللغة (البصرية) المدربة على نطاق واسع، دون الحاجة إلى أهداف تأسيس صريحة. ومع ذلك، لا تزال الآليات المحددة والمحركات الكامنة وراء هذا الظهور غير مستكشفة بشكل أساسي. لمعالجة هذه المشكلة، تقدم هذه الورقة إطار تقييم محكوم يتتبع بشكل منهجي كيفية ظهور تأسيس الرموز في الحسابات الداخلية من خلال التحليل الآلي والسببي. تكتشف الدراسة أن التأسيس يتركز في الحسابات الوسيطة ويتحقق من خلال آلية التجميع، حيث تجمع رؤوس الانتباه السياق البيئي لدعم التنبؤ بالأشكال اللغوية. تم تكرار هذه الظاهرة في الحوار متعدد الأنماط وفي معماريات مختلفة (Transformers والنماذج ذات الفضاء الحالة)، لكنها لم تظهر في LSTM أحادي الاتجاه.
تعتبر مسألة تأسيس الرموز من المسائل الأساسية في العلوم المعرفية والذكاء الاصطناعي. يعتبر فهم كيفية تعلم نماذج اللغة ربط الرموز المجردة بالعالم الحقيقي أمراً حاسماً لـ:
الإدخال: تسلسل يحتوي على رموز البيئة (⟨ENV⟩) ورموز اللغة (⟨LAN⟩)
الإخراج: التنبؤ برمز اللغة المقابل في سياق بيئي معين
القيود: استخدام رموز البيئة واللغة فهارس مفردات مختلفة، يجب على النموذج تعلم المراسلات بينها
مصدر رموز البيئة: أوصاف البيئة، طبقات الإجراءات، تعليقات الحالة
مصدر رموز اللغة: نسخ الكلام الشفوي
مثال:
التدريب: ⟨CHI⟩ takes book⟨ENV⟩ from mother ⟨CHI⟩ what's that ⟨MOT⟩ a book⟨LAN⟩ in it
الاختبار: ⟨CHI⟩ asked for a new book⟨ENV⟩ ⟨CHI⟩ I love this [التنبؤ: book⟨LAN⟩]
إعادة فحص الجذور الفلسفية لتأسيس الرموز، وتوفير أدلة آلية من الارتباط إلى السببية، والطعن في وجهة النظر القائلة بأن "الأنظمة الاتصالية تفتقر إلى البنية الرمزية الجوهرية".
Harnad, S. (1990). The symbol grounding problem. Physica D, 42(1-3), 335-346.
Bick, A., Xing, E. P., & Gu, A. (2025). Understanding the skill gap in recurrent models: The role of the gather-and-aggregate mechanism.
Wang, L., et al. (2023). Label words are anchors: An information flow perspective for understanding in-context learning.
Belrose, N., et al. (2023). Eliciting latent predictions from transformers with the tuned lens.
تساهم هذه الورقة من خلال تصميم تجريبي صارم وتحليل آلي عميق في توفير مساهمة مهمة لفهم آليات ظهور تأسيس الرموز في نماذج اللغة. لا تقتصر النتائج على القيمة النظرية فحسب، بل توفر أيضاً إرشادات عملية لبناء أنظمة ذكاء اصطناعي أكثر موثوقية.