2025-11-14T13:10:11.333946

Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts

Marconato, Bortolotti, van Krieken et al.

Neuro-symbolic (NeSy) AI aims to develop deep neural networks whose predictions comply with prior knowledge encoding, e.g. safety or structural constraints. As such, it represents one of the most promising avenues for reliable and trustworthy AI. The core idea behind NeSy AI is to combine neural and symbolic steps: neural networks are typically responsible for mapping low-level inputs into high-level symbolic concepts, while symbolic reasoning infers predictions compatible with the extracted concepts and the prior knowledge. Despite their promise, it was recently shown that - whenever the concepts are not supervised directly - NeSy models can be affected by Reasoning Shortcuts (RSs). That is, they can achieve high label accuracy by grounding the concepts incorrectly. RSs can compromise the interpretability of the model's explanations, performance in out-of-distribution scenarios, and therefore reliability. At the same time, RSs are difficult to detect and prevent unless concept supervision is available, which is typically not the case. However, the literature on RSs is scattered, making it difficult for researchers and practitioners to understand and tackle this challenging problem. This overview addresses this issue by providing a gentle introduction to RSs, discussing their causes and consequences in intuitive terms. It also reviews and elucidates existing theoretical characterizations of this phenomenon. Finally, it details methods for dealing with RSs, including mitigation and awareness strategies, and maps their benefits and limitations. By reformulating advanced material in a digestible form, this overview aims to provide a unifying perspective on RSs to lower the bar to entry for tackling them. Ultimately, we hope this overview contributes to the development of reliable NeSy and trustworthy AI models.

academic

تأسيس الرموز في الذكاء العصبي الرمزي: مقدمة لطيفة إلى اختصارات التفكير

المعلومات الأساسية

معرّف الورقة: 2510.14538
العنوان: Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
المؤلفون: Emanuele Marconato, Samuele Bortolotti, Emile van Krieken, Paolo Morettin, Elena Umili, Antonio Vergari, Efthymia Tsamoura, Andrea Passerini, Stefano Teso
التصنيف: cs.AI cs.LG
تاريخ النشر: 17 أكتوبر 2025 (نسخة أولية)
رابط الورقة: https://arxiv.org/abs/2510.14538

الملخص

يهدف الذكاء العصبي الرمزي (NeSy) إلى تطوير شبكات عصبية عميقة تتوافق نتائجها التنبؤية مع المعرفة المسبقة المشفرة (مثل قيود السلامة أو البنية)، مما يمثل أحد أكثر الطرق الواعدة للذكاء الموثوق والجدير بالثقة. تتمحور الفكرة الأساسية للذكاء العصبي الرمزي حول دمج الخطوات العصبية والرمزية: تتولى الشبكات العصبية مسؤولية تعيين المدخلات منخفضة المستوى إلى مفاهيم رمزية عالية المستوى، بينما يقوم الاستدلال الرمزي باستنتاج التنبؤات المتوافقة مع المفاهيم والمعرفة المسبقة. على الرغم من الآفاق الواعدة، أظهرت الأبحاث الحديثة أن نماذج NeSy قد تعاني من اختصارات التفكير (Reasoning Shortcuts, RSs) عندما لا تتوفر إشراف مباشر على المفاهيم. أي أنها قد تحقق دقة عالية في التسميات من خلال تأسيس مفاهيم خاطئة. قد تضر اختصارات التفكير بقابلية تفسير تفسيرات النموذج وأدائه في السيناريوهات خارج التوزيع، مما يؤثر على الموثوقية. في الوقت ذاته، يصعب كشف واختصارات التفكير ومنعها ما لم يكن هناك إشراف على المفاهيم (وهو عادة غير متاح).

خلفية البحث والدافع

المشكلة الأساسية

تتمثل المشكلة الأساسية التي يعالجها هذا البحث في فشل تأسيس الرموز (Symbol Grounding) في الذكاء العصبي الرمزي، والذي يتجلى بشكل محدد في ظاهرة اختصارات التفكير (Reasoning Shortcuts).

أهمية المشكلة

أزمة القابلية للتفسير: على الرغم من أن نماذج NeSy تعد بتوفير عمليات قرار قابلة للتفسير، فإن اختصارات التفكير تجعل المفاهيم المكتسبة غير متطابقة مع الدلالات المتوقعة، مما يؤثر بشدة على مصداقية التفسيرات
قدرة التعميم المحدودة: يؤدي التأسيس الخاطئ للمفاهيم إلى أداء سيئة للنموذج في السيناريوهات خارج التوزيع، مما يحد من القيمة العملية
مخاطر الأمان: في تطبيقات عالية المخاطر (مثل القيادة الذاتية)، قد تؤدي اختصارات التفكير إلى عواقب كارثية

حدود الطرق الموجودة

الأدبيات المشتتة: تنتشر الأبحاث المتعلقة باختصارات التفكير عبر أوراق مختلفة، وتفتقر إلى إطار نظري موحد
صعوبة الكشف: لا تؤثر اختصارات التفكير على دقة التسميات في مجموعة التدريب، مما يجعل طرق التقييم التقليدية غير قادرة على اكتشافها
استراتيجيات تخفيف محدودة: إما أن تتطلب الطرق الموجودة تعليقات مفاهيم كبيرة، أو تفتقر إلى ضمانات نظرية

دافع البحث

تهدف الورقة إلى توفير منظور موحد لمشكلة اختصارات التفكير، وخفض حاجز الدخول في هذا المجال، وتعزيز تطوير نماذج NeSy موثوقة.

المساهمات الأساسية

إطار نظري موحد: دمج منهجي للأدبيات المشتتة المتعلقة باختصارات التفكير لأول مرة، مع توفير منظور نظري موحد
الصياغة الرياضية: تحديد صارم لاختصارات التفكير من زاويتي القابلية للتحديد (identifiability) والتعلم الإحصائي
تصنيف شامل: تصنيف منهجي ومقارنة تحليلية لاستراتيجيات تخفيف واستشعار اختصارات التفكير الموجودة
النقاش الموسع: استكشاف أداء واختصارات التفكير والتحديات في المجالات الناشئة مثل التعلم المعزز والنماذج الأساسية
الإرشادات العملية: توفير طرق وأدوات عملية لتشخيص واختصارات التفكير ومنعها والتعامل معها

شرح الطريقة

تعريف المهمة

المتنبئات العصبية الرمزية (NeSy Predictors): بالنظر إلى فضاء الإدخال X، وفضاء المفاهيم C، وفضاء التسميات Y، والمعرفة المسبقة K، يتعلم المتنبئ العصبي الرمزي تعيينًا يجعل نتائج التنبؤ دقيقة وتتوافق مع قيود المعرفة.

البنية الأساسية

يتكون المتنبئ العصبي الرمزي من مكونين رئيسيين:

مستخرج المفاهيم: شبكة عصبية f: X → ΔC، تعيين المدخلات إلى توزيع المفاهيم
طبقة الاستدلال: استدلال رمزي β: ΔC → ΔY، استنتاج التسميات بناءً على المفاهيم والمعرفة K

أربع بنى رئيسية

1. المتنبئات العصبية الرمزية الاحتمالية (PNSPs)

p(y|x;K) = (1/Zx) ∑c 1{(c,y) |= K} p(c|x)

تنفيذ الاستدلال من خلال المنطق الاحتمالي، مما يضمن توافق التنبؤات مع قيود المعرفة.

2. الخسارة الدلالية (Semantic Loss)

SL(pθ, (x,y), K) = -log ∑c 1{(c,y) |= K} pθ(c|x)

تحويل المعرفة إلى حد عقوبة قابل للاشتقاق، مما يفرض الاتساق أثناء التدريب.

3. شبكات الموتر المنطقي (LTN)

استخدام المنطق الضبابي لتحويل المعرفة البوليانية إلى دوال ذات قيمة حقيقية:

L(p,D,K) = 1 - (1/|D|) ∑(x,y)∈D TK(p(C|x), 1{Y=y})

4. التعلم الاستدلالي (ABL)

توليد تسميات وهمية من خلال الاستدلال المنطقي:

ĉ = argmin d(c̄, c') s.t. (c',y) |= K

الصياغة الرسمية لاختصارات التفكير

توزيع إعادة تعيين المفاهيم:

αf(g) := Ex∼p*(X|g)[f(x)]

يصف كيفية تعيين المفاهيم الحقيقية الأرضية إلى المفاهيم المكتسبة.

اختصارات التفكير: عندما يحقق المتنبئ العصبي الرمزي احتمالية قصوى لكن تعيين المفاهيم αf ≠ id (التعيين المتطابق)، توجد اختصارات تفكير.

التحليل النظري

منظور القابلية للتحديد

النظرية 4.4: يحقق المتنبئ العصبي الرمزي احتمالية قصوى إذا وفقط إذا:

(β ∘ f)(X) = (β* ∘ f*)(X)

النتيجة 4.5 (عدم القابلية للتحديد): عندما لا تكون طبقة الاستدلال β* دالة حقنية، توجد عدة مستخرجات مفاهيم f ≠ f* تحقق احتمالية قصوى بالمثل.

النظرية 4.10 (عد اختصارات التفكير الحتمية): عدد اختصارات التفكير الحتمية هو:

∑α∈Vert(AF) 1{∧g∈supp(G)(β* ∘ α)(g) = β*(g)} - 1

منظور التعلم الإحصائي

تعقيد المعرفة:

KC(K; p*) := Ey∼p*(Y)[∑c∈C 1{(c,y) ≠|= K}]

النظرية 4.15 (خطر اختصارات التفكير غير المحدود): عندما يكون KC(K; p*) < |C|-1، توجد مستخرجات مفاهيم تحقق خطر تسمية صفري لكن خطر مفهوم يميل إلى اللانهاية.

تحليل استراتيجيات التخفيف

استراتيجيات الإشراف

الإشراف على المفاهيم: توفير تعليقات مفاهيم مباشرة، أفضل تأثير لكن تكلفة عالية
التعلم متعدد المهام: التدريب المشترك لعدة مهام NeSy لتعزيز قيود المعرفة

استراتيجيات بدون إشراف

تعلم إعادة البناء: منع انهيار المفاهيم من خلال خسارة إعادة البناء
التعلم المقارن: تشجيع المدخلات المتشابهة على إنتاج مفاهيم متطابقة
تعظيم الإنتروبيا: تعزيز التوزيع المنتظم لتوزيع المفاهيم
فك الاقتران المعماري: معالجة مفاهيم الكائنات المختلفة بشكل مستقل

استراتيجيات الاستشعار

BEARS: بناء نماذج استشعار اختصارات التفكير من خلال التعلم المجمع
NeSyDM: استخدام نماذج الانتشار للتغلب على افتراضات الاستقلالية

التحقق التجريبي

مجموعات البيانات المرجعية

MNIST-Add: مهمة إضافة الأرقام
BDD-OIA: سيناريوهات القيادة الذاتية
Kandinsky: الاستدلال البصري المجرد

النتائج الرئيسية

انتشار اختصارات التفكير: ملاحظة ظاهرة اختصارات التفكير عبر مجموعات بيانات معيارية متعددة
اختلاف تأثير التخفيف: الإشراف على المفاهيم له أفضل تأثير، والطرق بدون إشراف لها تأثير محدود
عدم الاعتماد على البنية: تتأثر جميع بنى NeSy المختلفة باختصارات التفكير

أدوات التشخيص

أداة countrss: تقدير عدد اختصارات التفكير من خلال عد النموذج
مؤشر انهيار المفاهيم: تحديد كمي لدرجة تدهور جودة المفاهيم

التطبيقات الموسعة

اختصارات التفكير في التعلم المعزز

في التعلم المعزز العصبي الرمزي، تتجلى اختصارات التفكير كإعادة تسمية المفاهيم، وبينما لا تؤثر على أداء المهمة الفردية، فإنها تضر بقدرة التعميم متعدد المهام.

اختصارات التفكير في النماذج الأساسية

قد تعاني نماذج اللغة الكبيرة من ظاهرة "الهلوسة الرمزية"، مشابهة لاختصارات التفكير في NeSy، لكن تتطلب توسيع الإطار النظري الموجود.

اختصارات التفكير المشتركة في نماذج اختناق المفاهيم

عندما تحتاج طبقة الاستدلال أيضًا إلى التعلم، تظهر اختصارات تفكير مشتركة (Joint RSs)، مما يجعل المشكلة أكثر تعقيدًا.

الخلاصة والنقاش

الاستنتاجات الرئيسية

اختصارات التفكير هي تحدٍ أساسي في الذكاء العصبي الرمزي، ينبع من مشكلة تأسيس الرموز
يشير التحليل النظري إلى أن اختصارات التفكير لا مفر منها في الحالات العامة
لكل استراتيجية تخفيف موجودة مزايا وعيوب، وتتطلب الاختيار بناءً على سيناريو التطبيق

القيود

الافتراضات النظرية: تستند بعض النتائج النظرية إلى افتراضات قوية نسبيًا
فجوة العملية: توجد فجوة بين الضمانات النظرية والتطبيق العملي
التعقيد الحسابي: تكلفة حسابية عالية نسبيًا لكشف واختصارات التفكير وتخفيفها

الاتجاهات المستقبلية

استراتيجيات تخفيف أقوى: تطوير طرق تجمع بين الضمانات النظرية والعملية
بناء المهام التلقائي: توليد تلقائي لإعدادات التعلم متعدد المهام التي تساعد على القضاء على اختصارات التفكير
معايير واسعة النطاق: بناء مجموعات بيانات NeSy أكثر تحديًا من العالم الحقيقي

التقييم المتعمق

المزايا

العمق النظري: توفير تحديد رياضي صارم وتحليل نظري لمشكلة اختصارات التفكير
الشمولية: دمج منهجي للأبحاث ذات الصلة المشتتة، مما يشكل إطارًا موحدًا
القيمة العملية: توفير أدوات تشخيص محددة واستراتيجيات تخفيف
الاستشراف: مناقشة آفاق التطبيق في تقنيات الذكاء الاصطناعي الناشئة

أوجه القصور

التجارب المحدودة: تركز بشكل أساسي على مجموعات بيانات معيارية نسبيًا بسيطة
الابتكار في الطرق: عمل استقصائي في الغالب، مع مساهمات محدودة في الطرق الأصلية
العملية: لا تزال هناك حاجة إلى مزيد من البحث حول تحويل النتائج النظرية إلى تطبيقات عملية

التأثير

القيمة الأكاديمية: توفير أساس نظري مهم لأبحاث الذكاء العصبي الرمزي
الأهمية العملية: قيمة إرشادية لبناء أنظمة ذكاء اصطناعي موثوقة
دفع المجال: من المتوقع أن يعزز تطوير تأسيس الرموز والذكاء الاصطناعي القابل للتفسير

السيناريوهات المطبقة

يكون هذا البحث مفيدًا بشكل خاص في:

تطبيقات الذكاء الاصطناعي التي تتطلب قابلية عالية للتفسير
نشر الذكاء الاصطناعي في الأنظمة الحرجة للسلامة
السيناريوهات التي تجمع بين الاستدلال الرمزي والشبكات العصبية
مهام التعلم المفاهيمي وتكامل المعرفة

المراجع

تستشهد الورقة بعدد كبير من الأعمال ذات الصلة، وتشمل بشكل أساسي:

أبحاث النظرية الأساسية للذكاء العصبي الرمزي
نماذج اختناق المفاهيم والذكاء الاصطناعي القابل للتفسير
التعلم التمثيلي السببي ونظرية القابلية للتحديد
أبحاث العلوم المعرفية حول مشكلة تأسيس الرموز

توفر هذه الورقة تحليلًا شاملًا وعميقًا لمشكلة تأسيس الرموز في الذكاء العصبي الرمزي، وتتمتع بقيمة مهمة لفهم وحل مشاكل موثوقية نماذج NeSy. على الرغم من أنها عمل استقصائي بشكل أساسي، إلا أن مساهماتها النظرية وقيمتها الإرشادية العملية كبيرة.