Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
Marconato, Bortolotti, van Krieken et al.
Neuro-symbolic (NeSy) AI aims to develop deep neural networks whose predictions comply with prior knowledge encoding, e.g. safety or structural constraints. As such, it represents one of the most promising avenues for reliable and trustworthy AI. The core idea behind NeSy AI is to combine neural and symbolic steps: neural networks are typically responsible for mapping low-level inputs into high-level symbolic concepts, while symbolic reasoning infers predictions compatible with the extracted concepts and the prior knowledge. Despite their promise, it was recently shown that - whenever the concepts are not supervised directly - NeSy models can be affected by Reasoning Shortcuts (RSs). That is, they can achieve high label accuracy by grounding the concepts incorrectly. RSs can compromise the interpretability of the model's explanations, performance in out-of-distribution scenarios, and therefore reliability. At the same time, RSs are difficult to detect and prevent unless concept supervision is available, which is typically not the case. However, the literature on RSs is scattered, making it difficult for researchers and practitioners to understand and tackle this challenging problem. This overview addresses this issue by providing a gentle introduction to RSs, discussing their causes and consequences in intuitive terms. It also reviews and elucidates existing theoretical characterizations of this phenomenon. Finally, it details methods for dealing with RSs, including mitigation and awareness strategies, and maps their benefits and limitations. By reformulating advanced material in a digestible form, this overview aims to provide a unifying perspective on RSs to lower the bar to entry for tackling them. Ultimately, we hope this overview contributes to the development of reliable NeSy and trustworthy AI models.
academic
Symbolgründung in Neuro-Symbolischer KI: Eine sanfte Einführung in Reasoning Shortcuts
Titel: Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
Autoren: Emanuele Marconato, Samuele Bortolotti, Emile van Krieken, Paolo Morettin, Elena Umili, Antonio Vergari, Efthymia Tsamoura, Andrea Passerini, Stefano Teso
Klassifizierung: cs.AI cs.LG
Veröffentlichungsdatum: 17. Oktober 2025 (Preprint)
Neuro-Symbolische (NeSy) KI zielt darauf ab, tiefe neuronale Netze zu entwickeln, deren Vorhersageergebnisse mit kodiertem Vorwissen (wie Sicherheits- oder Strukturbeschränkungen) übereinstimmen und stellt einen der vielversprechendsten Wege zu zuverlässiger und vertrauenswürdiger KI dar. Die Kernidee der NeSy-KI besteht darin, neuronale und symbolische Schritte zu kombinieren: Neuronale Netze sind für die Abbildung von Eingaben auf niedriger Ebene auf hochwertige symbolische Konzepte verantwortlich, während symbolisches Schlussfolgern Vorhersagen ableitet und extrahiert, die mit Konzepten und Vorwissen kompatibel sind. Trotz großer Aussichten zeigen neuere Forschungen, dass NeSy-Modelle durch Reasoning Shortcuts (RSs) beeinträchtigt werden können, wenn Konzepte nicht direkt überwacht werden. Das heißt, sie können hohe Labelgenauigkeit durch fehlerhafte Konzeptgründung erreichen. RSs können die Interpretierbarkeit von Modellerklärungen schädigen, die Leistung in außerverteilten Szenarien beeinträchtigen und damit die Zuverlässigkeit gefährden. Gleichzeitig sind RSs schwer zu erkennen und zu verhindern, es sei denn, es gibt Konzeptüberwachung (die normalerweise nicht verfügbar ist).
Das Kernproblem dieser Forschung ist das Versagen der Symbolgründung (Symbol Grounding) in der neuro-symbolischen KI, konkret manifestiert als das Phänomen der Reasoning Shortcuts (RSs).
Interpretierungskrise: Obwohl NeSy-Modelle interpretierbare Entscheidungsprozesse versprechen, führen RSs dazu, dass gelernte Konzepte nicht mit erwarteter Semantik übereinstimmen, was die Glaubwürdigkeit von Erklärungen ernsthaft beeinträchtigt
Begrenzte Verallgemeinerungsfähigkeit: Fehlerhafte Konzeptgründung führt zu schlechter Modellleistung in außerverteilten Szenarien und begrenzt den praktischen Anwendungswert
Sicherheitsrisiken: In hochriskanten Anwendungsszenarien (wie autonomes Fahren) können RSs zu katastrophalen Folgen führen
Das Papier zielt darauf ab, eine einheitliche Perspektive auf das RS-Problem zu bieten, die Einstiegshürde in diesem Bereich zu senken und die Entwicklung zuverlässiger NeSy-KI-Modelle zu fördern.
Einheitlicher theoretischer Rahmen: Systematische Integration der verstreuten Literatur zu RSs mit einheitlicher theoretischer Perspektive
Mathematische Formalisierung: Strenge mathematische Charakterisierung von RSs aus den Perspektiven Identifizierbarkeit und statistisches Lernen
Umfassende Taxonomie: Systematische Klassifizierung und vergleichende Analyse bestehender RS-Abschwächungs- und Wahrnehmungsstrategien
Erweiterte Diskussion: Untersuchung der Manifestation und Herausforderungen von RSs in aufstrebenden Bereichen wie Reinforcement Learning und Grundmodellen
Praktische Anleitung: Bereitstellung praktischer Methoden und Werkzeuge zur RS-Diagnose, -Prävention und -Behandlung
Neuro-Symbolische Prädiktoren (NeSy Predictors): Gegeben ein Eingaberaum X, Konzeptraum C, Labelraum Y und Vorwissen K, lernt ein NeSy-Prädiktor eine Abbildung, die Vorhersageergebnisse sowohl genau als auch konform mit Wissensbeschränkungen macht.
Beschreibt, wie Grund-Wahrheits-Konzepte auf gelernte Konzepte abgebildet werden.
Reasoning Shortcut: Wenn ein NeSy-Prädiktor optimale Wahrscheinlichkeit erreicht, aber die Konzeptabbildung αf ≠ id (Identitätsabbildung), existiert ein Reasoning Shortcut.
Satz 4.4: Ein NeSy-Prädiktor erreicht maximale Wahrscheinlichkeit dann und nur dann, wenn:
(β ∘ f)(X) = (β* ∘ f*)(X)
Korollar 4.5 (Nicht-Identifizierbarkeit): Wenn die Inferenzschicht β* nicht injektiv ist, existieren mehrere Konzepttextraktoren f ≠ f*, die gleichermaßen optimale Wahrscheinlichkeit erreichen.
Satz 4.15 (Unbegrenztes RS-Risiko): Wenn KC(K; p*) < |C|-1, existiert ein Konzeptextraktor mit Labelrisiko 0, aber Konzeptrisiko tendiert zu unendlich.
In neuro-symbolischem Reinforcement Learning manifestieren sich RSs als Konzept-Umbenennung, beeinträchtigen zwar nicht die Einzelaufgaben-Leistung, schädigen aber die Multi-Task-Verallgemeinerung.
Das Papier zitiert umfangreiche verwandte Arbeiten, hauptsächlich einschließlich:
Grundlagenforschung zur neuro-symbolischen KI-Theorie
Konzeptflaschenhalse und erklärbare KI
Kausale Repräsentationslernens und Identifizierbarkeitstheorie
Kognitionswissenschaftliche Forschung zum Symbolgründungsproblem
Dieses Papier bietet eine umfassende und tiefgreifende Analyse des Symbolgründungsproblems in der neuro-symbolischen KI und hat wichtigen Wert für das Verständnis und die Lösung von Zuverlässigkeitsproblemen in NeSy-Modellen. Obwohl es sich hauptsächlich um eine Übersichtsarbeit handelt, sind seine theoretischen Beiträge und praktischen Orientierungswerte erheblich.