2025-11-14T13:10:11.333946

Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts

Marconato, Bortolotti, van Krieken et al.
Neuro-symbolic (NeSy) AI aims to develop deep neural networks whose predictions comply with prior knowledge encoding, e.g. safety or structural constraints. As such, it represents one of the most promising avenues for reliable and trustworthy AI. The core idea behind NeSy AI is to combine neural and symbolic steps: neural networks are typically responsible for mapping low-level inputs into high-level symbolic concepts, while symbolic reasoning infers predictions compatible with the extracted concepts and the prior knowledge. Despite their promise, it was recently shown that - whenever the concepts are not supervised directly - NeSy models can be affected by Reasoning Shortcuts (RSs). That is, they can achieve high label accuracy by grounding the concepts incorrectly. RSs can compromise the interpretability of the model's explanations, performance in out-of-distribution scenarios, and therefore reliability. At the same time, RSs are difficult to detect and prevent unless concept supervision is available, which is typically not the case. However, the literature on RSs is scattered, making it difficult for researchers and practitioners to understand and tackle this challenging problem. This overview addresses this issue by providing a gentle introduction to RSs, discussing their causes and consequences in intuitive terms. It also reviews and elucidates existing theoretical characterizations of this phenomenon. Finally, it details methods for dealing with RSs, including mitigation and awareness strategies, and maps their benefits and limitations. By reformulating advanced material in a digestible form, this overview aims to provide a unifying perspective on RSs to lower the bar to entry for tackling them. Ultimately, we hope this overview contributes to the development of reliable NeSy and trustworthy AI models.
academic

Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts

基本信息

  • 论文ID: 2510.14538
  • 标题: Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
  • 作者: Emanuele Marconato, Samuele Bortolotti, Emile van Krieken, Paolo Morettin, Elena Umili, Antonio Vergari, Efthymia Tsamoura, Andrea Passerini, Stefano Teso
  • 分类: cs.AI cs.LG
  • 发表时间: 2025年10月17日(预印本)
  • 论文链接: https://arxiv.org/abs/2510.14538

摘要

神经符号(NeSy)AI旨在开发预测结果符合先验知识编码(如安全或结构约束)的深度神经网络,代表了可靠和可信AI的最有前景的途径之一。NeSy AI的核心思想是结合神经和符号步骤:神经网络负责将低级输入映射到高级符号概念,而符号推理则推断与提取概念和先验知识兼容的预测。尽管前景广阔,但最近研究表明,当概念没有直接监督时,NeSy模型可能受到推理快捷方式(Reasoning Shortcuts, RSs)的影响。即它们可以通过错误地基础概念来实现高标签准确性。RSs可能损害模型解释的可解释性、分布外场景的性能,因此影响可靠性。同时,除非有概念监督(通常不可用),否则RSs难以检测和预防。

研究背景与动机

核心问题

本研究要解决的核心问题是**符号基础(Symbol Grounding)**在神经符号AI中的失效问题,具体表现为推理快捷方式(Reasoning Shortcuts)现象。

问题重要性

  1. 可解释性危机:NeSy模型虽然承诺提供可解释的决策过程,但RSs使得学到的概念与预期语义不匹配,严重影响解释的可信度
  2. 泛化能力受限:错误的概念基础导致模型在分布外场景中表现不佳,限制了实际应用价值
  3. 安全性隐患:在高风险应用场景(如自动驾驶)中,RSs可能导致灾难性后果

现有方法局限性

  1. 文献分散:关于RSs的研究分散在不同论文中,缺乏统一的理论框架
  2. 检测困难:RSs在训练集上不影响标签准确性,传统评估方法难以发现
  3. 缓解策略有限:现有缓解方法要么需要大量概念标注,要么缺乏理论保证

研究动机

论文旨在提供RSs问题的统一视角,降低该领域的入门门槛,促进可靠NeSy AI模型的发展。

核心贡献

  1. 统一理论框架:首次系统性地整合了RSs相关的分散文献,提供了统一的理论视角
  2. 数学形式化:从可识别性(identifiability)和统计学习两个角度对RSs进行了严格的数学刻画
  3. 全面分类法:对现有的RSs缓解和感知策略进行了系统分类和比较分析
  4. 扩展讨论:探讨了RSs在强化学习、基础模型等新兴领域的表现和挑战
  5. 实用指导:提供了RSs诊断、预防和处理的实用方法和工具

方法详解

任务定义

神经符号预测器(NeSy Predictors):给定输入空间X、概念空间C、标签空间Y和先验知识K,NeSy预测器学习一个映射,使预测结果既准确又符合知识约束。

核心架构

NeSy预测器包含两个主要组件:

  1. 概念提取器:神经网络f: X → ΔC,将输入映射到概念分布
  2. 推理层:符号推理β: ΔC → ΔY,基于概念和知识K推断标签

四种主要架构

1. 概率神经符号预测器(PNSPs)

p(y|x;K) = (1/Zx) ∑c 1{(c,y) |= K} p(c|x)

通过概率逻辑实现推理,确保预测符合知识约束。

2. 语义损失(Semantic Loss)

SL(pθ, (x,y), K) = -log ∑c 1{(c,y) |= K} pθ(c|x)

将知识转换为可微分的惩罚项,在训练中强制一致性。

3. 逻辑张量网络(LTN)

使用模糊逻辑将布尔知识转换为实值函数:

L(p,D,K) = 1 - (1/|D|) ∑(x,y)∈D TK(p(C|x), 1{Y=y})

4. 溯因学习(ABL)

通过逻辑溯因生成伪标签:

ĉ = argmin d(c̄, c') s.t. (c',y) |= K

推理快捷方式的形式化定义

概念重映射分布

αf(g) := Ex∼p*(X|g)[f(x)]

描述地面真实概念如何被学习到的概念映射。

推理快捷方式:当NeSy预测器达到最优似然但概念映射αf ≠ id(恒等映射)时,即存在推理快捷方式。

理论分析

可识别性视角

定理4.4:NeSy预测器达到最大似然当且仅当:

(β ∘ f)(X) = (β* ∘ f*)(X)

推论4.5(不可识别性):当推理层β不是单射时,存在多个概念提取器f ≠ f同样达到最优似然。

定理4.10(确定性RSs计数):确定性推理快捷方式的数量为:

∑α∈Vert(AF) 1{∧g∈supp(G)(β* ∘ α)(g) = β*(g)} - 1

统计学习视角

知识复杂度

KC(K; p*) := Ey∼p*(Y)[∑c∈C 1{(c,y) ≠|= K}]

定理4.15(无界RSs风险):当KC(K; p*) < |C|-1时,存在概念提取器使得标签风险为0但概念风险趋于无穷。

缓解策略分析

监督策略

  1. 概念监督:直接提供概念标注,效果最佳但成本高
  2. 多任务学习:通过联合训练多个NeSy任务增强知识约束

无监督策略

  1. 重构学习:通过重构损失防止概念坍塌
  2. 对比学习:鼓励相似输入产生相同概念
  3. 熵最大化:促进概念分布的均匀性
  4. 架构解耦:独立处理不同对象的概念

感知策略

  1. BEARS:通过集成学习构建RS感知模型
  2. NeSyDM:使用扩散模型超越独立性假设

实验验证

基准数据集

  • MNIST-Add:数字加法任务
  • BDD-OIA:自动驾驶场景
  • Kandinsky:抽象视觉推理

主要发现

  1. RSs普遍存在:在多个基准数据集上都观察到RSs现象
  2. 缓解效果差异:概念监督效果最佳,无监督方法效果有限
  3. 架构无关性:不同NeSy架构都受RSs影响

诊断工具

  • countrss工具:通过模型计数估算RSs数量
  • 概念坍塌指标:量化概念质量下降程度

扩展应用

强化学习中的RSs

在神经符号强化学习中,RSs表现为概念重命名,虽不影响单任务性能但损害多任务泛化能力。

基础模型中的RSs

大语言模型可能存在"符号幻觉"现象,类似于NeSy中的RSs,但需要扩展现有理论框架。

概念瓶颈模型中的联合RSs

当推理层也需要学习时,出现联合推理快捷方式(Joint RSs),问题更加复杂。

结论与讨论

主要结论

  1. RSs是NeSy AI中的根本性挑战,源于符号基础问题
  2. 理论分析表明RSs在一般情况下不可避免
  3. 现有缓解策略各有优缺点,需要根据应用场景选择

局限性

  1. 理论假设:部分理论结果基于较强的假设条件
  2. 实用性差距:理论保证与实际应用之间存在差距
  3. 计算复杂性:RSs检测和缓解的计算成本较高

未来方向

  1. 更强缓解策略:开发理论保证与实用性兼备的方法
  2. 自动任务构造:自动生成有助于消除RSs的多任务学习设置
  3. 大规模基准:构建更具挑战性的真实世界NeSy数据集

深度评价

优点

  1. 理论深度:提供了RSs问题的严格数学刻画和理论分析
  2. 全面性:系统整合了分散的相关研究,形成统一框架
  3. 实用价值:提供了具体的诊断工具和缓解策略
  4. 前瞻性:讨论了在新兴AI技术中的应用前景

不足

  1. 实验有限:主要集中在相对简单的基准数据集上
  2. 方法创新:更多是综述性工作,原创方法贡献有限
  3. 实用性:理论结果与实际应用的转化仍需进一步研究

影响力

  1. 学术价值:为NeSy AI研究提供了重要的理论基础
  2. 实用意义:对构建可靠AI系统具有指导价值
  3. 领域推动:有望促进符号基础和可解释AI的发展

适用场景

该研究特别适用于:

  • 需要高可解释性的AI应用
  • 安全关键系统的AI部署
  • 符号推理与神经网络结合的场景
  • 概念学习和知识整合任务

参考文献

论文引用了大量相关工作,主要包括:

  • 神经符号AI的基础理论研究
  • 概念瓶颈模型和可解释AI
  • 因果表示学习和可识别性理论
  • 符号基础问题的认知科学研究

这篇论文为神经符号AI中的符号基础问题提供了全面而深入的分析,对于理解和解决NeSy模型的可靠性问题具有重要价值。虽然主要是综述性工作,但其理论贡献和实用指导意义显著。