Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
Marconato, Bortolotti, van Krieken et al.
Neuro-symbolic (NeSy) AI aims to develop deep neural networks whose predictions comply with prior knowledge encoding, e.g. safety or structural constraints. As such, it represents one of the most promising avenues for reliable and trustworthy AI. The core idea behind NeSy AI is to combine neural and symbolic steps: neural networks are typically responsible for mapping low-level inputs into high-level symbolic concepts, while symbolic reasoning infers predictions compatible with the extracted concepts and the prior knowledge. Despite their promise, it was recently shown that - whenever the concepts are not supervised directly - NeSy models can be affected by Reasoning Shortcuts (RSs). That is, they can achieve high label accuracy by grounding the concepts incorrectly. RSs can compromise the interpretability of the model's explanations, performance in out-of-distribution scenarios, and therefore reliability. At the same time, RSs are difficult to detect and prevent unless concept supervision is available, which is typically not the case. However, the literature on RSs is scattered, making it difficult for researchers and practitioners to understand and tackle this challenging problem. This overview addresses this issue by providing a gentle introduction to RSs, discussing their causes and consequences in intuitive terms. It also reviews and elucidates existing theoretical characterizations of this phenomenon. Finally, it details methods for dealing with RSs, including mitigation and awareness strategies, and maps their benefits and limitations. By reformulating advanced material in a digestible form, this overview aims to provide a unifying perspective on RSs to lower the bar to entry for tackling them. Ultimately, we hope this overview contributes to the development of reliable NeSy and trustworthy AI models.
academic
Символическое обоснование в нейро-символическом ИИ: Мягкое введение в ярлыки рассуждений
Название: Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts
Авторы: Emanuele Marconato, Samuele Bortolotti, Emile van Krieken, Paolo Morettin, Elena Umili, Antonio Vergari, Efthymia Tsamoura, Andrea Passerini, Stefano Teso
Нейро-символический (NeSy) ИИ направлен на разработку глубоких нейронных сетей, предсказания которых соответствуют априорным знаниям (таким как ограничения безопасности или структурные ограничения), что представляет один из наиболее перспективных путей развития надежного и доверительного ИИ. Основная идея NeSy ИИ заключается в объединении нейронных и символических этапов: нейронные сети отвечают за отображение низкоуровневых входных данных в высокоуровневые символические концепции, тогда как символическое рассуждение выводит предсказания, совместимые с концепциями и априорными знаниями. Несмотря на многообещающие перспективы, недавние исследования показали, что когда концепции не имеют прямого контроля, модели NeSy могут страдать от ярлыков рассуждений (Reasoning Shortcuts, RS). То есть они могут достичь высокой точности метки посредством неправильного обоснования концепций. RS могут нарушить интерпретируемость объяснений модели и производительность в сценариях вне распределения, тем самым влияя на надежность. Одновременно RS трудно обнаружить и предотвратить, если нет контроля концепций (который обычно недоступен).
Основная проблема, которую решает это исследование, — это отказ символического обоснования (Symbol Grounding) в нейро-символическом ИИ, конкретно проявляющийся в феномене ярлыков рассуждений (Reasoning Shortcuts).
Кризис интерпретируемости: Хотя модели NeSy обещают обеспечить интерпретируемый процесс принятия решений, RS приводят к несоответствию между изученными концепциями и ожидаемой семантикой, серьезно влияя на достоверность объяснений
Ограниченная способность к обобщению: Неправильное обоснование концепций приводит к плохой производительности модели в сценариях вне распределения, ограничивая практическую ценность
Скрытые угрозы безопасности: В высокорисковых приложениях (таких как автономное вождение) RS могут привести к катастрофическим последствиям
Статья направлена на предоставление единого взгляда на проблему RS, снижение барьера входа в эту область и содействие разработке надежных моделей NeSy ИИ.
Нейро-символические предсказатели (NeSy Predictors): Учитывая пространство входных данных X, пространство концепций C, пространство меток Y и априорные знания K, предсказатель NeSy изучает отображение, которое обеспечивает как точность предсказаний, так и соответствие ограничениям знаний.
Описывает, как истинные концепции отображаются в изученные концепции.
Ярлыки рассуждений: Когда предсказатель NeSy достигает оптимального правдоподобия, но отображение концепций αf ≠ id (тождественное отображение), существуют ярлыки рассуждений.
Теорема 4.4: Предсказатель NeSy достигает максимального правдоподобия тогда и только тогда, когда:
(β ∘ f)(X) = (β* ∘ f*)(X)
Следствие 4.5 (Неидентифицируемость): Когда слой рассуждений β* не является инъективным, существуют множественные экстракторы концепций f ≠ f*, которые также достигают оптимального правдоподобия.
Теорема 4.10 (Подсчет детерминированных RS): Количество детерминированных ярлыков рассуждений равно:
Теорема 4.15 (Неограниченный риск RS): Когда KC(K; p*) < |C|-1, существуют экстракторы концепций, при которых риск метки равен нулю, но риск концепции стремится к бесконечности.
В нейро-символическом обучении с подкреплением RS проявляются как переименование концепций, не влияя на производительность одной задачи, но нарушая способность к обобщению на несколько задач.
Большие языковые модели могут демонстрировать феномен "символических галлюцинаций", аналогичный RS в NeSy, но требующий расширения существующей теоретической базы.
Статья цитирует большое количество связанных работ, включая:
Фундаментальные теоретические исследования нейро-символического ИИ
Модели концептуальных узких мест и объяснимый ИИ
Причинное представление обучения и теория идентифицируемости
Исследования символического обоснования в когнитивной науке
Эта статья предоставляет комплексный и глубокий анализ проблемы символического обоснования в нейро-символическом ИИ, имеющий важное значение для понимания и решения проблем надежности моделей NeSy. Хотя это в основном обзорная работа, ее теоретический вклад и практическое руководство весьма значительны.