Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
Название: Probabilistic Explanations for Linear Models
Авторы: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
В данной работе исследуется проблема вычисления "достаточных причин" в формальной интерпретируемости ИИ (Formal XAI). Для заданной модели M и входного экземпляра x достаточная причина — это подмножество S признаков x такое, что для любого экземпляра z, совпадающего с x на признаках из S, выполняется M(x)=M(z). Для уменьшения размера достаточных причин авторы рассматривают вероятностную релаксацию: требуется, чтобы вероятность M(x)=M(z) для случайного экземпляра z, совпадающего с x на заданном наборе признаков, была не менее δ∈(0,1]. Вычисление малых δ-достаточных причин (δ-SRs) теоретически сложно, даже для "интерпретируемых" моделей, таких как деревья решений, существуют сильные результаты о неприближаемости. В работе предложена концепция (δ,ε)-SR, являющаяся простой релаксацией δ-SRs, и доказано, что такие объяснения могут быть эффективно вычислены на линейных моделях.
Основная проблема: Как обеспечить объяснения решений моделей машинного обучения с математическими гарантиями малого размера. Традиционные достаточные причины требуют 100% определённости, но это часто приводит к чрезмерно большим объяснениям, непригодным для понимания человеком.
Значимость проблемы:
Miller (1956) показал, что объяснения с более чем 9 признаками могут быть слишком большими для человека
Эмпирические исследования показывают, что объяснения должны быть лаконичными (Narayanan et al., 2018; Lage et al., 2019)
В практических приложениях пользователи больше заботятся о размере объяснения, чем о малых различиях в вероятностных гарантиях
Ограничения существующих методов:
Вычисление минимальных δ-SRs является NP-трудным даже для деревьев решений
Для линейных моделей точное вычисление вероятности #P-трудно
Существуют сильные результаты о неприближаемости: невозможно получить хорошие коэффициенты приближения за полиномиальное время
Исследовательская мотивация:
Пользователи более чувствительны к размеру объяснения, чем к малым изменениям вероятностных гарантий
Необходимо найти баланс между теоретической разрешимостью и практичностью
Специальная структура линейных моделей может допускать эффективные алгоритмы
Доказана разрешимость на линейных моделях: предложен алгоритм полиномиального времени для вычисления (δ,ε)-min-SR с временем выполнения Õ(n/ε²δ²)
Установлены результаты теоретического разделения: доказано, что проблема остаётся сложной на деревьях решений, что подчёркивает особенность линейных моделей
Доказана эквивалентность локальных минимумов: для линейных моделей каждая локально минимальная δ-SR является подмножественно минимальной δ-SR
Анализ зазоров приближения: доказано, что малые изменения вероятностного параметра могут привести к экспоненциальным различиям в размере объяснения
Теоретическое влияние: Предоставляет важный позитивный результат в области формальной интерпретируемости ИИ, нарушая тенденцию сосредоточения на результатах о сложности
Методологическое вдохновение: Техники рандомизации и релаксации могут вдохновить решения других сложных проблем
Практическая ценность: Обеспечивает теоретическую основу для интерпретируемости линейных моделей
Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.
Данная работа вносит значительный теоретический вклад в область формальной интерпретируемости ИИ, впервые доказав разрешимость вероятностных объяснений на линейных моделях и предоставив редкий позитивный результат в этой области. Хотя имеется место для улучшения в практичности, её теоретическая ценность и методологическая инновативность делают её важной работой в этой области.