Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
Titel: Probabilistic Explanations for Linear Models
Autoren: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Diese Arbeit untersucht das Berechnungsproblem der „hinreichenden Gründe" in der formalen erklärbaren KI (Formal XAI). Gegeben ein Modell M und eine Eingabeinstanz x ist ein hinreichender Grund eine Merkmalsteilmenge S von x, sodass jede Instanz z, die mit x auf S übereinstimmt, M(x)=M(z) erfüllt. Um die Größe der hinreichenden Gründe zu reduzieren, betrachten die Autoren eine probabilistische Relaxation: Es wird gefordert, dass die Wahrscheinlichkeit, dass eine zufällige Instanz z mit x auf der Merkmalsmenge übereinstimmt und M(x)=M(z) erfüllt, mindestens δ∈(0,1] beträgt. Die Berechnung kleiner δ-hinreichender Gründe (δ-SRs) ist theoretisch schwierig, mit starken Nicht-Approximierungsergebnissen selbst für „interpretierbare" Modelle wie Entscheidungsbäume. Die Arbeit führt das Konzept (δ,ε)-SR ein, eine einfache Relaxation von δ-SRs, und beweist, dass solche Erklärungen auf linearen Modellen effizient berechnet werden können.
Kernproblem: Wie können Entscheidungen von Maschinenlernmodellen mit mathematischen Garantien durch kleine Erklärungen begründet werden. Traditionelle hinreichende Gründe erfordern 100% Sicherheit, führen aber oft zu übermäßig großen Erklärungen, die für menschliches Verständnis ungeeignet sind.
Problemrelevanz:
Miller (1956) zeigte, dass Erklärungen mit mehr als 9 Merkmalen für Menschen möglicherweise zu groß sind
Empirische Studien deuten darauf hin, dass Erklärungen prägnant sein sollten (Narayanan et al., 2018; Lage et al., 2019)
In praktischen Anwendungen interessieren sich Benutzer mehr für die Größe der Erklärung als für kleine Unterschiede in probabilistischen Garantien
Einschränkungen bestehender Methoden:
Die Berechnung minimaler δ-SRs ist selbst für Entscheidungsbäume NP-schwer
Für lineare Modelle ist die exakte Wahrscheinlichkeitsberechnung #P-schwer
Es existieren starke Nicht-Approximierungsergebnisse: Keine guten Approximationsverhältnisse in Polynomialzeit möglich
Forschungsmotivation:
Benutzer sind empfindlicher gegenüber der Größe von Erklärungen als gegenüber kleinen Änderungen in probabilistischen Garantien
Es ist notwendig, ein Gleichgewicht zwischen theoretischer Handhabbarkeit und praktischer Anwendbarkeit zu finden
Die spezielle Struktur linearer Modelle könnte effiziente Algorithmen ermöglichen
Einführung des Konzepts (δ,ε)-minimale hinreichende Gründe: Eine Relaxation, die zulässt, dass probabilistische Garantien im Bereich δ-ε, δ+ε variieren
Beweis der Handhabbarkeit auf linearen Modellen: Bereitstellung eines Polynomialzeit-Algorithmus zur Berechnung von (δ,ε)-min-SR mit Laufzeit Õ(n/ε²δ²)
Etablierung von Trennungsergebnissen: Beweis, dass das Problem auf Entscheidungsbäumen weiterhin schwierig ist, was die Besonderheit linearer Modelle unterstreicht
Beweis der lokalen Minimalitätsäquivalenz: Für lineare Modelle ist jeder lokal minimale δ-SR ein teilmengeminimaler δ-SR
Analyse des Approximationsgaps: Beweis, dass kleine Änderungen des probabilistischen Parameters zu exponentiellen Unterschieden in der Erklärungsgröße führen können
Für ein lineares Modell L=(w,θ) und eine Instanz x wird die Bewertung des Merkmals i definiert als:
si=wi⋅(2xi−1)⋅(2L(x)−1)
Das Vorzeichen der Bewertung zeigt an, ob das Merkmal die Klassifizierung „hilft" (+1) oder „schadet" (-1), die Größe ist proportional zum Merkmalsgewicht.
Schlüssellemma: Für lineare Modelle ist die Auswahl von Merkmalen in absteigender Reihenfolge ihrer Bewertungen unter gleichmäßiger Verteilung optimal.
Konkret, wenn y(0),…,y(n) Teilinstanzen sind, die durch die Top-k-Merkmale mit höchster Bewertung definiert sind, dann:
Hauptsatz: Gegeben ein lineares Modell L und Eingabe x kann ein (δ,ε)-min-SR in Zeit O~(ε2δ2n) mit Wahrscheinlichkeit 1−β erfolgreich berechnet werden.
Theoretischer Durchbruch: Erstmaliger Beweis der Polynomialzeit-Berechenbarkeit probabilistischer Erklärungen auf linearen Modellen
Praktischer Wert: Das Konzept (δ,ε)-SR verbessert die Praktikabilität bei Beibehaltung theoretischer Garantien
Modellseparation: Etablierung eines fundamentalen Unterschieds zwischen linearen Modellen und Entscheidungsbäumen in der Komplexität der Erklärungsberechnung
Theoretische Auswirkungen: Bietet wichtige positive Ergebnisse für das Feld der formalen erklärbaren KI und durchbricht den Fokus des Feldes auf Schwierigkeitsergebnisse
Methodische Inspiration: Randomisierungs- und Relaxationstechniken könnten andere schwierige Probleme inspirieren
Praktischer Wert: Bietet theoretische Grundlagen für die Erklärbarkeit linearer Modelle
Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.
Diese Arbeit leistet bedeutende theoretische Beiträge im Bereich der formalen erklärbaren KI und beweist erstmals die Handhabbarkeit probabilistischer Erklärungen auf linearen Modellen, was dem Feld seltene positive Ergebnisse bietet. Obwohl es Raum für Verbesserungen in der praktischen Anwendbarkeit gibt, machen ihr theoretischer Wert und ihre methodische Innovation sie zu einer wichtigen Arbeit in diesem Bereich.