Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
Titolo: Probabilistic Explanations for Linear Models
Autori: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Questo articolo affronta il problema computazionale del calcolo delle "ragioni sufficienti" nell'ambito dell'IA formale interpretabile (Formal XAI). Data un modello M e un'istanza di input x, una ragione sufficiente è un sottoinsieme di caratteristiche S di x tale che qualsiasi istanza z che coincida con x su S soddisfi M(x)=M(z). Per ridurre la dimensione delle ragioni sufficienti, gli autori considerano un rilassamento probabilistico: richiedere che quando un'istanza casuale z coincida con x sull'insieme di caratteristiche, la probabilità che M(x)=M(z) sia almeno δ∈(0,1]. Il calcolo di piccole δ-ragioni sufficienti (δ-SRs) è teoricamente difficile, con forti risultati di non-approssimabilità anche per modelli "interpretabili" come gli alberi decisionali. L'articolo propone il concetto di (δ,ε)-SR, un semplice rilassamento delle δ-SRs, e dimostra che tali spiegazioni possono essere calcolate efficientemente su modelli lineari.
Problema Centrale: Come fornire spiegazioni di piccole dimensioni con garanzie matematiche per le decisioni dei modelli di machine learning. Le ragioni sufficienti tradizionali richiedono certezza al 100%, ma questo spesso porta a spiegazioni troppo grandi per la comprensione umana.
Importanza del Problema:
Miller (1956) ha osservato che spiegazioni con più di 9 caratteristiche potrebbero essere troppo grandi per gli umani
Ricerche empiriche dimostrano che le spiegazioni dovrebbero essere concise (Narayanan et al., 2018; Lage et al., 2019)
Nelle applicazioni pratiche, gli utenti sono più interessati alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
Limitazioni degli Approcci Esistenti:
Il calcolo delle δ-SRs minime è NP-hard anche per gli alberi decisionali
Per i modelli lineari, il calcolo esatto della probabilità è #P-hard
Esistono forti risultati di non-approssimabilità: impossibile ottenere buoni rapporti di approssimazione in tempo polinomiale
Motivazione della Ricerca:
Gli utenti sono più sensibili alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
È necessario trovare un equilibrio tra trattabilità teorica e praticità
La struttura speciale dei modelli lineari potrebbe consentire algoritmi efficienti
Introduzione del Concetto di (δ,ε)-Ragione Sufficiente Minima: Un rilassamento che consente alle garanzie probabilistiche di variare nell'intervallo δ-ε, δ+ε
Dimostrazione di Trattabilità su Modelli Lineari: Fornisce un algoritmo in tempo polinomiale per calcolare (δ,ε)-min-SR, con tempo di esecuzione Õ(n/ε²δ²)
Stabilimento di Risultati di Separazione Teorica: Dimostra che il problema rimane difficile su alberi decisionali, evidenziando la particolarità dei modelli lineari
Dimostrazione dell'Equivalenza del Minimo Locale: Per i modelli lineari, ogni δ-SR localmente minimo è anche un δ-SR minimale per sottoinsieme
Analisi del Gap di Approssimazione: Dimostra che piccole variazioni nei parametri probabilistici possono portare a differenze esponenziali nella dimensione della spiegazione
Per un modello lineare L=(w,θ) e un'istanza x, il punteggio della caratteristica i è definito come:
si=wi⋅(2xi−1)⋅(2L(x)−1)
Il segno del punteggio indica se la caratteristica "aiuta" (+1) o "danneggia" (-1) la classificazione, con l'ampiezza proporzionale al peso della caratteristica.
Lemma Chiave: Per i modelli lineari, la selezione delle caratteristiche in ordine decrescente di punteggio è ottimale secondo una distribuzione uniforme.
Specificamente, se y(0),…,y(n) sono istanze parziali definite dalle prime k caratteristiche con punteggio più alto, allora:
Input: Modello lineare L, istanza x, parametri δ, ε, β
1. δ* ← Campionamento uniforme da [δ-ε, δ+ε]
2. Calcolo di tutti i punteggi delle caratteristiche s_i
3. Costruzione della sequenza di istanze parziali y^(0), ..., y^(n)
4. Impostazione del numero di campioni m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utilizzo della ricerca binaria per trovare il minimo k tale che la probabilità stimata ≥ δ*
6. Restituzione di (δ*, y^(k*))
Risultati di Separazione: Dimostra il vantaggio fondamentale dei modelli lineari rispetto agli alberi decisionali
Minimo Locale vs Globale: Per i modelli lineari, ogni δ-SR localmente minimo è un δ-SR minimale per sottoinsieme
Gap di Approssimazione: Piccole variazioni nei parametri probabilistici possono portare a differenze di Ω(n1/2−ϵ) volte nella dimensione della spiegazione
Avanzamento Teorico: Prima dimostrazione della calcolabilità in tempo polinomiale delle spiegazioni probabilistiche su modelli lineari
Valore Pratico: Il concetto di (δ,ε)-SR migliora la praticità mantenendo le garanzie teoriche
Separazione dei Modelli: Stabilisce una differenza fondamentale tra modelli lineari e alberi decisionali nella complessità computazionale delle spiegazioni
Efficienza Pratica: Per dati ad alta dimensionalità (come n=500), il calcolo rimane costoso quando ε=0.1, δ=0.01
Assunzioni di Distribuzione: L'algoritmo assume distribuzione uniforme; l'estensione a distribuzioni prodotto richiede nuove tecniche
Tipi di Caratteristiche: Considera solo caratteristiche binarie; le applicazioni pratiche richiedono la gestione di caratteristiche continue e categoriche
Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.
Questo articolo fornisce un contributo teorico importante nel campo dell'IA formale interpretabile, dimostrando per la prima volta la trattabilità delle spiegazioni probabilistiche su modelli lineari e fornendo al campo un raro risultato positivo. Sebbene vi sia spazio per miglioramenti in termini di praticità, il suo valore teorico e l'innovazione metodologica lo rendono un lavoro importante in questo ambito di ricerca.