2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel

Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $Î´\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $Î´$-sufficient reasons ($Î´$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $Î´$-SRs unlikely. We propose the notion of $(Î´, Îµ)$-SR, a simple relaxation of $Î´$-SRs, and show that this kind of explanation can be computed efficiently over linear models.

academic

Spiegazioni Probabilistiche per Modelli Lineari

Informazioni Fondamentali

ID Articolo: 2501.00154
Titolo: Probabilistic Explanations for Linear Models
Autori: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Classificazione: cs.AI (Intelligenza Artificiale), cs.CC (Complessità Computazionale)
Data di Pubblicazione: 3 gennaio 2025
Link Articolo: https://arxiv.org/abs/2501.00154

Riassunto

Questo articolo affronta il problema computazionale del calcolo delle "ragioni sufficienti" nell'ambito dell'IA formale interpretabile (Formal XAI). Data un modello M e un'istanza di input x, una ragione sufficiente è un sottoinsieme di caratteristiche S di x tale che qualsiasi istanza z che coincida con x su S soddisfi M(x)=M(z). Per ridurre la dimensione delle ragioni sufficienti, gli autori considerano un rilassamento probabilistico: richiedere che quando un'istanza casuale z coincida con x sull'insieme di caratteristiche, la probabilità che M(x)=M(z) sia almeno δ∈(0,1]. Il calcolo di piccole δ-ragioni sufficienti (δ-SRs) è teoricamente difficile, con forti risultati di non-approssimabilità anche per modelli "interpretabili" come gli alberi decisionali. L'articolo propone il concetto di (δ,ε)-SR, un semplice rilassamento delle δ-SRs, e dimostra che tali spiegazioni possono essere calcolate efficientemente su modelli lineari.

Contesto di Ricerca e Motivazione

Problema Centrale: Come fornire spiegazioni di piccole dimensioni con garanzie matematiche per le decisioni dei modelli di machine learning. Le ragioni sufficienti tradizionali richiedono certezza al 100%, ma questo spesso porta a spiegazioni troppo grandi per la comprensione umana.
Importanza del Problema:
- Miller (1956) ha osservato che spiegazioni con più di 9 caratteristiche potrebbero essere troppo grandi per gli umani
- Ricerche empiriche dimostrano che le spiegazioni dovrebbero essere concise (Narayanan et al., 2018; Lage et al., 2019)
- Nelle applicazioni pratiche, gli utenti sono più interessati alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
Limitazioni degli Approcci Esistenti:
- Il calcolo delle δ-SRs minime è NP-hard anche per gli alberi decisionali
- Per i modelli lineari, il calcolo esatto della probabilità è #P-hard
- Esistono forti risultati di non-approssimabilità: impossibile ottenere buoni rapporti di approssimazione in tempo polinomiale
Motivazione della Ricerca:
- Gli utenti sono più sensibili alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
- È necessario trovare un equilibrio tra trattabilità teorica e praticità
- La struttura speciale dei modelli lineari potrebbe consentire algoritmi efficienti

Contributi Fondamentali

Introduzione del Concetto di (δ,ε)-Ragione Sufficiente Minima: Un rilassamento che consente alle garanzie probabilistiche di variare nell'intervallo δ-ε, δ+ε
Dimostrazione di Trattabilità su Modelli Lineari: Fornisce un algoritmo in tempo polinomiale per calcolare (δ,ε)-min-SR, con tempo di esecuzione Õ(n/ε²δ²)
Stabilimento di Risultati di Separazione Teorica: Dimostra che il problema rimane difficile su alberi decisionali, evidenziando la particolarità dei modelli lineari
Dimostrazione dell'Equivalenza del Minimo Locale: Per i modelli lineari, ogni δ-SR localmente minimo è anche un δ-SR minimale per sottoinsieme
Analisi del Gap di Approssimazione: Dimostra che piccole variazioni nei parametri probabilistici possono portare a differenze esponenziali nella dimensione della spiegazione

Dettagli del Metodo

Definizione del Compito

Input:

Modello lineare $\mathcal{L} = (\mathbf{w}, \theta)$ , dove $\mathbf{w} \in \mathbb{Q}^n$ , $\theta \in \mathbb{Q}$
Istanza $\mathbf{x} \in \{0,1\}^n$
Soglia probabilistica $\delta \in (0,1)$ e tolleranza di errore $\varepsilon \in (0,1)$

Output:

Valore $\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]$
Ragione sufficiente minima $\delta^*$ $\mathbf{y}$

Vincoli:

$\mathcal{L}(\mathbf{x}) = 1$ se e solo se $\mathbf{x} \cdot \mathbf{w} \geq \theta$
Istanza parziale $\mathbf{y} \sqsubseteq \mathbf{x}$ con $\star$ che rappresenta valori sconosciuti

Architettura del Modello

1. Meccanismo di Valutazione delle Caratteristiche

Per un modello lineare $\mathcal{L} = (\mathbf{w}, \theta)$ e un'istanza $\mathbf{x}$ , il punteggio della caratteristica $i$ è definito come:

$s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)$

Il segno del punteggio indica se la caratteristica "aiuta" (+1) o "danneggia" (-1) la classificazione, con l'ampiezza proporzionale al peso della caratteristica.

2. Selezione Greedy delle Caratteristiche

Lemma Chiave: Per i modelli lineari, la selezione delle caratteristiche in ordine decrescente di punteggio è ottimale secondo una distribuzione uniforme.

Specificamente, se $\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)}$ sono istanze parziali definite dalle prime $k$ caratteristiche con punteggio più alto, allora:

$\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]$

3. Stima Monte Carlo

Utilizzo della disuguaglianza di Hoeffding per la stima probabilistica:

Per $m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta}$ campioni, si ha:

$\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n$

Punti di Innovazione Tecnica

Randomizzazione della Soglia Probabilistica: L'algoritmo seleziona casualmente $\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon])$ , evitando istanze difficili
Strategia di Ricerca Binaria: Sfrutta la monotonicità probabilistica per una ricerca efficiente
Rilassamento con Garanzie Teoriche: Mantiene la praticità ottenendo complessità in tempo polinomiale

Configurazione Sperimentale

Descrizione dell'Algoritmo

Algoritmo 1: LinearMonteCarloExplainer

Input: Modello lineare L, istanza x, parametri δ, ε, β
1. δ* ← Campionamento uniforme da [δ-ε, δ+ε]
2. Calcolo di tutti i punteggi delle caratteristiche s_i
3. Costruzione della sequenza di istanze parziali y^(0), ..., y^(n)
4. Impostazione del numero di campioni m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utilizzo della ricerca binaria per trovare il minimo k tale che la probabilità stimata ≥ δ*
6. Restituzione di (δ*, y^(k*))

Analisi Teorica

Teorema Principale: Dato un modello lineare $\mathcal{L}$ e un input $\mathbf{x}$ , è possibile calcolare (δ,ε)-min-SR in tempo $\tilde{O}(\frac{n}{\varepsilon^2\delta^2})$ con probabilità di successo $1-\beta$ .

Analisi della Complessità

Complessità Temporale: $O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})$
Complessità Spaziale: $O(n)$
Probabilità di Successo: $1-\beta$

Risultati Sperimentali

Risultati Principali

Confronto di Trattabilità:
- Modelli lineari: Risolvibili in tempo polinomiale
- Alberi decisionali: Non-approssimabilità forte (a meno che SAT sia risolvibile in tempo quasi-polinomiale)
- Reti neurali: NPPP-hard
Verifica di Esempi Concreti:
- Esempio 2 mostra che una 0.999999-SR può essere 251 volte più piccola della minima 1-SR
- Esempio 3 verifica la correttezza della strategia di selezione greedy

Scoperte Teoriche

Risultati di Separazione: Dimostra il vantaggio fondamentale dei modelli lineari rispetto agli alberi decisionali
Minimo Locale vs Globale: Per i modelli lineari, ogni δ-SR localmente minimo è un δ-SR minimale per sottoinsieme
Gap di Approssimazione: Piccole variazioni nei parametri probabilistici possono portare a differenze di $\Omega(n^{1/2-\epsilon})$ volte nella dimensione della spiegazione

Analisi dei Casi

Analisi Dettagliata dell'Esempio 3:

Istanza: $\mathbf{x} = (1,0,0,1,1)$
Pesi: $\mathbf{w} = (5,1,-3,2,-1)$ , soglia: $\theta = 5$
Punteggi delle caratteristiche: $(5,-1,3,2,-1)$
Spiegazione ottimale a 2 caratteristiche: $\{1,3\}$ , probabilità 7/8

Lavori Correlati

Calcolo delle Ragioni Sufficienti

Darwiche e Hirth (2020): Formalizzazione iniziale del concetto di ragione sufficiente
Barceló et al. (2020): Stabilimento della gerarchia di complessità per diverse classi di modelli
Arenas et al. (2022): Dimostrazione della difficoltà delle δ-SRs su alberi decisionali

Spiegazioni Probabilistiche

Wäldchen et al. (2021): Introduzione del concetto di δ-ragione sufficiente
Izza et al. (2023): Studio del calcolo delle spiegazioni probabilistiche addominali
Kozachinskiy (2023): Stabilimento dei risultati di non-approssimabilità per alberi decisionali

Interpretabilità dei Modelli Lineari

Marques-Silva et al. (2020): Studio dell'interpretabilità di classificatori lineari come Naive Bayes
Blanc et al. (2021): Spiegazioni piccole relative alla complessità del certificato

Conclusioni e Discussione

Conclusioni Principali

Avanzamento Teorico: Prima dimostrazione della calcolabilità in tempo polinomiale delle spiegazioni probabilistiche su modelli lineari
Valore Pratico: Il concetto di (δ,ε)-SR migliora la praticità mantenendo le garanzie teoriche
Separazione dei Modelli: Stabilisce una differenza fondamentale tra modelli lineari e alberi decisionali nella complessità computazionale delle spiegazioni

Limitazioni

Efficienza Pratica: Per dati ad alta dimensionalità (come n=500), il calcolo rimane costoso quando ε=0.1, δ=0.01
Assunzioni di Distribuzione: L'algoritmo assume distribuzione uniforme; l'estensione a distribuzioni prodotto richiede nuove tecniche
Tipi di Caratteristiche: Considera solo caratteristiche binarie; le applicazioni pratiche richiedono la gestione di caratteristiche continue e categoriche

Direzioni Future

Ottimizzazione Algoritmica: Riduzione della dipendenza da 1/ε e 1/δ
Estensione della Distribuzione: Gestione di distribuzioni prodotto e distribuzioni di caratteristiche più generali
Tipi di Caratteristiche: Estensione a "classificatori lineari estesi" con tipi di caratteristiche miste
Linguaggi di Query: Progettazione di linguaggi dichiarativi per query di spiegazioni probabilistiche

Valutazione Approfondita

Punti di Forza

Contributi Teorici Significativi:
- Prima dimostrazione della trattabilità delle spiegazioni probabilistiche su modelli lineari
- Analisi completa della complessità e progettazione algoritmica
- Dimostrazione di importanti risultati di separazione
Innovazione Metodologica:
- Il concetto di (δ,ε)-SR bilancia elegantemente teoria e praticità
- Le tecniche di randomizzazione evitano efficacemente istanze difficili
- La dimostrazione della strategia greedy è elegante e profonda
Analisi Approfondita:
- Fornisce dimostrazioni matematiche dettagliate
- Considera molteplici misure di complessità
- Stabilisce chiari collegamenti con i lavori correlati

Insufficienze

Limitazioni di Praticità:
- L'algoritmo è sensibile ai parametri, con efficienza scarsa in casi ad alta dimensionalità
- Applicabile solo a modelli lineari con caratteristiche binarie
- L'assunzione di distribuzione uniforme è piuttosto forte nelle applicazioni pratiche
Verifica Sperimentale Insufficiente:
- Mancanza di verifica sperimentale su set di dati di grandi dimensioni
- Nessun confronto con metodi euristici esistenti
- I risultati teorici necessitano di maggior supporto empirico
Problemi di Scalabilità:
- Le sfide tecniche per l'estensione a impostazioni più generali sono significative
- L'applicabilità alla pipeline ML pratica non è chiara

Impatto

Impatto Teorico: Fornisce un importante risultato positivo al campo dell'XAI formale, rompendo il focus prevalente sulla difficoltà computazionale
Ispirazione Metodologica: Le tecniche di randomizzazione e rilassamento potrebbero ispirare soluzioni per altri problemi difficili
Valore Pratico: Fornisce fondamenti teorici per l'interpretabilità dei modelli lineari

Scenari Applicabili

Risk Management Finanziario: Spiegazione di modelli di scoring lineari per decisioni di prestito
Diagnosi Medica: Spiegazione di valutazioni del rischio basate su regressione lineare
Sistemi di Raccomandazione: Analisi dell'importanza delle caratteristiche in modelli di raccomandazione lineari
Conformità Legale: Spiegazione di decisioni automatizzate con garanzie matematiche

Riferimenti Bibliografici

Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Questo articolo fornisce un contributo teorico importante nel campo dell'IA formale interpretabile, dimostrando per la prima volta la trattabilità delle spiegazioni probabilistiche su modelli lineari e fornendo al campo un raro risultato positivo. Sebbene vi sia spazio per miglioramenti in termini di praticità, il suo valore teorico e l'innovazione metodologica lo rendono un lavoro importante in questo ambito di ricerca.