2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel
Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
academic

Spiegazioni Probabilistiche per Modelli Lineari

Informazioni Fondamentali

  • ID Articolo: 2501.00154
  • Titolo: Probabilistic Explanations for Linear Models
  • Autori: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
  • Classificazione: cs.AI (Intelligenza Artificiale), cs.CC (Complessità Computazionale)
  • Data di Pubblicazione: 3 gennaio 2025
  • Link Articolo: https://arxiv.org/abs/2501.00154

Riassunto

Questo articolo affronta il problema computazionale del calcolo delle "ragioni sufficienti" nell'ambito dell'IA formale interpretabile (Formal XAI). Data un modello M e un'istanza di input x, una ragione sufficiente è un sottoinsieme di caratteristiche S di x tale che qualsiasi istanza z che coincida con x su S soddisfi M(x)=M(z). Per ridurre la dimensione delle ragioni sufficienti, gli autori considerano un rilassamento probabilistico: richiedere che quando un'istanza casuale z coincida con x sull'insieme di caratteristiche, la probabilità che M(x)=M(z) sia almeno δ∈(0,1]. Il calcolo di piccole δ-ragioni sufficienti (δ-SRs) è teoricamente difficile, con forti risultati di non-approssimabilità anche per modelli "interpretabili" come gli alberi decisionali. L'articolo propone il concetto di (δ,ε)-SR, un semplice rilassamento delle δ-SRs, e dimostra che tali spiegazioni possono essere calcolate efficientemente su modelli lineari.

Contesto di Ricerca e Motivazione

  1. Problema Centrale: Come fornire spiegazioni di piccole dimensioni con garanzie matematiche per le decisioni dei modelli di machine learning. Le ragioni sufficienti tradizionali richiedono certezza al 100%, ma questo spesso porta a spiegazioni troppo grandi per la comprensione umana.
  2. Importanza del Problema:
    • Miller (1956) ha osservato che spiegazioni con più di 9 caratteristiche potrebbero essere troppo grandi per gli umani
    • Ricerche empiriche dimostrano che le spiegazioni dovrebbero essere concise (Narayanan et al., 2018; Lage et al., 2019)
    • Nelle applicazioni pratiche, gli utenti sono più interessati alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
  3. Limitazioni degli Approcci Esistenti:
    • Il calcolo delle δ-SRs minime è NP-hard anche per gli alberi decisionali
    • Per i modelli lineari, il calcolo esatto della probabilità è #P-hard
    • Esistono forti risultati di non-approssimabilità: impossibile ottenere buoni rapporti di approssimazione in tempo polinomiale
  4. Motivazione della Ricerca:
    • Gli utenti sono più sensibili alla dimensione della spiegazione che alle piccole variazioni nelle garanzie probabilistiche
    • È necessario trovare un equilibrio tra trattabilità teorica e praticità
    • La struttura speciale dei modelli lineari potrebbe consentire algoritmi efficienti

Contributi Fondamentali

  1. Introduzione del Concetto di (δ,ε)-Ragione Sufficiente Minima: Un rilassamento che consente alle garanzie probabilistiche di variare nell'intervallo δ-ε, δ+ε
  2. Dimostrazione di Trattabilità su Modelli Lineari: Fornisce un algoritmo in tempo polinomiale per calcolare (δ,ε)-min-SR, con tempo di esecuzione Õ(n/ε²δ²)
  3. Stabilimento di Risultati di Separazione Teorica: Dimostra che il problema rimane difficile su alberi decisionali, evidenziando la particolarità dei modelli lineari
  4. Dimostrazione dell'Equivalenza del Minimo Locale: Per i modelli lineari, ogni δ-SR localmente minimo è anche un δ-SR minimale per sottoinsieme
  5. Analisi del Gap di Approssimazione: Dimostra che piccole variazioni nei parametri probabilistici possono portare a differenze esponenziali nella dimensione della spiegazione

Dettagli del Metodo

Definizione del Compito

Input:

  • Modello lineare L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta), dove wQn\mathbf{w} \in \mathbb{Q}^n, θQ\theta \in \mathbb{Q}
  • Istanza x{0,1}n\mathbf{x} \in \{0,1\}^n
  • Soglia probabilistica δ(0,1)\delta \in (0,1) e tolleranza di errore ε(0,1)\varepsilon \in (0,1)

Output:

  • Valore δ[δε,δ+ε]\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]
  • Ragione sufficiente minima δ\delta^* y\mathbf{y}

Vincoli:

  • L(x)=1\mathcal{L}(\mathbf{x}) = 1 se e solo se xwθ\mathbf{x} \cdot \mathbf{w} \geq \theta
  • Istanza parziale yx\mathbf{y} \sqsubseteq \mathbf{x} con \star che rappresenta valori sconosciuti

Architettura del Modello

1. Meccanismo di Valutazione delle Caratteristiche

Per un modello lineare L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta) e un'istanza x\mathbf{x}, il punteggio della caratteristica ii è definito come:

si=wi(2xi1)(2L(x)1)s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)

Il segno del punteggio indica se la caratteristica "aiuta" (+1) o "danneggia" (-1) la classificazione, con l'ampiezza proporzionale al peso della caratteristica.

2. Selezione Greedy delle Caratteristiche

Lemma Chiave: Per i modelli lineari, la selezione delle caratteristiche in ordine decrescente di punteggio è ottimale secondo una distribuzione uniforme.

Specificamente, se y(0),,y(n)\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)} sono istanze parziali definite dalle prime kk caratteristiche con punteggio più alto, allora:

PrzU(y(k+1))[L(z)=L(x)]PrzU(y(k))[L(z)=L(x)]\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]

3. Stima Monte Carlo

Utilizzo della disuguaglianza di Hoeffding per la stima probabilistica:

Per m=log2n2ε2δ2log2lognβm = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta} campioni, si ha:

Pr[p^(m)pεδ/logn]1β/logn\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n

Punti di Innovazione Tecnica

  1. Randomizzazione della Soglia Probabilistica: L'algoritmo seleziona casualmente δU([δε,δ+ε])\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon]), evitando istanze difficili
  2. Strategia di Ricerca Binaria: Sfrutta la monotonicità probabilistica per una ricerca efficiente
  3. Rilassamento con Garanzie Teoriche: Mantiene la praticità ottenendo complessità in tempo polinomiale

Configurazione Sperimentale

Descrizione dell'Algoritmo

Algoritmo 1: LinearMonteCarloExplainer

Input: Modello lineare L, istanza x, parametri δ, ε, β
1. δ* ← Campionamento uniforme da [δ-ε, δ+ε]
2. Calcolo di tutti i punteggi delle caratteristiche s_i
3. Costruzione della sequenza di istanze parziali y^(0), ..., y^(n)
4. Impostazione del numero di campioni m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utilizzo della ricerca binaria per trovare il minimo k tale che la probabilità stimata ≥ δ*
6. Restituzione di (δ*, y^(k*))

Analisi Teorica

Teorema Principale: Dato un modello lineare L\mathcal{L} e un input x\mathbf{x}, è possibile calcolare (δ,ε)-min-SR in tempo O~(nε2δ2)\tilde{O}(\frac{n}{\varepsilon^2\delta^2}) con probabilità di successo 1β1-\beta.

Analisi della Complessità

  • Complessità Temporale: O(lognmn)=O~(nε2δ2)O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})
  • Complessità Spaziale: O(n)O(n)
  • Probabilità di Successo: 1β1-\beta

Risultati Sperimentali

Risultati Principali

  1. Confronto di Trattabilità:
    • Modelli lineari: Risolvibili in tempo polinomiale
    • Alberi decisionali: Non-approssimabilità forte (a meno che SAT sia risolvibile in tempo quasi-polinomiale)
    • Reti neurali: NPPP-hard
  2. Verifica di Esempi Concreti:
    • Esempio 2 mostra che una 0.999999-SR può essere 251 volte più piccola della minima 1-SR
    • Esempio 3 verifica la correttezza della strategia di selezione greedy

Scoperte Teoriche

  1. Risultati di Separazione: Dimostra il vantaggio fondamentale dei modelli lineari rispetto agli alberi decisionali
  2. Minimo Locale vs Globale: Per i modelli lineari, ogni δ-SR localmente minimo è un δ-SR minimale per sottoinsieme
  3. Gap di Approssimazione: Piccole variazioni nei parametri probabilistici possono portare a differenze di Ω(n1/2ϵ)\Omega(n^{1/2-\epsilon}) volte nella dimensione della spiegazione

Analisi dei Casi

Analisi Dettagliata dell'Esempio 3:

  • Istanza: x=(1,0,0,1,1)\mathbf{x} = (1,0,0,1,1)
  • Pesi: w=(5,1,3,2,1)\mathbf{w} = (5,1,-3,2,-1), soglia: θ=5\theta = 5
  • Punteggi delle caratteristiche: (5,1,3,2,1)(5,-1,3,2,-1)
  • Spiegazione ottimale a 2 caratteristiche: {1,3}\{1,3\}, probabilità 7/8

Lavori Correlati

Calcolo delle Ragioni Sufficienti

  1. Darwiche e Hirth (2020): Formalizzazione iniziale del concetto di ragione sufficiente
  2. Barceló et al. (2020): Stabilimento della gerarchia di complessità per diverse classi di modelli
  3. Arenas et al. (2022): Dimostrazione della difficoltà delle δ-SRs su alberi decisionali

Spiegazioni Probabilistiche

  1. Wäldchen et al. (2021): Introduzione del concetto di δ-ragione sufficiente
  2. Izza et al. (2023): Studio del calcolo delle spiegazioni probabilistiche addominali
  3. Kozachinskiy (2023): Stabilimento dei risultati di non-approssimabilità per alberi decisionali

Interpretabilità dei Modelli Lineari

  1. Marques-Silva et al. (2020): Studio dell'interpretabilità di classificatori lineari come Naive Bayes
  2. Blanc et al. (2021): Spiegazioni piccole relative alla complessità del certificato

Conclusioni e Discussione

Conclusioni Principali

  1. Avanzamento Teorico: Prima dimostrazione della calcolabilità in tempo polinomiale delle spiegazioni probabilistiche su modelli lineari
  2. Valore Pratico: Il concetto di (δ,ε)-SR migliora la praticità mantenendo le garanzie teoriche
  3. Separazione dei Modelli: Stabilisce una differenza fondamentale tra modelli lineari e alberi decisionali nella complessità computazionale delle spiegazioni

Limitazioni

  1. Efficienza Pratica: Per dati ad alta dimensionalità (come n=500), il calcolo rimane costoso quando ε=0.1, δ=0.01
  2. Assunzioni di Distribuzione: L'algoritmo assume distribuzione uniforme; l'estensione a distribuzioni prodotto richiede nuove tecniche
  3. Tipi di Caratteristiche: Considera solo caratteristiche binarie; le applicazioni pratiche richiedono la gestione di caratteristiche continue e categoriche

Direzioni Future

  1. Ottimizzazione Algoritmica: Riduzione della dipendenza da 1/ε e 1/δ
  2. Estensione della Distribuzione: Gestione di distribuzioni prodotto e distribuzioni di caratteristiche più generali
  3. Tipi di Caratteristiche: Estensione a "classificatori lineari estesi" con tipi di caratteristiche miste
  4. Linguaggi di Query: Progettazione di linguaggi dichiarativi per query di spiegazioni probabilistiche

Valutazione Approfondita

Punti di Forza

  1. Contributi Teorici Significativi:
    • Prima dimostrazione della trattabilità delle spiegazioni probabilistiche su modelli lineari
    • Analisi completa della complessità e progettazione algoritmica
    • Dimostrazione di importanti risultati di separazione
  2. Innovazione Metodologica:
    • Il concetto di (δ,ε)-SR bilancia elegantemente teoria e praticità
    • Le tecniche di randomizzazione evitano efficacemente istanze difficili
    • La dimostrazione della strategia greedy è elegante e profonda
  3. Analisi Approfondita:
    • Fornisce dimostrazioni matematiche dettagliate
    • Considera molteplici misure di complessità
    • Stabilisce chiari collegamenti con i lavori correlati

Insufficienze

  1. Limitazioni di Praticità:
    • L'algoritmo è sensibile ai parametri, con efficienza scarsa in casi ad alta dimensionalità
    • Applicabile solo a modelli lineari con caratteristiche binarie
    • L'assunzione di distribuzione uniforme è piuttosto forte nelle applicazioni pratiche
  2. Verifica Sperimentale Insufficiente:
    • Mancanza di verifica sperimentale su set di dati di grandi dimensioni
    • Nessun confronto con metodi euristici esistenti
    • I risultati teorici necessitano di maggior supporto empirico
  3. Problemi di Scalabilità:
    • Le sfide tecniche per l'estensione a impostazioni più generali sono significative
    • L'applicabilità alla pipeline ML pratica non è chiara

Impatto

  1. Impatto Teorico: Fornisce un importante risultato positivo al campo dell'XAI formale, rompendo il focus prevalente sulla difficoltà computazionale
  2. Ispirazione Metodologica: Le tecniche di randomizzazione e rilassamento potrebbero ispirare soluzioni per altri problemi difficili
  3. Valore Pratico: Fornisce fondamenti teorici per l'interpretabilità dei modelli lineari

Scenari Applicabili

  1. Risk Management Finanziario: Spiegazione di modelli di scoring lineari per decisioni di prestito
  2. Diagnosi Medica: Spiegazione di valutazioni del rischio basate su regressione lineare
  3. Sistemi di Raccomandazione: Analisi dell'importanza delle caratteristiche in modelli di raccomandazione lineari
  4. Conformità Legale: Spiegazione di decisioni automatizzate con garanzie matematiche

Riferimenti Bibliografici

  1. Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
  2. Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
  3. Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
  4. Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
  5. Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Questo articolo fornisce un contributo teorico importante nel campo dell'IA formale interpretabile, dimostrando per la prima volta la trattabilità delle spiegazioni probabilistiche su modelli lineari e fornendo al campo un raro risultato positivo. Sebbene vi sia spazio per miglioramenti in termini di praticità, il suo valore teorico e l'innovazione metodologica lo rendono un lavoro importante in questo ambito di ricerca.