2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel

Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $Î´\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $Î´$-sufficient reasons ($Î´$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $Î´$-SRs unlikely. We propose the notion of $(Î´, Îµ)$-SR, a simple relaxation of $Î´$-SRs, and show that this kind of explanation can be computed efficiently over linear models.

academic

Explicaciones Probabilísticas para Modelos Lineales

Información Básica

ID del Artículo: 2501.00154
Título: Probabilistic Explanations for Linear Models
Autores: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Clasificación: cs.AI (Inteligencia Artificial), cs.CC (Complejidad Computacional)
Fecha de Publicación: 3 de enero de 2025
Enlace del Artículo: https://arxiv.org/abs/2501.00154

Resumen

Este artículo investiga el problema computacional de calcular "razones suficientes" en la IA Interpretable Formal (Formal XAI). Dado un modelo M y una instancia de entrada x, una razón suficiente es un subconjunto de características S de x tal que cualquier instancia z que coincida con x en S satisface M(x)=M(z). Para reducir el tamaño de las razones suficientes, los autores consideran una relajación probabilística: se requiere que cuando una instancia aleatoria z coincida con x en el conjunto de características, la probabilidad de que M(x)=M(z) sea al menos δ∈(0,1]. El cálculo de δ-razones suficientes (δ-SRs) pequeñas es teóricamente difícil, con resultados fuertes de inaproximabilidad incluso para modelos "interpretables" como árboles de decisión. Este artículo propone el concepto de (δ,ε)-SR, una relajación simple de δ-SRs, y demuestra que tales explicaciones pueden calcularse eficientemente en modelos lineales.

Contexto e Motivación de la Investigación

Problema Central: Cómo proporcionar explicaciones de tamaño pequeño con garantías matemáticas para las decisiones de modelos de aprendizaje automático. Las razones suficientes tradicionales requieren certeza del 100%, pero esto a menudo resulta en explicaciones demasiado grandes para la comprensión humana.
Importancia del Problema:
- Miller (1956) señaló que las explicaciones con más de 9 características pueden ser demasiado grandes para los humanos
- Investigaciones empíricas demuestran que las explicaciones deben ser concisas (Narayanan et al., 2018; Lage et al., 2019)
- En aplicaciones prácticas, los usuarios se preocupan más por el tamaño de la explicación que por pequeñas diferencias en las garantías probabilísticas
Limitaciones de Métodos Existentes:
- El cálculo de δ-SRs mínimas es NP-hard incluso para árboles de decisión
- Para modelos lineales, el cálculo exacto de probabilidades es #P-hard
- Existen resultados fuertes de inaproximabilidad: no se pueden obtener buenos ratios de aproximación en tiempo polinomial
Motivación de la Investigación:
- Los usuarios son más sensibles al tamaño de la explicación que a cambios menores en las garantías probabilísticas
- Se necesita encontrar un equilibrio entre la tratabilidad teórica y la practicidad
- La estructura especial de los modelos lineales puede permitir algoritmos eficientes

Contribuciones Principales

Propuesta del Concepto de (δ,ε)-Razón Suficiente Mínima: Una versión relajada que permite que las garantías probabilísticas varíen dentro del rango δ-ε, δ+ε
Demostración de Tratabilidad en Modelos Lineales: Proporciona un algoritmo de tiempo polinomial para calcular (δ,ε)-min-SR con tiempo de ejecución Õ(n/ε²δ²)
Establecimiento de Resultados de Separación Teórica: Demuestra que el problema sigue siendo difícil en árboles de decisión, destacando la naturaleza especial de los modelos lineales
Demostración de Equivalencia de Minimalidad Local: Para modelos lineales, cada δ-SR localmente mínimo es un δ-SR mínimo en subconjuntos
Análisis de Brechas de Aproximación: Demuestra que pequeños cambios en parámetros probabilísticos pueden resultar en diferencias exponenciales en el tamaño de la explicación

Explicación Detallada del Método

Definición de la Tarea

Entrada:

Modelo lineal $\mathcal{L} = (\mathbf{w}, \theta)$ , donde $\mathbf{w} \in \mathbb{Q}^n$ , $\theta \in \mathbb{Q}$
Instancia $\mathbf{x} \in \{0,1\}^n$
Umbral de probabilidad $\delta \in (0,1)$ y tolerancia de error $\varepsilon \in (0,1)$

Salida:

Valor $\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]$
Razón suficiente mínima $\delta^*$ $\mathbf{y}$

Restricciones:

$\mathcal{L}(\mathbf{x}) = 1$ si y solo si $\mathbf{x} \cdot \mathbf{w} \geq \theta$
Instancia parcial $\mathbf{y} \sqsubseteq \mathbf{x}$ utilizando $\star$ para valores desconocidos

Arquitectura del Modelo

1. Mecanismo de Puntuación de Características

Para un modelo lineal $\mathcal{L} = (\mathbf{w}, \theta)$ e instancia $\mathbf{x}$ , se define la puntuación de la característica $i$ como:

$s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)$

El signo de la puntuación indica si la característica "ayuda" (+1) o "daña" (-1) la clasificación, con la magnitud proporcional al peso de la característica.

2. Selección Codiciosa de Características

Lema Clave: Para modelos lineales, bajo distribución uniforme, seleccionar características en orden decreciente de puntuación es óptimo.

Específicamente, si $\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)}$ son instancias parciales definidas por las k características con mayor puntuación, entonces:

$\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]$

3. Estimación de Montecarlo

Se utiliza la desigualdad de Hoeffding para la estimación de probabilidades:

Para $m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta}$ muestras, se tiene:

$\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n$

Puntos de Innovación Técnica

Umbral de Probabilidad Aleatorizado: El algoritmo selecciona aleatoriamente $\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon])$ , evitando instancias difíciles
Estrategia de Búsqueda Binaria: Aprovecha la monotonicidad de probabilidades para búsqueda eficiente
Relajación de Garantías Teóricas: Obtiene complejidad de tiempo polinomial manteniendo practicidad

Configuración Experimental

Descripción del Algoritmo

Algoritmo 1: LinearMonteCarloExplainer

Entrada: Modelo lineal L, instancia x, parámetros δ, ε, β
1. δ* ← Muestrear uniformemente de [δ-ε, δ+ε]
2. Calcular todas las puntuaciones de características s_i
3. Construir secuencia de instancias parciales y^(0), ..., y^(n)
4. Establecer número de muestras m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Usar búsqueda binaria para encontrar k mínimo tal que probabilidad estimada ≥ δ*
6. Retornar (δ*, y^(k*))

Análisis Teórico

Teorema Principal: Dado un modelo lineal $\mathcal{L}$ e entrada $\mathbf{x}$ , se puede calcular (δ,ε)-min-SR en tiempo $\tilde{O}(\frac{n}{\varepsilon^2\delta^2})$ con probabilidad $1-\beta$ de éxito.

Análisis de Complejidad

Complejidad Temporal: $O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})$
Complejidad Espacial: $O(n)$
Probabilidad de Éxito: $1-\beta$

Resultados Experimentales

Resultados Principales

Comparación de Tratabilidad:
- Modelos lineales: Resolubles en tiempo polinomial
- Árboles de decisión: Inaproximabilidad fuerte (a menos que SAT sea resoluble en tiempo cuasipolinomial)
- Redes neuronales: NPPP-hard
Verificación con Ejemplos Concretos:
- El Ejemplo 2 muestra que 0.999999-SR puede ser 251 veces más pequeño que el mínimo 1-SR
- El Ejemplo 3 verifica la corrección de la estrategia de selección codiciosa

Hallazgos Teóricos

Resultados de Separación: Demuestra la ventaja fundamental de los modelos lineales sobre los árboles de decisión
Optimalidad Local vs Global: Para modelos lineales, cada δ-SR localmente mínimo es un δ-SR mínimo en subconjuntos
Brecha de Aproximación: Cambios pequeños en parámetros probabilísticos pueden resultar en diferencias de $\Omega(n^{1/2-\epsilon})$ en el tamaño de la explicación

Análisis de Casos

Análisis Detallado del Ejemplo 3:

Instancia: $\mathbf{x} = (1,0,0,1,1)$
Pesos: $\mathbf{w} = (5,1,-3,2,-1)$ , umbral: $\theta = 5$
Puntuaciones de características: $(5,-1,3,2,-1)$
Explicación óptima de 2 características: $\{1,3\}$ , probabilidad 7/8

Trabajo Relacionado

Cálculo de Razones Suficientes

Darwiche and Hirth (2020): Primera formalización del concepto de razones suficientes
Barceló et al. (2020): Establecimiento de jerarquía de complejidad para diferentes clases de modelos
Arenas et al. (2022): Demostración de dificultad de δ-SRs en árboles de decisión

Explicaciones Probabilísticas

Wäldchen et al. (2021): Introducción del concepto de δ-razones suficientes
Izza et al. (2023): Investigación de cálculo de explicaciones abdominales probabilísticas
Kozachinskiy (2023): Establecimiento de resultados de inaproximabilidad para árboles de decisión

Explicación de Modelos Lineales

Marques-Silva et al. (2020): Investigación de clasificadores lineales como Naive Bayes
Blanc et al. (2021): Explicaciones pequeñas relativas a complejidad de certificados

Conclusiones y Discusión

Conclusiones Principales

Avance Teórico: Primera demostración de computabilidad en tiempo polinomial de explicaciones probabilísticas en modelos lineales
Valor Práctico: El concepto (δ,ε)-SR mejora la practicidad manteniendo garantías teóricas
Separación de Modelos: Establece diferencia fundamental entre modelos lineales y árboles de decisión en complejidad computacional de explicaciones

Limitaciones

Eficiencia Práctica: Para datos de alta dimensión (como n=500), el cálculo sigue siendo costoso cuando ε=0.1, δ=0.01
Supuestos de Distribución: El algoritmo asume distribución uniforme; la extensión a distribuciones de producto requiere nuevas técnicas
Tipos de Características: Solo considera características binarias; aplicaciones reales requieren manejo de características continuas y categóricas

Direcciones Futuras

Optimización de Algoritmos: Reducir dependencia de 1/ε y 1/δ
Extensión de Distribuciones: Manejo de distribuciones de producto y distribuciones de características más generales
Tipos de Características: Extensión a "clasificadores lineales extendidos" con tipos de características mixtas
Lenguajes de Consulta: Diseño de lenguajes de consulta de explicaciones probabilísticas declarativos

Evaluación Profunda

Fortalezas

Contribuciones Teóricas Significativas:
- Primera demostración de tratabilidad de explicaciones probabilísticas en modelos lineales
- Proporciona análisis de complejidad completo y diseño de algoritmos
- Demuestra resultados de separación importantes
Innovación Metodológica:
- El concepto (δ,ε)-SR equilibra ingeniosamente teoría y practicidad
- Las técnicas de aleatorización evitan efectivamente instancias difíciles
- La prueba de la estrategia codiciosa es elegante y profunda
Análisis Profundo:
- Proporciona pruebas matemáticas detalladas
- Considera múltiples medidas de complejidad
- Establece conexiones claras con trabajo relacionado

Insuficiencias

Limitaciones de Practicidad:
- El algoritmo es sensible a parámetros, con eficiencia deficiente en casos de alta dimensión
- Solo aplicable a modelos lineales con características binarias
- El supuesto de distribución uniforme es fuerte en la práctica
Verificación Experimental Insuficiente:
- Falta verificación experimental en conjuntos de datos a gran escala
- Sin comparación con métodos heurísticos existentes
- Los resultados teóricos necesitan más apoyo empírico
Problemas de Escalabilidad:
- Desafíos técnicos significativos para extensión a configuraciones más generales
- Aplicabilidad poco clara a pipelines de ML prácticos

Impacto

Impacto Teórico: Proporciona resultado positivo importante para el campo de XAI Formal, rompiendo el enfoque predominante en dificultad
Inspiración Metodológica: Las técnicas de aleatorización y relajación pueden inspirar soluciones a otros problemas difíciles
Valor Práctico: Proporciona base teórica para interpretabilidad de modelos lineales

Escenarios de Aplicación

Gestión de Riesgo Financiero: Explicación de decisiones de préstamos en modelos de puntuación lineal
Diagnóstico Médico: Explicación de evaluaciones de riesgo basadas en regresión lineal
Sistemas de Recomendación: Análisis de importancia de características en modelos de recomendación lineal
Cumplimiento Legal: Explicación de decisiones automatizadas con garantías matemáticas

Referencias

Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Este artículo realiza contribuciones teóricas importantes en el campo de la IA Interpretable Formal, demostrando por primera vez la tratabilidad de explicaciones probabilísticas en modelos lineales, proporcionando un resultado positivo poco común en este campo. Aunque hay espacio para mejora en aspectos de practicidad, su valor teórico e innovación metodológica lo convierten en un trabajo importante en el área.