2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel
Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
academic

Explicaciones Probabilísticas para Modelos Lineales

Información Básica

  • ID del Artículo: 2501.00154
  • Título: Probabilistic Explanations for Linear Models
  • Autores: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
  • Clasificación: cs.AI (Inteligencia Artificial), cs.CC (Complejidad Computacional)
  • Fecha de Publicación: 3 de enero de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2501.00154

Resumen

Este artículo investiga el problema computacional de calcular "razones suficientes" en la IA Interpretable Formal (Formal XAI). Dado un modelo M y una instancia de entrada x, una razón suficiente es un subconjunto de características S de x tal que cualquier instancia z que coincida con x en S satisface M(x)=M(z). Para reducir el tamaño de las razones suficientes, los autores consideran una relajación probabilística: se requiere que cuando una instancia aleatoria z coincida con x en el conjunto de características, la probabilidad de que M(x)=M(z) sea al menos δ∈(0,1]. El cálculo de δ-razones suficientes (δ-SRs) pequeñas es teóricamente difícil, con resultados fuertes de inaproximabilidad incluso para modelos "interpretables" como árboles de decisión. Este artículo propone el concepto de (δ,ε)-SR, una relajación simple de δ-SRs, y demuestra que tales explicaciones pueden calcularse eficientemente en modelos lineales.

Contexto e Motivación de la Investigación

  1. Problema Central: Cómo proporcionar explicaciones de tamaño pequeño con garantías matemáticas para las decisiones de modelos de aprendizaje automático. Las razones suficientes tradicionales requieren certeza del 100%, pero esto a menudo resulta en explicaciones demasiado grandes para la comprensión humana.
  2. Importancia del Problema:
    • Miller (1956) señaló que las explicaciones con más de 9 características pueden ser demasiado grandes para los humanos
    • Investigaciones empíricas demuestran que las explicaciones deben ser concisas (Narayanan et al., 2018; Lage et al., 2019)
    • En aplicaciones prácticas, los usuarios se preocupan más por el tamaño de la explicación que por pequeñas diferencias en las garantías probabilísticas
  3. Limitaciones de Métodos Existentes:
    • El cálculo de δ-SRs mínimas es NP-hard incluso para árboles de decisión
    • Para modelos lineales, el cálculo exacto de probabilidades es #P-hard
    • Existen resultados fuertes de inaproximabilidad: no se pueden obtener buenos ratios de aproximación en tiempo polinomial
  4. Motivación de la Investigación:
    • Los usuarios son más sensibles al tamaño de la explicación que a cambios menores en las garantías probabilísticas
    • Se necesita encontrar un equilibrio entre la tratabilidad teórica y la practicidad
    • La estructura especial de los modelos lineales puede permitir algoritmos eficientes

Contribuciones Principales

  1. Propuesta del Concepto de (δ,ε)-Razón Suficiente Mínima: Una versión relajada que permite que las garantías probabilísticas varíen dentro del rango δ-ε, δ+ε
  2. Demostración de Tratabilidad en Modelos Lineales: Proporciona un algoritmo de tiempo polinomial para calcular (δ,ε)-min-SR con tiempo de ejecución Õ(n/ε²δ²)
  3. Establecimiento de Resultados de Separación Teórica: Demuestra que el problema sigue siendo difícil en árboles de decisión, destacando la naturaleza especial de los modelos lineales
  4. Demostración de Equivalencia de Minimalidad Local: Para modelos lineales, cada δ-SR localmente mínimo es un δ-SR mínimo en subconjuntos
  5. Análisis de Brechas de Aproximación: Demuestra que pequeños cambios en parámetros probabilísticos pueden resultar en diferencias exponenciales en el tamaño de la explicación

Explicación Detallada del Método

Definición de la Tarea

Entrada:

  • Modelo lineal L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta), donde wQn\mathbf{w} \in \mathbb{Q}^n, θQ\theta \in \mathbb{Q}
  • Instancia x{0,1}n\mathbf{x} \in \{0,1\}^n
  • Umbral de probabilidad δ(0,1)\delta \in (0,1) y tolerancia de error ε(0,1)\varepsilon \in (0,1)

Salida:

  • Valor δ[δε,δ+ε]\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]
  • Razón suficiente mínima δ\delta^* y\mathbf{y}

Restricciones:

  • L(x)=1\mathcal{L}(\mathbf{x}) = 1 si y solo si xwθ\mathbf{x} \cdot \mathbf{w} \geq \theta
  • Instancia parcial yx\mathbf{y} \sqsubseteq \mathbf{x} utilizando \star para valores desconocidos

Arquitectura del Modelo

1. Mecanismo de Puntuación de Características

Para un modelo lineal L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta) e instancia x\mathbf{x}, se define la puntuación de la característica ii como:

si=wi(2xi1)(2L(x)1)s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)

El signo de la puntuación indica si la característica "ayuda" (+1) o "daña" (-1) la clasificación, con la magnitud proporcional al peso de la característica.

2. Selección Codiciosa de Características

Lema Clave: Para modelos lineales, bajo distribución uniforme, seleccionar características en orden decreciente de puntuación es óptimo.

Específicamente, si y(0),,y(n)\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)} son instancias parciales definidas por las k características con mayor puntuación, entonces:

PrzU(y(k+1))[L(z)=L(x)]PrzU(y(k))[L(z)=L(x)]\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]

3. Estimación de Montecarlo

Se utiliza la desigualdad de Hoeffding para la estimación de probabilidades:

Para m=log2n2ε2δ2log2lognβm = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta} muestras, se tiene:

Pr[p^(m)pεδ/logn]1β/logn\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n

Puntos de Innovación Técnica

  1. Umbral de Probabilidad Aleatorizado: El algoritmo selecciona aleatoriamente δU([δε,δ+ε])\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon]), evitando instancias difíciles
  2. Estrategia de Búsqueda Binaria: Aprovecha la monotonicidad de probabilidades para búsqueda eficiente
  3. Relajación de Garantías Teóricas: Obtiene complejidad de tiempo polinomial manteniendo practicidad

Configuración Experimental

Descripción del Algoritmo

Algoritmo 1: LinearMonteCarloExplainer

Entrada: Modelo lineal L, instancia x, parámetros δ, ε, β
1. δ* ← Muestrear uniformemente de [δ-ε, δ+ε]
2. Calcular todas las puntuaciones de características s_i
3. Construir secuencia de instancias parciales y^(0), ..., y^(n)
4. Establecer número de muestras m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Usar búsqueda binaria para encontrar k mínimo tal que probabilidad estimada ≥ δ*
6. Retornar (δ*, y^(k*))

Análisis Teórico

Teorema Principal: Dado un modelo lineal L\mathcal{L} e entrada x\mathbf{x}, se puede calcular (δ,ε)-min-SR en tiempo O~(nε2δ2)\tilde{O}(\frac{n}{\varepsilon^2\delta^2}) con probabilidad 1β1-\beta de éxito.

Análisis de Complejidad

  • Complejidad Temporal: O(lognmn)=O~(nε2δ2)O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})
  • Complejidad Espacial: O(n)O(n)
  • Probabilidad de Éxito: 1β1-\beta

Resultados Experimentales

Resultados Principales

  1. Comparación de Tratabilidad:
    • Modelos lineales: Resolubles en tiempo polinomial
    • Árboles de decisión: Inaproximabilidad fuerte (a menos que SAT sea resoluble en tiempo cuasipolinomial)
    • Redes neuronales: NPPP-hard
  2. Verificación con Ejemplos Concretos:
    • El Ejemplo 2 muestra que 0.999999-SR puede ser 251 veces más pequeño que el mínimo 1-SR
    • El Ejemplo 3 verifica la corrección de la estrategia de selección codiciosa

Hallazgos Teóricos

  1. Resultados de Separación: Demuestra la ventaja fundamental de los modelos lineales sobre los árboles de decisión
  2. Optimalidad Local vs Global: Para modelos lineales, cada δ-SR localmente mínimo es un δ-SR mínimo en subconjuntos
  3. Brecha de Aproximación: Cambios pequeños en parámetros probabilísticos pueden resultar en diferencias de Ω(n1/2ϵ)\Omega(n^{1/2-\epsilon}) en el tamaño de la explicación

Análisis de Casos

Análisis Detallado del Ejemplo 3:

  • Instancia: x=(1,0,0,1,1)\mathbf{x} = (1,0,0,1,1)
  • Pesos: w=(5,1,3,2,1)\mathbf{w} = (5,1,-3,2,-1), umbral: θ=5\theta = 5
  • Puntuaciones de características: (5,1,3,2,1)(5,-1,3,2,-1)
  • Explicación óptima de 2 características: {1,3}\{1,3\}, probabilidad 7/8

Trabajo Relacionado

Cálculo de Razones Suficientes

  1. Darwiche and Hirth (2020): Primera formalización del concepto de razones suficientes
  2. Barceló et al. (2020): Establecimiento de jerarquía de complejidad para diferentes clases de modelos
  3. Arenas et al. (2022): Demostración de dificultad de δ-SRs en árboles de decisión

Explicaciones Probabilísticas

  1. Wäldchen et al. (2021): Introducción del concepto de δ-razones suficientes
  2. Izza et al. (2023): Investigación de cálculo de explicaciones abdominales probabilísticas
  3. Kozachinskiy (2023): Establecimiento de resultados de inaproximabilidad para árboles de decisión

Explicación de Modelos Lineales

  1. Marques-Silva et al. (2020): Investigación de clasificadores lineales como Naive Bayes
  2. Blanc et al. (2021): Explicaciones pequeñas relativas a complejidad de certificados

Conclusiones y Discusión

Conclusiones Principales

  1. Avance Teórico: Primera demostración de computabilidad en tiempo polinomial de explicaciones probabilísticas en modelos lineales
  2. Valor Práctico: El concepto (δ,ε)-SR mejora la practicidad manteniendo garantías teóricas
  3. Separación de Modelos: Establece diferencia fundamental entre modelos lineales y árboles de decisión en complejidad computacional de explicaciones

Limitaciones

  1. Eficiencia Práctica: Para datos de alta dimensión (como n=500), el cálculo sigue siendo costoso cuando ε=0.1, δ=0.01
  2. Supuestos de Distribución: El algoritmo asume distribución uniforme; la extensión a distribuciones de producto requiere nuevas técnicas
  3. Tipos de Características: Solo considera características binarias; aplicaciones reales requieren manejo de características continuas y categóricas

Direcciones Futuras

  1. Optimización de Algoritmos: Reducir dependencia de 1/ε y 1/δ
  2. Extensión de Distribuciones: Manejo de distribuciones de producto y distribuciones de características más generales
  3. Tipos de Características: Extensión a "clasificadores lineales extendidos" con tipos de características mixtas
  4. Lenguajes de Consulta: Diseño de lenguajes de consulta de explicaciones probabilísticas declarativos

Evaluación Profunda

Fortalezas

  1. Contribuciones Teóricas Significativas:
    • Primera demostración de tratabilidad de explicaciones probabilísticas en modelos lineales
    • Proporciona análisis de complejidad completo y diseño de algoritmos
    • Demuestra resultados de separación importantes
  2. Innovación Metodológica:
    • El concepto (δ,ε)-SR equilibra ingeniosamente teoría y practicidad
    • Las técnicas de aleatorización evitan efectivamente instancias difíciles
    • La prueba de la estrategia codiciosa es elegante y profunda
  3. Análisis Profundo:
    • Proporciona pruebas matemáticas detalladas
    • Considera múltiples medidas de complejidad
    • Establece conexiones claras con trabajo relacionado

Insuficiencias

  1. Limitaciones de Practicidad:
    • El algoritmo es sensible a parámetros, con eficiencia deficiente en casos de alta dimensión
    • Solo aplicable a modelos lineales con características binarias
    • El supuesto de distribución uniforme es fuerte en la práctica
  2. Verificación Experimental Insuficiente:
    • Falta verificación experimental en conjuntos de datos a gran escala
    • Sin comparación con métodos heurísticos existentes
    • Los resultados teóricos necesitan más apoyo empírico
  3. Problemas de Escalabilidad:
    • Desafíos técnicos significativos para extensión a configuraciones más generales
    • Aplicabilidad poco clara a pipelines de ML prácticos

Impacto

  1. Impacto Teórico: Proporciona resultado positivo importante para el campo de XAI Formal, rompiendo el enfoque predominante en dificultad
  2. Inspiración Metodológica: Las técnicas de aleatorización y relajación pueden inspirar soluciones a otros problemas difíciles
  3. Valor Práctico: Proporciona base teórica para interpretabilidad de modelos lineales

Escenarios de Aplicación

  1. Gestión de Riesgo Financiero: Explicación de decisiones de préstamos en modelos de puntuación lineal
  2. Diagnóstico Médico: Explicación de evaluaciones de riesgo basadas en regresión lineal
  3. Sistemas de Recomendación: Análisis de importancia de características en modelos de recomendación lineal
  4. Cumplimiento Legal: Explicación de decisiones automatizadas con garantías matemáticas

Referencias

  1. Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
  2. Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
  3. Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
  4. Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
  5. Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Este artículo realiza contribuciones teóricas importantes en el campo de la IA Interpretable Formal, demostrando por primera vez la tratabilidad de explicaciones probabilísticas en modelos lineales, proporcionando un resultado positivo poco común en este campo. Aunque hay espacio para mejora en aspectos de practicidad, su valor teórico e innovación metodológica lo convierten en un trabajo importante en el área.