2025-11-12T13:34:14.831387

Efficient & Correct Predictive Equivalence for Decision Trees

Marques-Silva, Ignatiev
The Rashomon set of decision trees (DTs) finds importance uses. Recent work showed that DTs computing the same classification function, i.e. predictive equivalent DTs, can represent a significant fraction of the Rashomon set. Such redundancy is undesirable. For example, feature importance based on the Rashomon set becomes inaccurate due the existence of predictive equivalent DTs, i.e. DTs with the same prediction for every possible input. In recent work, McTavish et al. proposed solutions for several computational problems related with DTs, including that of deciding predictive equivalent DTs. The approach of McTavish et al. consists of applying the well-known method of Quine-McCluskey (QM) for obtaining minimum-size DNF (disjunctive normal form) representations of DTs, which are then used for comparing DTs for predictive equivalence. Furthermore, the minimum-size DNF representation was also applied to computing explanations for the predictions made by DTs, and to finding predictions in the presence of missing data. However, the problem of formula minimization is hard for the second level of the polynomial hierarchy, and the QM method may exhibit worst-case exponential running time and space. This paper first demonstrates that there exist decision trees that trigger the worst-case exponential running time and space of the QM method. Second, the paper shows that the QM method may incorrectly decide predictive equivalence, if two key constraints are not respected, and one may be difficult to formally guarantee. Third, the paper shows that any of the problems to which the smallest DNF representation has been applied to can be solved in polynomial time, in the size of the DT. The experiments confirm that, for DTs for which the worst-case of the QM method is triggered, the algorithms proposed in this paper are orders of magnitude faster than the ones proposed by McTavish et al.
academic

Equivalencia Predictiva Eficiente y Correcta para Árboles de Decisión

Información Básica

  • ID del Artículo: 2509.17774
  • Título: Efficient & Correct Predictive Equivalence for Decision Trees
  • Autores: João Marques-Silva (ICREA & University of Lleida), Alexey Ignatiev (Monash University)
  • Clasificación: cs.AI cs.LG cs.LO
  • Fecha de Publicación/Conferencia: Journal of Machine Learning Research 23 (2025) 1-35
  • Enlace del Artículo: https://arxiv.org/abs/2509.17774

Resumen

Los conjuntos de Rashomon de árboles de decisión tienen un valor aplicativo significativo. Investigaciones recientes demuestran que los árboles de decisión que calculan la misma función de clasificación (es decir, árboles de decisión predictivamente equivalentes) pueden constituir una gran proporción del conjunto de Rashomon. Esta redundancia es indeseable; por ejemplo, la importancia de características basada en conjuntos de Rashomon se vuelve inexacta debido a la existencia de árboles de decisión predictivamente equivalentes. McTavish et al. propusieron recientemente una solución para problemas computacionales relacionados con árboles de decisión, incluyendo la determinación de equivalencia predictiva. Su método utiliza el famoso método de Quine-McCluskey (QM) para obtener una representación DNF mínima del árbol de decisión, que luego se utiliza para comparar la equivalencia predictiva de árboles de decisión. Sin embargo, el problema de minimización de fórmulas es difícil para la segunda capa de la jerarquía polinomial, y el método QM puede exhibir complejidad de tiempo y espacio exponencial en el peor caso. Este artículo primero demuestra que existen árboles de decisión que desencadenan la complejidad exponencial del peor caso del método QM; segundo, muestra que el método QM puede juzgar incorrectamente la equivalencia predictiva si no se cumplen dos restricciones clave; y finalmente, demuestra que todos los problemas que aplican representaciones DNF mínimas pueden resolverse en tiempo polinomial respecto al tamaño del árbol de decisión.

Antecedentes de Investigación y Motivación

Definición del Problema

El problema central que aborda este artículo es la eficiencia y corrección en la determinación de equivalencia predictiva de árboles de decisión. Los árboles de decisión predictivamente equivalentes son árboles diferentes que producen los mismos resultados de predicción para cualquier entrada.

Importancia del Problema

  1. Optimización del Conjunto de Rashomon: En aprendizaje automático, el conjunto de Rashomon contiene múltiples modelos con rendimiento similar. Los árboles de decisión predictivamente equivalentes causan redundancia en este conjunto, afectando la precisión de la evaluación de importancia de características.
  2. Requisitos de Interpretabilidad: Los árboles de decisión se reconocen ampliamente como modelos interpretables, pero incluso los árboles óptimos requieren explicación formalizada, particularmente en aplicaciones de alto riesgo.
  3. Eficiencia Computacional: Los métodos existentes enfrentan cuellos de botella computacionales graves al procesar árboles de decisión a gran escala.

Limitaciones de Métodos Existentes

El método propuesto por McTavish et al. basado en el algoritmo de Quine-McCluskey (QM) presenta los siguientes problemas:

  1. Complejidad Computacional: El método QM resuelve problemas Σₚ²-hard, requiriendo tiempo y espacio exponencial en el peor caso
  2. Problemas de Corrección: Puede producir resultados incorrectos cuando no se cumplen restricciones específicas
  3. Viabilidad Práctica: Se sabe que el método QM tiene pobre escalabilidad para problemas con decenas de variables

Contribuciones Principales

  1. Análisis Teórico: Demuestra la existencia de árboles de decisión que desencadenan la complejidad exponencial del peor caso del método QM
  2. Análisis de Corrección: Revela problemas potenciales de incorrección en el método QM para la determinación de equivalencia predictiva
  3. Algoritmo Eficiente: Propone un algoritmo de tiempo polinomial para resolver problemas de completitud, concisión y determinación de equivalencia predictiva
  4. Verificación Experimental: En árboles de decisión que desencadenan el peor caso de QM, el nuevo algoritmo es varios órdenes de magnitud más rápido que los métodos existentes
  5. Conexiones Teóricas: Establece conexiones teóricas entre equivalencia predictiva, explicaciones lógicas y medidas de importancia

Explicación Detallada del Método

Definición de Tareas

Dados dos árboles de decisión T₁ y T₂, determinar si son predictivamente equivalentes, es decir:

∀(x ∈ F). (κₜ₁(x) = κₜ₂(x))

donde F es el espacio de características y κ es la función de clasificación.

Marco Técnico Principal

1. Método de Explicación Débil Inductiva (WAXp)

El artículo propone un algoritmo de tiempo polinomial basado en WAXp:

Algoritmo 1: Verificación de Consistencia de Ruta

def ConsistentPath(A, P, T):
    # Verifica la consistencia de la asignación parcial A con la ruta P del árbol
    for each feature i:
        combine literals from A and P for feature i
        if inconsistent: return False
    return True

Algoritmo 2: Determinación de WAXp

def IsWAXp(A, c, T):
    # Determina si la asignación parcial A es un WAXp para la clase c
    for each path P in T:
        if Class(P) != c and ConsistentPath(A, P, T):
            return False  # A es consistente con ruta de otra clase
    return True

2. Algoritmo de Determinación de Equivalencia Predictiva

Algoritmo 5: Determinación de Equivalencia Predictiva

def PredictivelyEquivalent(T1, T2):
    for P1 in Paths(T1):
        c1 = Class(P1)
        A1 = Literals(P1)  # Crea asignación parcial
        for P2 in Paths(T2):
            c2 = Class(P2)
            if c1 != c2 and ConsistentPath(A1, P2, T2):
                return False  # Encuentra evidencia de no equivalencia
    return True  # No puede probar no equivalencia, por lo tanto equivalente

Puntos de Innovación Técnica

  1. Evitar Complejidad Exponencial: Opera directamente en la estructura del árbol de decisión, evitando generar representaciones BCF potencialmente exponenciales
  2. Garantía de Tiempo Polinomial: Todos los algoritmos tienen complejidad de tiempo polinomial respecto al tamaño del árbol de decisión
  3. Corrección Formalizada: Proporciona pruebas matemáticas rigurosas que garantizan la corrección del algoritmo
  4. Paralelizable: El algoritmo de equivalencia predictiva puede paralelizarse para mejorar aún más la eficiencia

Configuración Experimental

Casos de Prueba Construidos

El artículo utiliza construcciones especiales de árboles de decisión basadas en el Teorema 1:

  • Parámetro r: Controla la complejidad del árbol
  • Número de Nodos: 6r + 3 nodos
  • Número de Características: 2r + 1 características
  • Tamaño BCF: Para la clase 1, límite inferior de 2^r términos primos implicantes

Métricas de Evaluación

  1. Tiempo de Ejecución: Tiempo de ejecución del algoritmo (segundos)
  2. Tamaño BCF: Cantidad de términos primos implicantes en la forma estándar de Blake
  3. Escalabilidad: Capacidad de procesar árboles de decisión de diferentes tamaños

Métodos de Comparación

  • Implementación QM de SymPy: Método de referencia utilizado por McTavish et al.
  • Generación BCF Independiente: Pasos de generación de términos primos implicantes QM estándar implementados por los autores

Detalles de Implementación

  • Plataforma: Procesador Macbook M3 Pro
  • Lenguaje de Programación: Python
  • Límite de Tiempo de Espera: Límite de tiempo de espera de 150000 segundos para el método QM

Resultados Experimentales

Resultados Principales

Verificación de Complejidad Exponencial del Método QM

rTiempo SymPy(s)|BCF₀(T)||BCF₁(T)|Tiempo BCF(s)
30.134220.01
40.575460.07
539.606940.84
62789.45719011.28
7>150000.008382161.25

Rendimiento de Escalabilidad del Nuevo Algoritmo

rNodos DTCaracterísticas|BCF₁(T)|Un AXp¿isWAXp?¿PE?
20012034012²⁰⁰1.71s0.005s3.7s
500300310012⁵⁰⁰26.98s0.032s57.1s
1000600320012¹⁰⁰⁰224.62s0.126s469.0s

Hallazgos Clave

  1. Confirmación de Crecimiento Exponencial: El tamaño de BCF₁(T) crece exponencialmente con r, verificando el análisis teórico
  2. Brecha de Rendimiento Masiva: Para r=200, el nuevo algoritmo procesa un árbol de decisión de 1203 nodos en segundos, mientras que el método QM agota el tiempo de espera con solo 57 nodos
  3. Verificación de Practicidad: El nuevo algoritmo puede procesar árboles de decisión a gran escala que pueden aparecer en aplicaciones reales

Trabajo Relacionado

Investigación del Conjunto de Rashomon

  • Concepto Fundamental: Breiman (2001) introdujo por primera vez el concepto de conjunto de Rashomon
  • Desarrollos Recientes: Trabajo de Fisher et al., Semenova et al. en importancia de características
  • Equivalencia Predictiva: McTavish et al. realizaron el primer estudio sistemático de equivalencia predictiva de árboles de decisión

IA Explicable Basada en Lógica Formal

  • Explicaciones Formalizadas: Trabajo de Marques-Silva et al. en AXp y CXp
  • Complejidad Computacional: Múltiples investigaciones han demostrado la complejidad del cálculo de explicaciones
  • Medidas de Interpretabilidad: Aplicación de valores de Shapley y Banzhaf en aprendizaje automático

Minimización de Fórmulas Booleanas

  • Métodos Clásicos: Desarrollo histórico del algoritmo de Quine-McCluskey
  • Teoría de Complejidad: Establecimiento de complejidad Σₚ²-hard
  • Limitaciones Prácticas: Se sabe que el método QM tiene eficiencia drásticamente reducida cuando el número de variables excede 8

Conclusiones y Discusión

Conclusiones Principales

  1. Contribución Teórica: Demuestra que el método QM efectivamente encuentra complejidad exponencial en árboles de decisión
  2. Contribución de Algoritmo: Proporciona un algoritmo alternativo de tiempo polinomial
  3. Valor Práctico: El nuevo algoritmo tiene ventajas significativas en aplicaciones prácticas
  4. Conexiones Teóricas: Establece conexiones entre equivalencia predictiva y múltiples conceptos de XAI

Limitaciones

  1. Implementación en Python: Los experimentos utilizan Python, lo que puede afectar los valores absolutos de la evaluación de rendimiento
  2. Construcciones Especiales: Los experimentos se centran principalmente en árboles de decisión especialmente construidos
  3. Paralelización: El potencial de paralelización del algoritmo de equivalencia predictiva no se ha verificado en clústeres a gran escala
  4. Generalidad: Se requiere más verificación en conjuntos de datos reales

Direcciones Futuras

  1. Algoritmos Asintóticamente Óptimos: Búsqueda de algoritmos teóricamente óptimos
  2. Otros Tipos de Modelos: Extensión del método a otros modelos interpretables
  3. Aplicaciones Prácticas: Aplicación en optimización real del conjunto de Rashomon
  4. Implementación Paralela: Desarrollo de implementaciones paralelizadas a gran escala

Evaluación Profunda

Fortalezas

  1. Rigor Teórico: Proporciona pruebas matemáticas completas y análisis de complejidad
  2. Alto Valor Práctico: Resuelve los problemas de rendimiento fundamentales de los métodos existentes
  3. Fuerte Innovación: Primer análisis sistemático de problemas del método QM en árboles de decisión
  4. Experimentación Suficiente: Verificación tanto en construcciones teóricas como en pruebas de escala práctica
  5. Escritura Clara: Estructura de artículo bien organizada, descripción clara de detalles técnicos

Insuficiencias

  1. Rango de Experimentos: Verificación principalmente en casos de prueba construidos, falta de resultados en conjuntos de datos reales
  2. Lenguaje de Implementación: El uso de Python puede no ser la opción óptima, afectando la persuasión de comparaciones de rendimiento
  3. Verificación de Aplicación: Falta de verificación en tareas reales de optimización del conjunto de Rashomon
  4. Análisis de Restricciones QM: Análisis insuficiente de la alcanzabilidad práctica de restricciones de corrección del método QM

Impacto

  1. Valor Académico: Proporciona nuevas herramientas teóricas para investigación de árboles de decisión
  2. Significado Práctico: Puede cambiar los métodos prácticos de análisis del conjunto de Rashomon
  3. Reproducibilidad: Descripción clara del algoritmo, fácil de reproducir
  4. Extensibilidad: El método puede ser aplicable a otros modelos interpretables

Escenarios Aplicables

  1. Aplicaciones de Alto Riesgo: Campos como medicina y finanzas que requieren IA explicable
  2. Selección de Modelos: Escenarios que requieren seleccionar entre múltiples modelos equivalentes
  3. Análisis de Importancia de Características: Aplicaciones que requieren evaluación precisa de importancia de características
  4. Aplicaciones Industriales: Aplicaciones industriales que procesan árboles de decisión complejos

Referencias

Este artículo cita un amplio trabajo relacionado, incluyendo principalmente:

  1. Conjunto de Rashomon: Breiman (2001), Xin et al. (2022), Fisher et al. (2019)
  2. IA Explicable Basada en Lógica: Marques-Silva (2022), Darwiche (2023), Ignatiev et al. (2019)
  3. Minimización de Funciones Booleanas: Quine (1952, 1955), McCluskey (1956), Umans (1998)
  4. Optimización de Árboles de Decisión: Bertsimas & Dunn (2017), Hu et al. (2019), Demirovic et al. (2022)

Evaluación General: Este es un artículo de alta calidad que combina teoría y práctica, no solo revelando defectos fundamentales de métodos existentes sino también proporcionando soluciones prácticas. El análisis teórico del artículo es riguroso, la verificación experimental es suficiente, y realiza contribuciones importantes a los campos de árboles de decisión e IA explicable.