2025-11-12T13:34:14.831387

Efficient & Correct Predictive Equivalence for Decision Trees

Marques-Silva, Ignatiev

The Rashomon set of decision trees (DTs) finds importance uses. Recent work showed that DTs computing the same classification function, i.e. predictive equivalent DTs, can represent a significant fraction of the Rashomon set. Such redundancy is undesirable. For example, feature importance based on the Rashomon set becomes inaccurate due the existence of predictive equivalent DTs, i.e. DTs with the same prediction for every possible input. In recent work, McTavish et al. proposed solutions for several computational problems related with DTs, including that of deciding predictive equivalent DTs. The approach of McTavish et al. consists of applying the well-known method of Quine-McCluskey (QM) for obtaining minimum-size DNF (disjunctive normal form) representations of DTs, which are then used for comparing DTs for predictive equivalence. Furthermore, the minimum-size DNF representation was also applied to computing explanations for the predictions made by DTs, and to finding predictions in the presence of missing data. However, the problem of formula minimization is hard for the second level of the polynomial hierarchy, and the QM method may exhibit worst-case exponential running time and space. This paper first demonstrates that there exist decision trees that trigger the worst-case exponential running time and space of the QM method. Second, the paper shows that the QM method may incorrectly decide predictive equivalence, if two key constraints are not respected, and one may be difficult to formally guarantee. Third, the paper shows that any of the problems to which the smallest DNF representation has been applied to can be solved in polynomial time, in the size of the DT. The experiments confirm that, for DTs for which the worst-case of the QM method is triggered, the algorithms proposed in this paper are orders of magnitude faster than the ones proposed by McTavish et al.

academic

Equivalencia Predictiva Eficiente y Correcta para Árboles de Decisión

Información Básica

ID del Artículo: 2509.17774
Título: Efficient & Correct Predictive Equivalence for Decision Trees
Autores: João Marques-Silva (ICREA & University of Lleida), Alexey Ignatiev (Monash University)
Clasificación: cs.AI cs.LG cs.LO
Fecha de Publicación/Conferencia: Journal of Machine Learning Research 23 (2025) 1-35
Enlace del Artículo: https://arxiv.org/abs/2509.17774

Resumen

Los conjuntos de Rashomon de árboles de decisión tienen un valor aplicativo significativo. Investigaciones recientes demuestran que los árboles de decisión que calculan la misma función de clasificación (es decir, árboles de decisión predictivamente equivalentes) pueden constituir una gran proporción del conjunto de Rashomon. Esta redundancia es indeseable; por ejemplo, la importancia de características basada en conjuntos de Rashomon se vuelve inexacta debido a la existencia de árboles de decisión predictivamente equivalentes. McTavish et al. propusieron recientemente una solución para problemas computacionales relacionados con árboles de decisión, incluyendo la determinación de equivalencia predictiva. Su método utiliza el famoso método de Quine-McCluskey (QM) para obtener una representación DNF mínima del árbol de decisión, que luego se utiliza para comparar la equivalencia predictiva de árboles de decisión. Sin embargo, el problema de minimización de fórmulas es difícil para la segunda capa de la jerarquía polinomial, y el método QM puede exhibir complejidad de tiempo y espacio exponencial en el peor caso. Este artículo primero demuestra que existen árboles de decisión que desencadenan la complejidad exponencial del peor caso del método QM; segundo, muestra que el método QM puede juzgar incorrectamente la equivalencia predictiva si no se cumplen dos restricciones clave; y finalmente, demuestra que todos los problemas que aplican representaciones DNF mínimas pueden resolverse en tiempo polinomial respecto al tamaño del árbol de decisión.

Antecedentes de Investigación y Motivación

Definición del Problema

El problema central que aborda este artículo es la eficiencia y corrección en la determinación de equivalencia predictiva de árboles de decisión. Los árboles de decisión predictivamente equivalentes son árboles diferentes que producen los mismos resultados de predicción para cualquier entrada.

Importancia del Problema

Optimización del Conjunto de Rashomon: En aprendizaje automático, el conjunto de Rashomon contiene múltiples modelos con rendimiento similar. Los árboles de decisión predictivamente equivalentes causan redundancia en este conjunto, afectando la precisión de la evaluación de importancia de características.
Requisitos de Interpretabilidad: Los árboles de decisión se reconocen ampliamente como modelos interpretables, pero incluso los árboles óptimos requieren explicación formalizada, particularmente en aplicaciones de alto riesgo.
Eficiencia Computacional: Los métodos existentes enfrentan cuellos de botella computacionales graves al procesar árboles de decisión a gran escala.

Limitaciones de Métodos Existentes

El método propuesto por McTavish et al. basado en el algoritmo de Quine-McCluskey (QM) presenta los siguientes problemas:

Complejidad Computacional: El método QM resuelve problemas Σₚ²-hard, requiriendo tiempo y espacio exponencial en el peor caso
Problemas de Corrección: Puede producir resultados incorrectos cuando no se cumplen restricciones específicas
Viabilidad Práctica: Se sabe que el método QM tiene pobre escalabilidad para problemas con decenas de variables

Contribuciones Principales

Análisis Teórico: Demuestra la existencia de árboles de decisión que desencadenan la complejidad exponencial del peor caso del método QM
Análisis de Corrección: Revela problemas potenciales de incorrección en el método QM para la determinación de equivalencia predictiva
Algoritmo Eficiente: Propone un algoritmo de tiempo polinomial para resolver problemas de completitud, concisión y determinación de equivalencia predictiva
Verificación Experimental: En árboles de decisión que desencadenan el peor caso de QM, el nuevo algoritmo es varios órdenes de magnitud más rápido que los métodos existentes
Conexiones Teóricas: Establece conexiones teóricas entre equivalencia predictiva, explicaciones lógicas y medidas de importancia

Explicación Detallada del Método

Definición de Tareas

Dados dos árboles de decisión T₁ y T₂, determinar si son predictivamente equivalentes, es decir:

∀(x ∈ F). (κₜ₁(x) = κₜ₂(x))

donde F es el espacio de características y κ es la función de clasificación.

Marco Técnico Principal

1. Método de Explicación Débil Inductiva (WAXp)

El artículo propone un algoritmo de tiempo polinomial basado en WAXp:

Algoritmo 1: Verificación de Consistencia de Ruta

def ConsistentPath(A, P, T):
    # Verifica la consistencia de la asignación parcial A con la ruta P del árbol
    for each feature i:
        combine literals from A and P for feature i
        if inconsistent: return False
    return True

Algoritmo 2: Determinación de WAXp

def IsWAXp(A, c, T):
    # Determina si la asignación parcial A es un WAXp para la clase c
    for each path P in T:
        if Class(P) != c and ConsistentPath(A, P, T):
            return False  # A es consistente con ruta de otra clase
    return True

2. Algoritmo de Determinación de Equivalencia Predictiva

Algoritmo 5: Determinación de Equivalencia Predictiva

def PredictivelyEquivalent(T1, T2):
    for P1 in Paths(T1):
        c1 = Class(P1)
        A1 = Literals(P1)  # Crea asignación parcial
        for P2 in Paths(T2):
            c2 = Class(P2)
            if c1 != c2 and ConsistentPath(A1, P2, T2):
                return False  # Encuentra evidencia de no equivalencia
    return True  # No puede probar no equivalencia, por lo tanto equivalente

Puntos de Innovación Técnica

Evitar Complejidad Exponencial: Opera directamente en la estructura del árbol de decisión, evitando generar representaciones BCF potencialmente exponenciales
Garantía de Tiempo Polinomial: Todos los algoritmos tienen complejidad de tiempo polinomial respecto al tamaño del árbol de decisión
Corrección Formalizada: Proporciona pruebas matemáticas rigurosas que garantizan la corrección del algoritmo
Paralelizable: El algoritmo de equivalencia predictiva puede paralelizarse para mejorar aún más la eficiencia

Configuración Experimental

Casos de Prueba Construidos

El artículo utiliza construcciones especiales de árboles de decisión basadas en el Teorema 1:

Parámetro r: Controla la complejidad del árbol
Número de Nodos: 6r + 3 nodos
Número de Características: 2r + 1 características
Tamaño BCF: Para la clase 1, límite inferior de 2^r términos primos implicantes

Métricas de Evaluación

Tiempo de Ejecución: Tiempo de ejecución del algoritmo (segundos)
Tamaño BCF: Cantidad de términos primos implicantes en la forma estándar de Blake
Escalabilidad: Capacidad de procesar árboles de decisión de diferentes tamaños

Métodos de Comparación

Implementación QM de SymPy: Método de referencia utilizado por McTavish et al.
Generación BCF Independiente: Pasos de generación de términos primos implicantes QM estándar implementados por los autores

Detalles de Implementación

Plataforma: Procesador Macbook M3 Pro
Lenguaje de Programación: Python
Límite de Tiempo de Espera: Límite de tiempo de espera de 150000 segundos para el método QM

Resultados Experimentales

Resultados Principales

Verificación de Complejidad Exponencial del Método QM

r	Tiempo SymPy(s)	\|BCF₀(T)\|	\|BCF₁(T)\|	Tiempo BCF(s)
3	0.13	4	22	0.01
4	0.57	5	46	0.07
5	39.60	6	94	0.84
6	2789.45	7	190	11.28
7	>150000.00	8	382	161.25

Rendimiento de Escalabilidad del Nuevo Algoritmo

r	Nodos DT	Características	\|BCF₁(T)\|	Un AXp	¿isWAXp?	¿PE?
200	1203	401	2²⁰⁰	1.71s	0.005s	3.7s
500	3003	1001	2⁵⁰⁰	26.98s	0.032s	57.1s
1000	6003	2001	2¹⁰⁰⁰	224.62s	0.126s	469.0s

Hallazgos Clave

Confirmación de Crecimiento Exponencial: El tamaño de BCF₁(T) crece exponencialmente con r, verificando el análisis teórico
Brecha de Rendimiento Masiva: Para r=200, el nuevo algoritmo procesa un árbol de decisión de 1203 nodos en segundos, mientras que el método QM agota el tiempo de espera con solo 57 nodos
Verificación de Practicidad: El nuevo algoritmo puede procesar árboles de decisión a gran escala que pueden aparecer en aplicaciones reales

Trabajo Relacionado

Investigación del Conjunto de Rashomon

Concepto Fundamental: Breiman (2001) introdujo por primera vez el concepto de conjunto de Rashomon
Desarrollos Recientes: Trabajo de Fisher et al., Semenova et al. en importancia de características
Equivalencia Predictiva: McTavish et al. realizaron el primer estudio sistemático de equivalencia predictiva de árboles de decisión

IA Explicable Basada en Lógica Formal

Explicaciones Formalizadas: Trabajo de Marques-Silva et al. en AXp y CXp
Complejidad Computacional: Múltiples investigaciones han demostrado la complejidad del cálculo de explicaciones
Medidas de Interpretabilidad: Aplicación de valores de Shapley y Banzhaf en aprendizaje automático

Minimización de Fórmulas Booleanas

Métodos Clásicos: Desarrollo histórico del algoritmo de Quine-McCluskey
Teoría de Complejidad: Establecimiento de complejidad Σₚ²-hard
Limitaciones Prácticas: Se sabe que el método QM tiene eficiencia drásticamente reducida cuando el número de variables excede 8

Conclusiones y Discusión

Conclusiones Principales

Contribución Teórica: Demuestra que el método QM efectivamente encuentra complejidad exponencial en árboles de decisión
Contribución de Algoritmo: Proporciona un algoritmo alternativo de tiempo polinomial
Valor Práctico: El nuevo algoritmo tiene ventajas significativas en aplicaciones prácticas
Conexiones Teóricas: Establece conexiones entre equivalencia predictiva y múltiples conceptos de XAI

Limitaciones

Implementación en Python: Los experimentos utilizan Python, lo que puede afectar los valores absolutos de la evaluación de rendimiento
Construcciones Especiales: Los experimentos se centran principalmente en árboles de decisión especialmente construidos
Paralelización: El potencial de paralelización del algoritmo de equivalencia predictiva no se ha verificado en clústeres a gran escala
Generalidad: Se requiere más verificación en conjuntos de datos reales

Direcciones Futuras

Algoritmos Asintóticamente Óptimos: Búsqueda de algoritmos teóricamente óptimos
Otros Tipos de Modelos: Extensión del método a otros modelos interpretables
Aplicaciones Prácticas: Aplicación en optimización real del conjunto de Rashomon
Implementación Paralela: Desarrollo de implementaciones paralelizadas a gran escala

Evaluación Profunda

Fortalezas

Rigor Teórico: Proporciona pruebas matemáticas completas y análisis de complejidad
Alto Valor Práctico: Resuelve los problemas de rendimiento fundamentales de los métodos existentes
Fuerte Innovación: Primer análisis sistemático de problemas del método QM en árboles de decisión
Experimentación Suficiente: Verificación tanto en construcciones teóricas como en pruebas de escala práctica
Escritura Clara: Estructura de artículo bien organizada, descripción clara de detalles técnicos

Insuficiencias

Rango de Experimentos: Verificación principalmente en casos de prueba construidos, falta de resultados en conjuntos de datos reales
Lenguaje de Implementación: El uso de Python puede no ser la opción óptima, afectando la persuasión de comparaciones de rendimiento
Verificación de Aplicación: Falta de verificación en tareas reales de optimización del conjunto de Rashomon
Análisis de Restricciones QM: Análisis insuficiente de la alcanzabilidad práctica de restricciones de corrección del método QM

Impacto

Valor Académico: Proporciona nuevas herramientas teóricas para investigación de árboles de decisión
Significado Práctico: Puede cambiar los métodos prácticos de análisis del conjunto de Rashomon
Reproducibilidad: Descripción clara del algoritmo, fácil de reproducir
Extensibilidad: El método puede ser aplicable a otros modelos interpretables

Escenarios Aplicables

Aplicaciones de Alto Riesgo: Campos como medicina y finanzas que requieren IA explicable
Selección de Modelos: Escenarios que requieren seleccionar entre múltiples modelos equivalentes
Análisis de Importancia de Características: Aplicaciones que requieren evaluación precisa de importancia de características
Aplicaciones Industriales: Aplicaciones industriales que procesan árboles de decisión complejos

Referencias

Este artículo cita un amplio trabajo relacionado, incluyendo principalmente:

Conjunto de Rashomon: Breiman (2001), Xin et al. (2022), Fisher et al. (2019)
IA Explicable Basada en Lógica: Marques-Silva (2022), Darwiche (2023), Ignatiev et al. (2019)
Minimización de Funciones Booleanas: Quine (1952, 1955), McCluskey (1956), Umans (1998)
Optimización de Árboles de Decisión: Bertsimas & Dunn (2017), Hu et al. (2019), Demirovic et al. (2022)

Evaluación General: Este es un artículo de alta calidad que combina teoría y práctica, no solo revelando defectos fundamentales de métodos existentes sino también proporcionando soluciones prácticas. El análisis teórico del artículo es riguroso, la verificación experimental es suficiente, y realiza contribuciones importantes a los campos de árboles de decisión e IA explicable.